Поиск структуры в данных

  • 4.7
Approx. 31 hours to complete

Course Summary

Explore unsupervised learning techniques, including clustering and dimensionality reduction, to extract insights from unlabeled data.

Key Learning Points

  • Learn how to work with different unsupervised learning algorithms
  • Understand how to use clustering techniques to analyze data
  • Gain knowledge on how to reduce the dimensionality of data

Related Topics for further study


Learning Outcomes

  • Understand how to use unsupervised learning techniques to extract insights from data
  • Gain practical experience working with different algorithms
  • Develop the skills to apply unsupervised learning to real-world problems

Prerequisites or good to have knowledge before taking this course

  • Basic understanding of statistics and linear algebra
  • Familiarity with programming in Python

Course Difficulty Level

Intermediate

Course Format

  • Self-paced
  • Online

Similar Courses

  • Machine Learning: Clustering & Retrieval
  • Applied Machine Learning

Related Books

Description

В машинном обучении встречаются задачи, где нужно изучить структуру данных, найти в них скрытые взаимосвязи и закономерности. Например, нам может понадобиться описать каждого клиента банка с помощью меньшего количества переменных — для этого можно использовать методы понижения размерности, основанные на матричных разложениях. Такие методы пытаются сформировать новые признаки на основе старых, сохранив как можно больше информации в данных. Другим примером может служить задача тематического моделирования, в которой для набора текстов нужно построить модель, объясняющую процесс формирования этих текстов из небольшого количества тем.

Outline

  • Кластеризация
  • Как прекрасны машинное обучение и анализ данных
  • Как устроена специализация, и зачем ее проходить
  • Структура уроков
  • Задача кластеризации
  • Примеры задач кластеризации
  • Знакомство с методами кластеризации
  • Пример: кластеризация текстов по теме
  • Выбор метода кластеризации
  • МФТИ
  • Метод K средних (K-Means)
  • Expectation Maximization (EM-алгоритм)
  • Агломеративная иерархическая кластеризация
  • Графовые методы кластеризации
  • Методы, основанные на плотности
  • Оценка качества и рекомендации по решению задачи кластеризации
  • Блокнот из примера кластеризации текстов
  • Слайды к лекциям
  • Конспект
  • Немного о Yandex
  • МФТИ
  • Forum&Chat
  • Слайды к лекциям
  • Конспект
  • Знакомство с кластеризацией
  • Введение в кластеризацию
  • Некоторые методы кластеризации
  • Подробнее о методах кластеризации
  • Понижение размерности и матричные разложения
  • Зачем отбирать признаки?
  • Одномерный отбор признаков
  • Жадные методы отбора признаков
  • Отбор признаков на основе моделей
  • Понижение размерности
  • Метод главных компонент: постановка задачи
  • Метод главных компонент: решение
  • Матричные разложения
  • SGD и ALS
  • Прогнозирование неизвестных значений в матрице
  • Проблема отсутствия негативных примеров и implicit методы
  • Вероятностный взгляд на матричные разложения
  • Неотрицательные матричные разложения: постановка и решение
  • Неотрицательные матричные разложения: функционалы и инициализация
  • Обработка пропусков
  • Слайды к лекциям
  • Конспект
  • Слайды к лекциям
  • Конспект
  • Отбор признаков
  • Понижение размерности и отбор признаков
  • Матричные разложения
  • Неотрицательные матричные разложения
  • Визуализация и поиск аномалий
  • Задача обнаружения аномалий
  • Параметрическое восстановление плотности
  • Непараметрическое восстановление плотности
  • Одноклассовый SVM
  • Задача визуализации
  • Многомерное шкалирование
  • Метод t-SNE
  • Визуализация данных в sklearn
  • Слайды к лекциям
  • Конспект
  • Визуализация данных в sklearn
  • Слайды к лекциям
  • Конспект
  • Восстановление плотности
  • Поиск аномалий
  • Методы SNE и t-SNE
  • Визуализация
  • Тематическое моделирование
  • Введение в тематическое моделирование
  • Постановка задачи тематического моделирования
  • Базовые тематические модели и EM-алгоритм
  • Регуляризация тематических моделей
  • Мультимодальные тематические модели
  • Внутренние критерии качества тематических моделей
  • Внешние критерии качества тематических моделей
  • Визуализация тематических моделей
  • Тематические модели на практике
  • Пример использования библиотеки gensim для построения тематической модели
  • Установка BigARTM в Windows
  • Установка BigARTM в Linux Mint
  • Установка BigARTM в Mac OS-X
  • Пример использования библиотеки BigARTM для построения тематической модели
  • Слайды к лекциям
  • Конспект
  • Ноутбук из демонстрации использования gensim
  • Ноутбук из демонстрации использования BigARTM
  • Слайды к лекциям
  • Конспект
  • Финальные титры
  • Стань ментором специализации
  • Постановка задачи и базовые понятия
  • Тематическое моделирование-1
  • Критерии качества тематических моделей
  • Тематическое моделирование-2

Summary of User Reviews

Learn about unsupervised learning and how it works with this course on Coursera. Students have given positive feedback about the course content and the instructor's teaching style.

Key Aspect Users Liked About This Course

The instructor's teaching style has been praised by many users.

Pros from User Reviews

  • The course content is comprehensive and informative.
  • The instructor provides clear explanations and examples.
  • The course is well-structured and easy to follow.
  • The exercises and quizzes are helpful for reinforcing concepts.
  • The course is suitable for both beginners and advanced learners.

Cons from User Reviews

  • Some users have reported technical issues with the platform.
  • The course may move too fast for some learners.
  • The course may not provide enough hands-on practice.
  • The course may not be suitable for those looking for a more in-depth study of unsupervised learning.
  • Some users have reported that the course is too theoretical and lacks practical applications.
Russian
Available now
Approx. 31 hours to complete
Evgeniy Riabenko, Evgeny Sokolov, Victor Kantor , Emeli Dral , Константин Воронцов
Moscow Institute of Physics and Technology, Yandex, E-Learning Development Fund
Coursera

Instructor

Evgeniy Riabenko

  • 4.7 Raiting
Share
Saved Course list
Cancel
Get Course Update
Computer Courses