![[Stepik] [Елена Кантонистова, Евгений Паточенко] Практический Machine Learning.png [Stepik] [Елена Кантонистова, Евгений Паточенко] Практический Machine Learning.png](https://bitfox.info/data/attachments/18/18965-0a5ad3046636c16e8c6ed9542aebfde4.jpg)
[Stepik] Практический Machine Learning [Елена Кантонистова, Евгений Паточенко]
Чему вы научитесь
Изучите классические и современные алгоритмы машинного обучения
Повторите или освоите математические подходы, необходимые для анализа данных
О курсе
После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.
Для кого этот курс
Курс предназначен для тех, кто интересуется машинном обучением в его современном состоянии, а также не хочет ограничиваться только анализом данных.
Начальные требования
Для прохождения курса необходимы базовые знания Python и высшей математики.
Организация курса
О курсе
Инструменты
Платформа Kaggle
Глоссарий
Тест по Python
Знакомство с машинным обучением
Введение
Основные понятия машинного обучения
Типы задач в машинном обучении
Схема проекта по машинному обучению
Оценка обобщающей способности модели
Разведочный анализ данных
Домашнее задание - 1
Линейные модели регрессии
Основы линейной регрессии
Регуляризация
Практические особенности линейной регрессии
Feature engineering
Метрики качества регрессии
Домашнее задание - 2
Градиентный спуск
Градиентный спуск для функции одной переменной
Градиентный спуск в общем случае
Стохастический градиентный спуск
Домашнее задание - 3
Линейные модели классификации - 1
Переход от регрессии к классификации
Задача оценивания вероятностей, логистическая регрессия
Базовые метрики классификации
Домашнее задание - 4
Обработка признаков
Работа с пропущенными значениями
Нормализация данных
Кодирование категориальных признаков
Домашнее задание - 5
Линейные модели классификации - 2
Метод опорных векторов
Ядровой метод опорных векторов
Продвинутые (интегральные) метрики классификации
Домашнее задание - 6
Многоклассовая классификация
Многоклассовая и multilabel-классификация
Метод ближайших соседей
Быстрый поиск соседей
Домашнее задание - 7
Промежуточное тестирование
Тестирование
Базовый уровень
Средний уровень
Продвинутый уровень
Решающие деревья
Решающее дерево. Введение
Обучение решающих деревьев
Тонкости решающих деревьев
Домашнее задание - 8
Композиции решающих деревьев
Разложение ошибки на смещение и разброс
Бэггинг. Случайный лес
Бустинг. Градиентный бустинг над решающими деревьями
Домашнее задание - 9
Модификация бустинга и ускорение обучения
XGBoost
CatBoost
LightGBM
Optuna
Домашнее задание - 10
Пайплан ML-модели
Постановка задачи и разведочный анализ данных
Построение базового решения и его первые улучшения
Дальнейшие улучшения решения
Получение предсказания и интерпретация результатов
Соревнование
Снижение размерности данных
Методы отбора признаков
Метод главных компонент
Другие способы снижения размерности
Методы визуализации данных
Домашнее задание - 11
Кластеризация данных
K-means
Иерархическая кластеризация
DBSCAN, HDBSCAN
Метрики качества кластеризации
Графовая кластеризация
Домашнее задание - 12
Итоговое тестирование
Тестирование
Базовый уровень
Средний уровень
Продвинутый уровень
Финальное задание
Условие задачи
Проверка проекта (первая часть)
Проверка проекта (вторая часть)
Что дальше?
Дополнительные материалы
Онлайн-встречи
Полезные ссылки
О курсе
Инструменты
Платформа Kaggle
Глоссарий
Тест по Python
Знакомство с машинным обучением
Введение
Основные понятия машинного обучения
Типы задач в машинном обучении
Схема проекта по машинному обучению
Оценка обобщающей способности модели
Разведочный анализ данных
Домашнее задание - 1
Линейные модели регрессии
Основы линейной регрессии
Регуляризация
Практические особенности линейной регрессии
Feature engineering
Метрики качества регрессии
Домашнее задание - 2
Градиентный спуск
Градиентный спуск для функции одной переменной
Градиентный спуск в общем случае
Стохастический градиентный спуск
Домашнее задание - 3
Линейные модели классификации - 1
Переход от регрессии к классификации
Задача оценивания вероятностей, логистическая регрессия
Базовые метрики классификации
Домашнее задание - 4
Обработка признаков
Работа с пропущенными значениями
Нормализация данных
Кодирование категориальных признаков
Домашнее задание - 5
Линейные модели классификации - 2
Метод опорных векторов
Ядровой метод опорных векторов
Продвинутые (интегральные) метрики классификации
Домашнее задание - 6
Многоклассовая классификация
Многоклассовая и multilabel-классификация
Метод ближайших соседей
Быстрый поиск соседей
Домашнее задание - 7
Промежуточное тестирование
Тестирование
Базовый уровень
Средний уровень
Продвинутый уровень
Решающие деревья
Решающее дерево. Введение
Обучение решающих деревьев
Тонкости решающих деревьев
Домашнее задание - 8
Композиции решающих деревьев
Разложение ошибки на смещение и разброс
Бэггинг. Случайный лес
Бустинг. Градиентный бустинг над решающими деревьями
Домашнее задание - 9
Модификация бустинга и ускорение обучения
XGBoost
CatBoost
LightGBM
Optuna
Домашнее задание - 10
Пайплан ML-модели
Постановка задачи и разведочный анализ данных
Построение базового решения и его первые улучшения
Дальнейшие улучшения решения
Получение предсказания и интерпретация результатов
Соревнование
Снижение размерности данных
Методы отбора признаков
Метод главных компонент
Другие способы снижения размерности
Методы визуализации данных
Домашнее задание - 11
Кластеризация данных
K-means
Иерархическая кластеризация
DBSCAN, HDBSCAN
Метрики качества кластеризации
Графовая кластеризация
Домашнее задание - 12
Итоговое тестирование
Тестирование
Базовый уровень
Средний уровень
Продвинутый уровень
Финальное задание
Условие задачи
Проверка проекта (первая часть)
Проверка проекта (вторая часть)
Что дальше?
Дополнительные материалы
Онлайн-встречи
Полезные ссылки
Стоимость: 3900 руб.
Продажник
Скрытое содержимое могут видеть только пользователи групп(ы): Зарегистрированный
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.
Последнее редактирование: