Основы анализа данных и машинного обучения
Руководитель программы:
—
Подразделение:
—
Год:
2025
Описание программы:
Цель программы:
Формирование компетенции цифровой экономики «Способность эффективно применять современные методы и средства анализа данных и машинного обучения для решения прикладных задач» у квалифицированных специалистов различных областей экономики.
Разделы курса:
Основы языка программирования Python для анализа данных.
Язык программирования Python. Переменные, операции, выражения.
Целые, действительные числа. Условия, циклы. Строки. Списки.
Словари. Описание функций, создание и использование классов.
Отладка программ. Использование интерактивных блокнотов Jupiter Notebooks.
Работа с наборами данных и визуализация.
Библиотека NumPy. Операции с векторами и матрицами. Библиотека
Pandas. Операции с наборами данных. Загрузка и обработка данных.
Конструирование признаков. Фильтрация и сортировка данных.
Визуализация данных, основные виды графиков и диаграмм.
Библиотеки Matplotlib, Seaborn.
Базовые задачи и методы машинного обучения.
Анализ данных и машинное обучение. Обучение с учителем, без учителя, с подкреплением. Основные задачи машинного обучения.
Принципы оценки качества моделей машинного обучения.
Задача регрессии, основные методы и оценка качества моделей.
Линейная и полиномиальная регрессия. Функции ошибок.
Регуляризация.
Задача классификации, базовые методы, оценка качества. Метод к
ближайших соседей. Логистическая регрессия. Решающие деревья.
Ансамблевые методы.
Задача кластеризации, основные методы и оценка качества Метод ксредних. Метод DBSCAN.
Современные нейросетевые архитектуры.
Нейронные сети. Классификация и регрессия с помощью многослойного персептрона. Нейросетевые методы обработки текстов. Мультимодальные модели.
Автоматизация сбора данных и доступа к моделям машинного обучения.
Анализ данных и машинное обучение. Обучение с учителем, без учителя, с подкреплением. Основные задачи машинного обучения. Принципы оценки качества моделей машинного обучения. Библиотека SkLearn.
Задача регрессии, основные методы и оценка качества моделей Задача регрессии. Линейная и полиномиальная регрессия. Функции ошибок. Переобучение и регуляризация.
Задача классификации. Метрики качества классификации. Метод к ближайших соседей. Логистическая регрессия. Метод опорных векторов.
Решающие деревья. Ансамблевые методы. Случайный лес. Градиентный бустинг. Подбор оптимальных гиперпараметров. Задача кластеризации. Метрики кластеризации. Метод к-средних. Метод DBSCAN. Метод t-SNE. Методы прогнозирования временных рядов.