Основы анализа данных и машинного обучения

Основы анализа данных и машинного обучения
72
Академических часов
28
Выпускников
4.6
Средняя оценка курса обучающимися

Руководитель программы:

Подразделение:

Год:

2025

Описание программы:

Цель программы:
Формирование компетенции цифровой экономики «Способность эффективно применять современные методы и средства анализа данных и машинного обучения для решения прикладных задач» у квалифицированных специалистов различных областей экономики.

Разделы курса:

Основы языка программирования Python для анализа данных.

Язык программирования Python. Переменные, операции, выражения.
Целые, действительные числа. Условия, циклы. Строки. Списки.
Словари. Описание функций, создание и использование классов.
Отладка программ. Использование интерактивных блокнотов Jupiter Notebooks.
Работа с наборами данных и визуализация.
Библиотека NumPy. Операции с векторами и матрицами. Библиотека
Pandas. Операции с наборами данных. Загрузка и обработка данных.
Конструирование признаков. Фильтрация и сортировка данных.
Визуализация данных, основные виды графиков и диаграмм.
Библиотеки Matplotlib, Seaborn.

Базовые задачи и методы машинного обучения.

Анализ данных и машинное обучение. Обучение с учителем, без учителя, с подкреплением. Основные задачи машинного обучения.
Принципы оценки качества моделей машинного обучения.
Задача регрессии, основные методы и оценка качества моделей.
Линейная и полиномиальная регрессия. Функции ошибок.
Регуляризация.
Задача классификации, базовые методы, оценка качества. Метод к
ближайших соседей. Логистическая регрессия. Решающие деревья.
Ансамблевые методы.
Задача кластеризации, основные методы и оценка качества Метод ксредних. Метод DBSCAN.

Современные нейросетевые архитектуры.

Нейронные сети. Классификация и регрессия с помощью многослойного персептрона. Нейросетевые методы обработки текстов. Мультимодальные модели.

Автоматизация сбора данных и доступа к моделям машинного обучения.

Анализ данных и машинное обучение. Обучение с учителем, без учителя, с подкреплением. Основные задачи машинного обучения. Принципы оценки качества моделей машинного обучения. Библиотека SkLearn.
Задача регрессии, основные методы и оценка качества моделей Задача регрессии. Линейная и полиномиальная регрессия. Функции ошибок. Переобучение и регуляризация.
Задача классификации. Метрики качества классификации. Метод к ближайших соседей. Логистическая регрессия. Метод опорных векторов.
Решающие деревья. Ансамблевые методы. Случайный лес. Градиентный бустинг. Подбор оптимальных гиперпараметров. Задача кластеризации. Метрики кластеризации. Метод к-средних. Метод DBSCAN. Метод t-SNE. Методы прогнозирования временных рядов.