Анализ данных и машинное обучение
Руководитель программы:
Шухман Александр Евгеньевич, к.п.н., доцент, заведующий кафедрой МЦТ
Подразделение:
—
Год:
2025
Описание программы:
Целью подготовки слушателей по Программе является получение обучающимися по специальностям и направлениям подготовки, не отнесенным к ИТ-сфере, компетенции, необходимой для выполнения нового
вида профессиональной деятельности в области информационных технологий «Анализ данных и машинное обучение»; приобретение новой квалификации «Аналитик данных»
Разделы курса:
Язык программирования Python
Язык программирования Python. Переменные, операции, выражения.
Целые, действительные числа. Условия, циклы. Строки. Списки.
Словари. Описание функций, создание и использование классов.
Отладка программ. Использование интерактивных блокнотов Jupiter Notebooks.
Работа с наборами данных и визуализация.
Библиотека NumPy. Операции с векторами и матрицами. Библиотека
Pandas. Операции с наборами данных. Загрузка и обработка данных.
Конструирование признаков. Фильтрация и сортировка данных.
Визуализация данных, основные виды графиков и диаграмм.
Библиотеки Matplotlib, Seaborn.
Статистический анализ данных
Введение в статистику и работа с данными. Генеральная совокупность и выборка. Частоты. Распределения. Описательные статистики: меры центральной тенденции и разброса. Z-распределение и его свойства. Корреляция. Визуализация данных.
Кластерный анализ. Введение в статистику выводов: постановка гипотез. Применение параметрических критериев.
Непараметрические тесты. Методы сокращения размерности.
Интеллектуальный анализ данных и визуализация
Цели и задачи ИАД. Этапы анализа данных. Модель CRISP. Модель
SEMMA. Инструменты ИАД: Excel, BI-системы, языки программирования для анализа данных, аналитические low-code платформы.
Обработка и анализ данных в Yandex DataLens. Подключение
данных. Типы данных. Модель данных, настройки датасета.
Объединение данных. Чарт. Дашбоард. Селекторы. Вычисляемые
поля, синтаксис формул. Агрегатные функции. Оконные функции.
LOD-выражения и управление фильтрацией в агрегатных функциях.
Работа с правами доступа
Моделирование данных в Loginom. Интеграция с источниками
данных. Предобработка и консолидация данных. Разведочный
анализ. Визуализаторы общего назначения. Сложные визуализаторы
общего назначения. OLAP-анализ. Географические карты. Тепловые карты. Плоское дерево. Диаграмма связей. Облако тегов. OLAP-кубы в Loginom. Моделирование и прогнозирование. Развертывание и интеграция.
Технологии машинного обучения
Анализ данных и машинное обучение. Обучение с учителем, без
учителя, с подкреплением. Основные задачи машинного обучения.
Принципы оценки качества моделей машинного обучения.
Задача регрессии, основные методы и оценка качества моделей.
Линейная и полиномиальная регрессия. Функции ошибок.
Регуляризация.
Задача классификации, базовые методы, оценка качества. Метод к
ближайших соседей. Логистическая регрессия. Решающие деревья.
Ансамблевые методы.
Задача кластеризации, основные методы и оценка качества Метод ксредних. Метод DBSCAN.
Нейронные сети. Классификация и регрессия с помощью многослойного персептрона. Нейросетевые методы обработки текстов. Мультимодальные модели.
Кадровое обеспечение:
Шухман Александр Евгеньевич, к.п.н., доцент, заведующий кафедрой МЦТ