Специалист по работе с искусственным интеллектом
Программа предназначена для тех, кто хочет овладеть современными инструментами анализа данных, построения моделей машинного обучения и автоматизации AI‑процессов. Занятия проходят в формате один на один с опытным преподавателем, что позволяет двигаться в индивидуальном темпе и разбирать материал на уровне, необходимом именно вам.
Программа соответствует требованиям ФГОС СПО 09.02.13 «Интеграция решений с применением технологий искусственного интеллекта» и разработана с учётом положений профессионального стандарта 06.041 «Специалист по большим данным».
Объём программы составляет 256 академических часов
▪ 160 часов отводится на занятия с преподавателем — разбор теории, демонстрации, практика и сопровождение
▪ 96 часов выделено на самостоятельную проработку тем и выполнение проектных заданий
Документ по окончании
📜 Диплом о профессиональной переподготовке — при наличии среднего профессионального или высшего образования
📜 Сертификат о прохождении курса — при несоответствии требуемому уровню образования
Содержание
- 4 модуля
- 160 уроков
- 160 часов
- Модуль 1. Автоматизация пайплайнов и подготовки данных на Python40
- 1.1Введение в Python и установка среды разработки
- 1.2Практическая работа №1. Установка Python и запуск первой программы
- 1.3Переменные и типы данных
- 1.4Практическая работа №2. Работа с переменными и типами данных
- 1.5Операторы в Python
- 1.6Практическая работа №3. Вычисления и логические операции в Python
- 1.7Практическая работа №4. Программы с условными операторами
- 1.8Условные конструкции
- 1.9Циклы в Python
- 1.10Практическая работа №5. Написание циклических программ
- 1.11Структуры данных: списки, кортежи, множества, словари
- 1.12Практическая работа №6. Обработка строк
- 1.13Списки и кортежи
- 1.14Практическая работа №7. Работа со списками
- 1.15Словари и множества
- 1.16Практическая работа №8. Использование словарей
- 1.17Генераторы списков, тернарный оператор
- 1.18Практическая работа №9. Оптимизация кода с генераторами и lambda функциями
- 1.19Итоговые задания по структурам данных
- 1.20Функции в Python: основы
- 1.21Практическая работа №10. Задачи на работу со структурами данных
- 1.22Практическая работа №11. Создание пользовательских функций
- 1.23Передача аргументов, *args, **kwargs
- 1.24Практическая работа №12. Работа с *args и **kwargs в пользовательских функциях
- 1.25Рекурсия в Python
- 1.26Практическая работа №13. Реализация рекурсивных алгоритмов
- 1.27Генераторы и итераторы
- 1.28Практическая работа №14. Написание собственных генераторов данных
- 1.29Работа с файлами: чтение и запись
- 1.30Практическая работа №15. Работа с файлами: чтение и запись данных
- 1.31Работа с CSV и JSON файлами
- 1.32Практическая работа №16. Чтение и запись данных в CSV и JSON
- 1.33Обработка ошибок и исключения
- 1.34Практическая работа №17. Обработка ошибок в пользовательских программах
- 1.35Работа с регулярными выражениями (re)
- 1.36Практическая работа №18. Поиск и замена данных с использованием регулярных выражений
- 1.37Основы ООП в Python
- 1.38Практическая работа №19. Создание классов и объектов
- 1.39Наследование, инкапсуляция и полиморфизм
- 1.40Практическая работа №20. Реализация наследования и полиморфизма в Python
- Модуль 2. Анализ данных на Python40
- 2.1Введение в анализ данных и инструменты
- 2.2Практическая работа №1. Установка Pandas и NumPy, создание первых объектов
- 2.3Основы работы с NumPy
- 2.4Практическая работа №2. Операции с массивами NumPy
- 2.5Основы работы с Pandas
- 2.6Практическая работа №3. Создание и модификация DataFrame
- 2.7Чтение и запись CSV-файлов
- 2.8Практическая работа №4. Чтение и запись данных в CSV
- 2.9Работа с Excel-файлами
- 2.10Практическая работа №5. Обработка Excel-файлов в Pandas
- 2.11Подключение к базам данных (SQLAlchemy)
- 2.12Практическая работа №6. Подключение к базе и выполнение SQL-запросов в Pandas
- 2.13Фильтрация данных в Pandas
- 2.14Практическая работа №7. Фильтрация данных в DataFrame
- 2.15Группировка данных и агрегация
- 2.16Практическая работа №8. Группировка и агрегация данных
- 2.17Сводные таблицы (Pivot Table)
- 2.18Практическая работа №9. Создание сводной таблицы для анализа данных
- 2.19Объединение и слияние данных
- 2.20Практическая работа №10. Слияние и объединение нескольких таблиц
- 2.21Работа с временными рядами
- 2.22Практическая работа №11. Работа с датами и временными рядами
- 2.23Декомпозиция временных рядов
- 2.24Практическая работа №12. Анализ трендов временного ряда
- 2.25Визуализация данных
- 2.26Практическая работа №13. Визуализация данных с Matplotlib и Seaborn
- 2.27Обнаружение и обработка пропущенных данных
- 2.28Практическая работа №14. Обработка пропущенных данных в DataFrame
- 2.29Работа с выбросами и аномалиями
- 2.30Практическая работа №15. Поиск и устранение выбросов в данных
- 2.31Кодирование категориальных переменных
- 2.32Практическая работа №16. Кодирование категориальных данных
- 2.33Нормализация и стандартизация данных
- 2.34Практическая работа №17. Нормализация данных для анализа
- 2.35Оптимизация работы с большими таблицами
- 2.36Практическая работа №18. Оптимизация работы с большими наборами данных
- 2.37Автоматизация анализа данных
- 2.38Практическая работа №19. Автоматизация отчетов в Pandas
- 2.39Итоговый проект по анализу данных
- 2.40Практическая работа №20. Финальный проект по анализу данных
- Модуль 3. Машинное обучение на Python40
- 3.1Основные концепции машинного обучения
- 3.2Практическая работа №1. Настройка окружения и работа с датасетом
- 3.3Основные библиотеки и инструменты для машинного обучения
- 3.4Практическая работа №2. Загрузка и исследование датасета (EDA)
- 3.5Разделение данных на обучающую и тестовую выборки
- 3.6Практическая работа №3. Разделение данных и проверка их качества
- 3.7Работа с пропущенными значениямиКопировать
- 3.8Практическая работа №4. Обработка пропущенных значений в датасете
- 3.9Кодирование категориальных признаков
- 3.10Практическая работа №5. Кодирование категориальных признаков
- 3.11Масштабирование данных
- 3.12Практическая работа №6. Масштабирование признаков для машинного обучения
- 3.13Выбор важных признаков (Feature Selection)
- 3.14Практическая работа №7. Автоматический отбор признаков
- 3.15Введение в методы классификации
- 3.16Практическая работа №8. Реализация простого классификатора
- 3.17Линейные модели: Логистическая регрессия
- 3.18Практическая работа №9. Обучение логистической регрессии на реальных данных
- 3.19Деревья решений в классификации
- 3.20Практическая работа №10. Классификация с использованием деревьев решений
- 3.21Ансамбли моделей: Random Forest и градиентный бустинг
- 3.22Практическая работа №11. Использование ансамблевых методов для улучшения классификации
- 3.23Методы регрессии: Линейная и полиномиальная регрессия
- 3.24Практическая работа №12. Моделирование зависимости с помощью линейной регрессии
- 3.25Введение в кластеризацию данных
- 3.26Практическая работа №13. Кластеризация данных с использованием KMeans
- 3.27Снижение размерности с PCA (Principal Component Analysis)
- 3.28Практическая работа №14. Применение PCA для снижения размерности данных
- 3.29DBSCAN и агломеративная кластеризация
- 3.30Практическая работа №15. Кластеризация данных с DBSCAN
- 3.31Оценка качества модели: метрики и кросс-валидация
- 3.32Практическая работа №16. Оценка модели классификации
- 3.33Балансировка классов в данных
- 3.34Практическая работа №17. Балансировка данных перед обучением модели
- 3.35Подбор гиперпараметров моделей
- 3.36Практическая работа №18. Автоматический подбор параметров для улучшения модели
- 3.37Интерпретируемость моделей и SHAP
- 3.38Практическая работа №19. Анализ важности признаков с SHAP
- 3.39Итоговый проект по машинному обучению
- 3.40Практическая работа №20. Финальный проект по машинному обучению
- Модуль 4. Автоматизация пайплайнов и подготовки данных на Python40
- 4.1Введение в ETL-процессы
- 4.2Практическая работа №1. Создание базового ETL-скрипта для обработки данных
- 4.3Извлечение данных из различных источников
- 4.4Практическая работа №2. Извлечение данных из различных источников и сохранение в базу
- 4.5Трансформация данных в ETL-процессах
- 4.6Практическая работа №3. Автоматическая очистка данных в ETL-пайплайне
- 4.7Загрузка данных в базы и хранилища
- 4.8Практическая работа №4. Автоматическая загрузка данных в базу данных
- 4.9Автоматическая очистка и нормализация данных
- 4.10Практическая работа №5. Создание модуля очистки данных
- 4.11Автоматизация работы с большими объемами данных
- 4.12Практическая работа №6. Обработка большого объема данных с Dask
- 4.13Управление метаданными и мониторинг ETL-процессов
- 4.14Практическая работа №7. Настройка логирования и мониторинга ETL-процесса
- 4.15Распределенная обработка данных
- 4.16Практическая работа №8. Реализация распределенной обработки данных с Apache Spark
- 4.17Введение в потоковую обработку данных
- 4.18Практическая работа №9. Создание простого потокового процессора на Python
- 4.19Использование Apache Kafka для потоковой обработки
- 4.20Практическая работа №10. Потоковая обработка данных с Apache Kafka
- 4.21Реализация потоковой аналитики с Apache Spark
- 4.22Практическая работа №11. Обработка потоковых данных с Apache Spark
- 4.23Автоматизация потоковых ETL-процессов
- 4.24Практическая работа №12. Автоматизация потокового ETL-пайплайна
- 4.25Введение в Apache Airflow
- 4.26Практическая работа №13. Установка Airflow и запуск первого DAG
- 4.27Автоматизация ETL с использованием Airflow
- 4.28Практическая работа №14. Разработка ETL-процесса в Airflow
- 4.29Интеграция Airflow с внешними сервисами
- 4.30Практическая работа №15. Подключение Airflow к базе данных и API
- 4.31Оптимизация работы пайплайнов в Airflow
- 4.32Практическая работа №16. Оптимизация работы DAG в Airflow
- 4.33Автоматизация подготовки данных для машинного обучения
- 4.34Практическая работа №17. Автоматизация предобработки данных в ML-пайплайне
- 4.35Автоматизация обучения моделей
- 4.36Практическая работа №18. Автоматический подбор модели и её обучение
- 4.37CI/CD для моделей машинного обучения
- 4.38Практическая работа №19. Настройка CI/CD для ML-моделей
- 4.39Итоговый проект по автоматизации пайплайнов
- 4.40Практическая работа №20. Финальный проект по автоматизации данных
Требования
- Уверенное владение ПК
- Наличие гарнитуры и стабильного интернета
- Установленная среда разработки (рекомендации по установке даются в начале курса)
Особенности
- Обучение без воды – только актуальные знания, которые применяются в реальных задачах
- Полноценная практика – каждую тему сопровождают практические задания
- Работа с преподавателем – разбор ошибок и помощь
- Выбор формата обучения – персональный
- Выдача документа – удостоверение о повышении квалификации или сертификат о прохождении курса
Целевая аудитория
- Начинающие аналитики данных
- Python‑разработчики, изучающие ML
- Специалисты по ИИ и Data Science
- Студенты и выпускники технических направлений
- Все, кто хочет освоить машинное обучение в практике