Курс помогает овладеть мощными инструментами анализа данных на Python. Вы научитесь загружать данные из CSV, Excel и баз данных, обрабатывать их с помощью Pandas и NumPy, строить сводные таблицы, работать с временными рядами, выявлять аномалии и автоматизировать анализ больших массивов. Особое внимание уделяется оптимизации работы с данными и визуальному представлению результатов.
Индивидуальный формат позволяет адаптировать темп и глубину изучения под вашу задачу: будь то аналитика, отчётность, исследование данных или подготовка к Data Science.
Документ по окончании
📜 Удостоверение о повышении квалификации – для слушателей с высшим или средним профессиональным образованием.
📜 Сертификат о прохождении обучения – для всех остальных участников.
Содержание
- 5 модуля
- 40 уроков
- 40 часов
- Блок 1. Основы Pandas и NumPy6
- 1.1Введение в анализ данных и инструменты
- 1.2Практическая работа №1. Установка Pandas и NumPy, создание первых объектов
- 1.3Основы работы с NumPy
- 1.4Практическая работа №2. Операции с массивами NumPy
- 1.5Основы работы с Pandas
- 1.6Практическая работа №3. Создание и модификация DataFrame
- Блок 2. Чтение и запись данных (CSV, Excel, SQL)6
- 2.1Чтение и запись CSV-файлов
- 2.2Практическая работа №4. Чтение и запись данных в CSV
- 2.3Работа с Excel-файлами
- 2.4Практическая работа №5. Обработка Excel-файлов в Pandas
- 2.5Подключение к базам данных (SQLAlchemy)
- 2.6Практическая работа №6. Подключение к базе и выполнение SQL-запросов в Pandas
- Блок 3. Фильтрация, группировка, агрегация8
- 3.1Фильтрация данных в Pandas
- 3.2Практическая работа №7. Фильтрация данных в DataFrame
- 3.3Группировка данных и агрегация
- 3.4Практическая работа №8. Группировка и агрегация данных
- 3.5Сводные таблицы (Pivot Table)
- 3.6Практическая работа №9. Создание сводной таблицы для анализа данных
- 3.7Объединение и слияние данных
- 3.8Практическая работа №10. Слияние и объединение нескольких таблиц
- Блок 4. Временные ряды и анализ данных6
- 4.1Работа с временными рядами
- 4.2Практическая работа №11. Работа с датами и временными рядами
- 4.3Декомпозиция временных рядов
- 4.4Практическая работа №12. Анализ трендов временного ряда
- 4.5Визуализация данных
- 4.6Практическая работа №13. Визуализация данных с Matplotlib и Seaborn
- Блок 5. Работа с пропущенными данными14
- 5.1Обнаружение и обработка пропущенных данных
- 5.2Практическая работа №14. Обработка пропущенных данных в DataFrame
- 5.3Работа с выбросами и аномалиями
- 5.4Практическая работа №15. Поиск и устранение выбросов в данных
- 5.5Кодирование категориальных переменных
- 5.6Практическая работа №16. Кодирование категориальных данных
- 5.7Нормализация и стандартизация данных
- 5.8Практическая работа №17. Нормализация данных для анализа
- 5.9Оптимизация работы с большими таблицами
- 5.10Практическая работа №18. Оптимизация работы с большими наборами данных
- 5.11Автоматизация анализа данных
- 5.12Практическая работа №19. Автоматизация отчетов в Pandas
- 5.13Итоговый проект по анализу данных
- 5.14Практическая работа №20. Финальный проект по анализу данных
Да, преподаватель поможет адаптировать курс под ваш кейс.
Да, мы используем Matplotlib и Seaborn для графиков, а также рассмотрим автоматизацию отчётности.
Достаточно уверенного владения Python. Всё остальное разберём по ходу курса.
Требования
- Базовые знания Python
- Установленная среда разработки (рекомендации даются в начале курса)
Особенности
- Индивидуальный подход — занятия проходят в формате «один на один»
- Работа с реальными данными — обучаем на ваших или отраслевых кейсах
- Полный стек анализа — от чтения и очистки до визуализации и автоматизации
- Оптимизация под большие объёмы — используем эффективные практики работы с данными
- Автоматизация отчётов: экспорт итогов анализа в PDF, Excel, базы данных, скрипты для регулярного запуска.
Целевая аудитория
- Аналитики и специалисты по отчётности
- Разработчики, работающие с данными
- Начинающие дата-сайентисты
- Менеджеры, которым важно понимать работу с таблицами и метриками