Профессия
о курсе
Data Scientist — это специалист, который занимается анализом и интерпретацией больших объемов данных, а также созданием моделей и разработкой алгоритмов для оптимизации бизнес-процессов и принятия стратегических решений.
почему тгу
Лидируем в области онлайн-обучения и дополнительного образования более 25 лет
-
4,8/5
средняя оценка курсов
-
1,5
млн слушателей видеолекций
-
97%
нашли работу во время обучения
-
100 000
выпускников онлайн-курсов
После обучения вы получите
-
Hard skills
Научитесь работать с данными из открытых источников с помощью различных библиотек языка Python (BeautifulSoap, Scrapy, Selenium, Requests), писать запросы на PostgreSQL, а также строить алгоритмы классического машинного обучения.
-
Диплом о профессиональной переподготовке
Диплом подтвердит ваши новые знания и навыки, а также поможет в продвижении по карьерной лестнице, при поиске новой работы или повышении зарплаты.
-
Итоговый проект
Решение кейса на реальных данных — поможет не только закрепить знания, но и продемонстрировать навыки и потенциал в данной области.
для кого курс
-
Для тех, у кого нет опыта в сфере аналитики
Курс подойдет новичкам в аналитике и работе с данными. Материалы курсов понятны каждому — кто только знакомится с профессией или продолжает обучение.
-
Для опытных специалистов
Если вы уже работаете в сфере анализа данных, курс поможет расширить арсенал инструментов и приобрести новые навыки в этой области.
-
Для специалистов из разных областей
Курс будет полезен специалистам из различных областей, желающим расширить свои знания в области аналитики данных или перейти в эту область.
обучение подойдет тем, кто хочет
-
Получить востребованную специальность
По данным аналитического сервиса РосНавык, за последний год было опубликовано более 90 000 вакансий, в которых требовался специалист по анализу данных или по машинному обучению.
-
Расширить навыки
Сможете проводить полный цикл анализа данных от поиска до построения алгоритмов машинного обучения, а также научитесь работать с языками Python и PostgreSQL.
-
Увеличить доход
Медианная заработная плата в данной области по данным сервиса РосНавык — 140 000 рублей.
3 бесплатных пробных урока по программе Введение в Data Science
Получите доступ к урокам бесплатно до старта курса! Вы сможете определиться, подходит ли вам данная специальность.
программа курса
-
336
часов
-
8
разделов
-
2
тематических блока
-
Модуль 1. Основы Python для анализа данных
Раздел 1.Основы Python
Тема 1. Переменные Python
- Понятие переменная
- Типы данных в Python
- Числа
- Строки
Тема 2. Структуры данных. Цикл for
- Списки
- Цикл for Вложенные списки
- Словари
- Список словарей
- Кортежи
- Множества
- Файлы
- Файлы: csv и json
Тема 3. Условия и цикл while
- Условные конструкции
- Логические выражения и операторы сравнения
- Цикл while
Тема 4. Функции
- Понятие функции, синтаксис
- Параметры и аргументы функции
- Локальные и глобальные переменные, анонимные функции
Тема 5. Основные библиотеки для анализа данных
- Работа с библиотеками и модулями
- Требования к коду
- Библиотека re
-
Модуль 2. Основы анализа данных
Раздел 1. Поиск аналитических данных
Тема 1. Методологии Data Mining
- Этапы работы
- Данные
- Важные моменты и результат
Тема 2. Работа с данными
- «Правильные данные»
- Какие бывают данные?
- Бизнес-цели, требования к данным
- Источники данных
Тема 3. Методы и инструменты анализа
- Методы и инструменты для анализа данных
- Какие навыки для этого необходимы
Раздел 2. Сбор аналитических данных
Тема 1. Сбор данных из открытых источников
- Понятие API
- Немного о REST и SOAP API
- Краткий обзор HTTP
- Знакомство с requests на примере API GitHub
- Знакомство с API Кинопоиска и библиотекой JSON
- Знакомство с API Headhunter и библиотекой CSV
Тема 2. Парсинг данных
- Знакомство с парсингом
- Законность парсинга
- HTML. CSS. XPath
- Библиотека BeautifulSoup
- Библиотека Selenium
- Панель разработчика
- Фреймворк Scrapy
Тема 3. Оценка качества данных
- Оценка качества данных
Раздел 3. Чистка и предобработка данных
Тема 1. Типичные проблемы данных в датасетах
- Data Cleaning. Этапы очистки данных
Тема 2. Библиотека Pandas
- Подгрузка и обзор датасета
- Объекты и типы данных в Pandas
Тема 3. Работа с дубликатами, пропусками, вложенными структурами
- Понятие признак, пропуск, дубликат
- Работа с JSON-форматом
- Обработка полных дубликатов
Тема 4. Преобразование данных
- Кодирование и декодирование информации
- Модуль datetime. Метод astype()
- Преобразование в формат целого числа, числа с плавающей точкой
Тема 5. Работа с текстовыми данными
- Методы Pandas для работы с текстовыми данными
- Метод explode()
- Проверка результатов очистки данных
Раздел 4. Разведочный анализ данных
Тема 1. Основы работы с данными
- Введение в разведочный анализ данных
- Подгрузка данных в среду (знакомство с DataFrame)
- Оценка размеров датасета, наличия пропусков
Тема 2. Анализ числовых данных
- Неграфический анализ (медиана, квартили, среднее)
- Анализ выбросов
- Графический анализ: box-plot, гистограмма
Тема 3. Анализ категориальных данных
- Неграфический анализ (мода, количество уникальных значений)
- Графический анализ: круговая диаграмма, столбчатая диаграмма
Тема 4. Анализ взаимосвязи колонок
- Графический анализ взаимосвязи двух числовых переменных
- Анализ взаимосвязи двух категориальных переменных
- Анализ взаимосвязи категориальной и числовой переменных
Тема 5. Фильтрация, группировка, параметры визуализации
- Стили и общие параметры визуализации
Раздел 5. Статистический анализ данных
Тема 1. Введение в статистику
- Типы данных и шкалы
- Оценивание параметров
- Числовые характеристики выборки
- Проверка статистических гипотез
- Алгоритм
- Критерий согласия Пирсона
- P-value
Тема 2. Критерии сравнения групп
- Общая постановка задачи
- Параметрические и непараметрические критерии сравнения групп
Тема 3. Корреляционный анализ
- Введение в корреляционный анализ
- Количественная корреляция
- Парный коэффициент корреляции Пирсона
- Ранговая корреляция
- Корреляционный анализ категоризованных данных
Тема 4. Регрессионный анализ
- Введение в регрессионный анализ
- Модель парной регрессии
- Оценка параметров
- Проверка качества уравнения парной регрессии
- Множественная регрессия
Раздел 6. Алгоритмы классического машинного обучения
Тема 1. Введение
- Типы данных и их свойства
- Введение в ML
Тема 2. Продвинутый регрессионный анализ
- Введение в продвинутый регрессионный анализ
- Нелинейные модели регрессии
- Линеаризация
- Оценка параметров линейной модели регрессии
- Проверка качества моделей
- Деревья регрессии
- Оценка параметров модели регрессии
- Проверка качества моделей регрессии
- Прогнозирование целевого показателя
- Полиноминальная модель регрессии
- Проблемы регрессионных моделей в машинном обучении: недообучение, переобучение
- Дерево принятия решений
Тема 3. Классификация
- Введение в классификацию
- Логистическая регрессия
- Оценка качества алгоритма бинарной классификации
- Алгоритм логистической регрессии
- Дерево принятия решений
- Наивный Байесовский классификатор
- Метод опорных векторов
- Метод K-ближайших соседей
- Оценка качества алгоритма многоклассовой классификации
- Оценка качества алгоритма бинарной классификации
Тема 4. Кластеризация
- Введение в кластеризацию
- Меры расстояния
- Методы объединения
- Иерархическая кластеризация
- Метод К-средних
Раздел 7. SQL для работы с базами данных в PostgreSQL
Тема 1. Введение в базы данных
- Понятие база данных
- Классификация, разные виды баз данных
- Компоненты базы данных
- Таблицы, колонки, строки данных, ключи таблиц
Тема 2. Написание SELECT запросов
- Структура SELECT запроса
- Порядок написания команд
- Операторы AS, WHERE, IN, NOT IN, LIKE, NOT LIKE, CASE, ORDER BY, DISTINCT
Тема 3. Функции агрегации
- Операторы GROUP BY, HAVING. Функции COUNT, AVG, SUM, MIN, MAX
Тема 4. Подзапросы и табличные выражения
- Применение подзапросов для фильтрации, для поэтапного преобразования данных
- CTE (табличные выражения), синтаксис WITH cte_name AS (), применение нескольких табличных выражений
Тема 5. Отношения таблиц
- LEFT JOIN, RIGHT JOIN, INNER JOIN, FULL JOIN, CROSS JOIN
Тема 6. Работа с таблицами, запись данных
- CREATE TABLE, ALTER TABLE, DROP TABLE, TRUNCATE TABLE, INSERT INTO
Тема 7. Работа с базами данных из Python
- Обзор библиотек (sqlalchemy, psycopg2, ipython-sql)
- Синтаксис подключения к базе данных
Тема 8. Оконные функции
- Оконные функции агрегации, ранжирования, смещения
- Создание фрейма с помощью ROWS, GROUPS, RANGE
преподаватели курса
По завершении 6 месяцев обучения вы получите диплом ТГУ о профессиональной переподготовке установленного образца
- Команда сопровождения поддержит вас в обучении. После обучения поможем оформить резюме, а лучших студентов рекомендуем на работу.
- За короткое время пройдете материал, делая акцент на самом основном и достигните высоких результатов. Быстрее освоите материал, улучшите самодисциплину и научитесь эффективно и продуктивно работать в сжатые сроки.
резюме после обучения
Должность после обучения
Data-scientist
навыки
- Программирование на Python, работа со структурами данных, файлами (CSV, JSON), функциями и условными конструкциями
- Сбор и анализ данных: из открытых источников с использованием API и библиотек Python
- Статистический анализ, проверка гипотез и корреляционный анализ
- Применение алгоритмов классического машинного обучения
- Управление базами данных на языке PostgreSQL
- Визуализация и представление данных (box-plot, гистограммы, диаграммы)
- Оценка качества данных и их предварительная очистка
инструменты
Зарплата
Data-scientist
По данным hh.ru
-
60 000-80 000 р.
опыт работы до 1 года
-
80 000-200 000 р.
опыт работы от 1 до 3-х лет
-
>200 000 р.
опыт работы от 3-х лет
стоимость обучения
96 000р.
120 000р.
- 6 месяцев обучения
- Рассрочка на 3 платежа по 32 000р.
- Верните 13% стоимости обучения — 12 480р.
часто задаваемые вопросы
-
Могу ли я получить диплом о профессиональной переподготовке, если у меня нет высшего образования?
Для получения диплома о профессиональной подготовке вам потребуется наличие законченного высшего или среднего специального образования.
Если у вас нет высшего образования, рекомендуем рассмотреть курсы в формате видеолекций. Вы сможете прослушать их и получить сертификат по завершении. -
Смогу ли я совмещать прохождение курса с работой или учебой?
Да. Формат обучения специально построен так, чтобы вы могли совмещать прохождение курсов с работой или учебой, занимаясь в удобное для вас время.
-
Могу ли я смотреть курс в записи?
Все материалы программы доступны в записи и размещены на электронной обучающей платформе, поэтому вы можете выстраивать график обучения самостоятельно. Вы можете пройти обучение в удобном для вас режиме.
-
Какая форма оплаты курса? Могу ли я оплатить курс частями?
Да, вы можете оплатить весь курс сразу или частями. ИДО ТГУ предоставляет рассрочку оплаты за программы обучения, которая будет согласована и указана при оформлении договора.
-
Мне не пришло письмо со ссылкой на регистрацию после оплаты, что делать?
Если вы не получили письмо после успешной оплаты, в первую очередь, проверьте, не ушло ли оно в папку спам. Если там ничего нет, свяжитесь с нами по номеру 8 (3822) 785-680.
-
У меня возникли проблемы при оплате курса, куда мне можно обратиться?
Если возникли какие-либо трудности с оплатой, не переживайте и просто свяжитесь с нами — мы разберемся в проблеме и обязательно поможем! Для этого позвоните в наш колл-центр по номеру 8 (3822) 785-680.
-
Если мне не понравится, я смогу вернуть деньги?
Да, если после начала курса вы решите, что он не подходит вам, вы сможете отказаться от обучения и получить деньги обратно за неиспользованную часть курса.
-
Здесь нет ответа на мой вопрос.
Задайте ваш вопрос, позвонив в колл-центр по номеру 8 (3822) 785-680. Не стесняйтесь, мы всегда рады помочь!
Нужна помощь с выбором программы? Мы с радостью ответим на все ваши вопросы
Для обучения обязательно наличие среднего специального или высшего образования