Открыто

Основы Data Science [2021] [it-academy] [Роман Сидоренко]

Тема в разделе "Курсы по программированию", создана пользователем Toxich, 7 май 2021.

Цена: 87901р.-87%
Взнос: 10663р.

Основной список: 9 участников

Резервный список: 1 участников

  1. 7 май 2021
    #1
    Toxich
    Toxich ЧКЧлен клуба
    Основы Data Science [2021]
    it-academy
    Роман Сидоренко


    Курс по Data Science направлен на приобретение знаний, навыков и умений по извлечению, структурированию и использованию полезной информации из неструктурированных, а также разрозненных источников.

    Он охватывает основные современные средства Data Mining, Machine Learning и Big Data. Использование указанных технологий даёт неоспоримое преимущество не только организациям на рынке товаров и услуг, но и людям на рынке труда.

    1. Для разработчиков, желающих расширить свои компетенции;
    2. Для студентов старших курсов и выпускников технических ВУЗов, которые хотят повысить свои шансы на трудоустройство;
    3. Для аспирантов и соискателей научных степеней, желающих приобрести навыки решения научных и исследовательских задач с использованием современных информационных технологий;
    4. Для специалистов, желающих повысить свою компетенцию в области Data Mining, Big Data и Data Science.
    1. Приобретения знаний в областях Data Mining, Big Data и Data Science;
    2. Формирования устойчивых навыков и умений по постановке и решению аналитических и исследовательских задач с использованием математической статистики и современных информационных технологий, а также разработки информационных рекомендательных систем.
    1. Осуществлять сбор, обобщение и очистку исходных информационных данных;
    2. Находить аналитические зависимости в структурированных и неструктурированных данных;
    3. Осуществлять постановку и решение задач математического программирования и исследования операций;
    4. Знать и уметь применять основные алгоритмы машинного обучения и математического программирования;
    5. Знать, как работает Machine Learning;
    6. Уметь пользоваться основными инструментами Data Mining, Big Data и Data Science;
    7. Знать основные типы и архитектуру нейронных сетей;
    8. Реализовывать, внедрять и обучать Machine Learning модели;
    9. Решать задачи Computer Vision, Natural Language Toolkit, а также прогнозирования временных рядов;
    10. Знать концепции Map Reduce и CUDA;
    11. Знать принципы функционирования высоконагруженных систем;
    12. Разрабатывать рекомендательные системы.
    Модуль 1 - Введение в Data Science
    • Объект Data Science.
    • Взаимосвязь Data Mining, Big Data и Data Science.
    • Инструментарий Data Science.
    • Основные способы получения данных.
    • Базовый эксплоративный анализ и визуализация данных.
    Модуль 2 - Математические основы Data Science
    • Основы матричного исчисления.
    • Реализация матричных операций в Python.
    • Основы теории вероятности и математической статистики.
    • Проверка статистических гипотез в Python.
    • Основы математического программирования и исследования операций.
    • Классификация алгоритмов математического программирования.
    • Визуализация данных в Python.
    Модуль 3 - Основы Data Science и Machine Learning
    • Принципы построения моделей в Data Science.
    • Метрики качества моделей. Проверка качества модели.
    • Введение в Deep Learning и Machine learning.
    • Объект Deep Learnig и Machine Learning. Классы решаемых задач.
    • Большие данные и параллельные вычисления.
    • Подходы к построению высоконагруженных систем.
    • Обобщение и сбор данных для обучения их очистка и нормализация.
    • Обзор и классификация алгоритмов ML.
    Модуль 4 - Основные алгоритмы Machine Learning
    • Алгоритмы «Дерево решений», «Случайный лес», «K-ближайших соседей», «Градиентный бустинг».
    • Кластеризация и поиск ассоциаций.
    • Линейная и логистическая регрессия. Ограничения, преимущества и недостатки.
    • Обучение с учителем.
    • Обучение классификатора на размеченных данных.
    • Проверка качества модели: переобучение, регуляризация, обучающая и тестовая выборки.
    • Борьба с переобучением: ансамблирование. Обзор методов ансамблирования.
    • Реализация алгоритмов в Python.
    Модуль 5 - Методы предобработки данных
    • Снижение размерности, разреженные данные, многомерные пространства.
    • Коррелирующие параметры.
    • Нерациональное использование памяти, сложность моделей.
    • Статистический анализ данных, выбор параметров на основе корреляции.
    • Снижение размерности данных: поиск подмножеств, регуляризация, уменьшение пространства.
    • Векторное разложение.
    • Методы декомпозиции.
    • Спрямляющие пространства.
    Модуль 6 - Рекомендательные системы
    • Введение в рекомендательные системы.
    • Различие между предсказаниями и рекомендациями.
    • Типы рекомендательных систем.
    • Постановка целей.
    • Неперсонализированные рекомендации.
    • Способы построения рекомендательных систем.
    • Цепи Маркова.
    • Групповые рекомендации.
    Модуль 7 - Распознавание изображений, машинное зрение
    • Теоретические основы обработки изображений.
    • Форматы данных (RGB, CMYK, B&W), принципы и алгоритмы сжатия изображений, примеры чтения и конвертации изображений.
    • Выделение признаков изображений.
    • Задача поиска изображения по шаблону, представление свойств изображения с помощью гистограмм.
    • Поиск похожих картинок по контенту.
    • Сегментация изображений, детекция объектов.
    • Детектор лиц на изображении.
    Модуль 8 - Введение в нейронные сети
    • Основные элементы нейронных сетей.
    • Классификация архитектур нейронных сетей.
    • Обучение: функция потерь, обратное распространение ошибки, стохастический градиент.
    • Регуляризация.
    • Инициализация весов.
    • Сверточные нейронные сети.
    • Практическое применение сверточных рекурентных и генеративно-конкурирующих сетей в задачах Computer Vision.
    Модуль 9 - Распознавание естественного языка
    1. Введение в обработку текста.
    2. Частотный анализ.
    3. Законы Ципфа и Хипса.
    4. Морфологический и синтаксический анализ.
    5. Векторная модель и методы снижения размерности в ней.
    6. Классификация текстов.
    7. Извлечение именованных сущностей.
    8. Языковые модели.
    9. Извлечение информации.
    10. Генерация текстов.
    Модуль 10 - Временные ряды
    • Временные ряды.
    • Модели построения прогнозов.
    • Разложение временного ряда на компоненты.
    • Автокорреляция и корелограммы.
    • Стационарность ряда.
    • Сложные модели прогнозирования.
    • Прогнозирование временных рядов на цепях Маркова.
    Модуль 11 - Общение с заказчиком. Требования к Data Science проектам
    • Cпособы выяснения требований, проверка их выполнимости.
    • Формализация и утверждение требований с заказчиком.
    • Общий порядок составления отчетов.
    • Цели, явные и неявные ожидания заказчиков проекта.
    • Описание зависимостей и способов воздействия на важные для заказчика факторы.
    • Практический опыт создания хайлоад моделей.
    • Выбор алгоритмов, библиотек, тонкой настройки моделей.
    Модуль 12 - Подведение итогов
    • Защита дипломных проектов.

    Примечание: полная стоимость курса 2 999 (BYN)

    Продажник
     
  2. Последние события

    1. Almaz55
      Almaz55 не участвует.
      13 июл 2024
    2. blackfish
      blackfish не участвует.
      24 янв 2023
    3. sibbora
      sibbora не участвует.
      17 янв 2023
    4. bbt_ttb
      bbt_ttb не участвует.
      13 янв 2023