Открыто

Основы работы с большими данными Data Science [2019] [Специалист] [Данил Динцис] [Повтор]

Тема в разделе "Курсы по администрированию", создана пользователем Toxich, 8 ноя 2019.

Цена: 9990р.-94%
Взнос: 568р.

Основной список: 20 участников

Резервный список: 2 участников

  1. 8 ноя 2019
    #1
    Toxich
    Toxich ЧКЧлен клуба

    Складчина: Основы работы с большими данными Data Science [2019] [Специалист] [Данил Динцис] [Повтор]

    Предлагаем Вам погрузиться в Data Science, чтобы познакомиться с Big Data! На нашем курсе Вы соприкоснетесь с самой популярной в IT концепцией.

    Наш курс «Основы работы с большими данными: Data Science Orientation» позволит Вам «подружиться» с Big Data (большими данными).

    • источники информации: структурированные и неструктурированные;
    • основные характеристики больших данных и способы их анализа;
    • элементы классификации данных и машинного обучения;
    • основы статистического анализа, построение регрессионных зависимостей;
    • визуализация «больших данных»;
    • обзор классов задач, решаемых инструментами машинного обучения и ИИ: распознавание образов, звуков, текста, прогностика, анализ соцсетей;
    • обзор математических инструментов решения: нейронные сети, графы, нечеткие и К-значные логики;
    • обзор прикладных инструментов: AWS, Azure AI, machine learning c демонстрацией применения;
    • специальности в области «больших данных» и формирование команд: аналитики данных, «ученые по данным», программисты по «большим данным», менеджеры по «большим данным» (CDO).
    • методы реорганизации работы компании при применении анализа «больших данных».

    Предлагаемый курс позволит управляющему персоналу, менеджерам, разработчикам, другим сотрудникам, вовлеченным в аналитическую деятельность своей компании, ознакомиться с современными инструментами сбора, подготовки, обработки и анализа больших объемов разнородных данных.

    По итогам курса Вы будете уверенно ориентироваться в мире «больших данных», машинного обучения и сможете организовывать команды для работы с «большими данными» и определите направление своего профессионального развития в этой области.

    Модуль 1. Область применения больших данных. Типовые задачи.
    • Цели курса
    • Определение основных понятий
    • История науки о данных
    • Выгоды от работы с большими данными
    • Типовые задачи: прогноз продаж, производства, спроса. Анализ поведения. Распознавание образов. Экспертные системы.
    Модуль 2. Сбор и подготовка исходных данных. Методика CRISP-DM
    • С чего начать. Межотраслевая стандартная методика работы с данными CRISP-DM
    • Описательное и ассоциативное исследование исходных данных
    • Сегментирование и очистка данных (slice and dice). Примеры инструментов Excel
    • Визуализация данных в Excel. Как использовать сводные таблицы и диаграммы
    • Практическая работа. Сегментировать и очистить тестовый набор данных.
    Модуль 3. Основы математической статистики. ANOVA. Надстройка Excel «Пакет анализа»
    • Описательная статистика
    • Среднее, наиболее вероятное, медиана
    • Дисперсия, стандартное отклонение, стандартная ошибка
    • Виды распределений
    • Пакет анализа данных Excel
    • Обзор других прикладных средств работы с данными (R, Python, Octave, MathLab, специализированные БД).
    • Практическая работа. Определить статистические характеристики выборки данных.
    Модуль 4. Задача прогноза продаж. Понятие машинного обучения. Корреляция. Регрессионный анализ
    • Постановка задачи оценки взаимосвязи между различными факторами и построение прогноза
    • Корреляция. Коэффициент Пирсона
    • Критерий Стьюдента (T-анализ)
    • Основы машинного обучения
    • Регрессионный анализ
    • Критерий Фишера
    • Построение и анализ трендов в Excel
    • Практическая работа. Определить наличие корреляции и регрессионную зависимость между двумя выборками данных. Построить тренд.
    Модуль 5. Задачи классификации и распознавания образов, видео, речи, текста. Понятие нейронных сетей. Примеры применения.
    • Задача сегментации дискретных данных на примере задач распознавания (графика, речь, текст)
    • Нейронные сети как инструмент решения задач классификации
    • Демонстрация на примерах Azure, AWS
    • Задачи классификации данных в социальных сетях и поиска оптимального решения (маршрута)
    • Графы как инструмент решения задач на социальных графах и прогнозирования поведения
    • Дерево решений
    • Разбиение на выборки (обучающую, тестовую, проверочную)
    • Анализ ошибок обучения. Базис и отклонения. Ручная корректировка
    • Практическая работа: провести классификацию набора данных и его разбиение на сегменты.
    Модуль 6. Задача исследования социальных сетей. Задача прогнозирования поведения пользователя. Социальные и направленные графы. Деревья решений. Примеры применения
    • Задача классификации данных в социальных сетях
    • Графы как инструмент решения задач на социальных графах и прогнозирования поведения
    • Разбиение на выборки (обучающую, тестовую, проверочную)
    • Анализ ошибок обучения. Базис и отклонения. Ручная корректировка
    Модуль 7. Продвинутые инструменты: глубокое машинное обучение, искусственный интеллект, нечеткие множества
    • Понятие Deep Machine Learning
    • Многофакторный бизнес анализ на примере нечетких логик
    Модуль 8. Профориентация по специальностям в Data Science. Выводы и рекомендации по построению и организации работы команды
    • Роли специалистов по DS: аналитик данных, ученый по данным, программист, цифровой директор
    • Требования к компетенциям и взаимодействию сотрудников в области аналитики данных
    • Состав и требования к проектной команде для DS
    • Подготовка компании к применению «бигдата»

    Продажник
     
  2. Последние события

    1. skladchik.com
      В складчине участвует 20 человек(а).
      16 сен 2024 в 11:37
    2. Rednaskel
      Rednaskel участвует.
      1 авг 2024
    3. skladchik.com
      В складчине участвует 20 человек(а).
      1 авг 2024
    4. skladchik.com
      В складчине участвует 20 человек(а).
      30 июл 2024