Иногда файл Excel — это просто файл. Структурированные данные, которые легко анализировать и которые созданы по определенным алгоритмам — это не Big data. Даже если это очень большие таблицы. В то же время и объемная и неструктурированная информация — это тоже не Big data. Что же относится к Big data? Когда поток содержит в себе структурированные и неструктурированные данные, информация представлена в различных видах и форме, массив настолько велик и настолько быстро растет, что нужны специальные инструменты обработки — тогда можно говорить о Big data. У больших данных есть три характеристики (3V): объем (volume), скорость (velocity), разнообразие (variety).
Но как именно обращаться с большими данными? Как получить от них практическую пользу? Откуда они берутся, как их собирать, где хранить, как анализировать? Без обработки ценность больших данных крайне низка. В этом курсе на доступных, понятных и практических примерах вы узнаете, как использовать большие данные в компаниях.
После прохождения курса сотрудники научатся:- Применять большие данные в своей профессии
- Собирать данные, знать разные методы сбора
- Классифицировать данные
- Преобразовывать данные в единую систему
- Организовывать хранилища данных, использовать для этого разные решения: «у себя» / в публичном облаке / в корпоративном облаке
- Использовать разные методы анализа (краудсорсинг, смешение и интеграция данных, машинное обучение, предиктивный анализ, имитационная модель, статистический анализ, data mining)
- Взаимодействовать с экспертами по Big data в одном информационном поле
Курс подходит для руководителей команд, рабочих групп, для сотрудников, которые хотят начать управлять большими данными и внедрить этот процесс в свою работу. Курс позволяет познакомиться с основами и решить, какие действия нужно предпринять, чтобы начать собирать и анализировать большие данные.