Мастер в области больших данных и аналитики

Общая информация

Описание программы

Мастер в области больших данных и аналитики

Онлайн мастер по большим данным и аналитике

Магистр больших данных и аналитики родился в результате объединения обширного опыта в обучении и исследованиях в области технологий, которое характеризует СКП, подкрепленного признанием и аккредитацией, как на национальном, так и на национальном уровне. международный; и опыт онлайн-обучения с технологической и деловой направленностью от OBS .

Структура магистра в области больших данных и аналитики позволит учащимся определить, когда тип решений для больших данных может помочь организации и управлять ее реализацией в ней.

На протяжении всей программы будут видны три больших блока:

  • Блок I. Управление и хранение.
  • Блок II Процессы и анализ.
  • Блок III Визуализация и бизнес.

Во время программы знания о технологических решениях будут применяться на практике, поскольку цель состоит в том, чтобы приблизить студента к текущей технологии, доступной на рынке, чтобы иметь возможность прикоснуться к ней и увидеть ее применимость.

возможности карьерного роста

В OBS мы стремимся обучать как двигатель изменений, роста и совершенствования, как личных, так и профессиональных. Применение в профессиональной сфере развитых компетенций на протяжении всей программы будет способствовать росту и совершенствованию студентов, а также их компаний.

Цифровая трансформация компаний является реальностью, и это подразумевает изменения в различных функциональных областях их. Именно по этой причине профессионалы должны быть готовы использовать новые инструменты, предоставляемые новой технологической средой.

Профессиональные экскурсии сгруппированы в:

  • Отвечает за проекты Big Data и передовую бизнес-аналитику.
  • Внешний консультант
  • Начальник отдела инфраструктуры больших данных аналитики в области ИКТ.
  • Директор по обработке данных
  • Аналитик данных

цели

При наличии экосистемы из 1000 решений для больших данных в условиях меняющегося рынка, который не прекращает расти год за годом, необходимо постоянно адаптировать и правильно определять основы архитектур, но всегда под эгидой бизнес-ожиданий.

Большие объемы данных, разнообразие и скорость не приведут к потере ресурсов организации, которая не понимает, что она хочет решить. Следовательно, знание того, почему и что ожидает организация (снижение затрат или увеличение доходов), - это элементы, которые будут определять жизнеспособность проекта больших данных.

Мастер в области больших данных и аналитики предлагает в основном практичный и строгий подход, ориентированный на внедрение технологии больших данных с гарантиями успеха.

Общая цель

Основная цель мастера в области больших данных и аналитики заключается в предоставлении знаний, необходимых для управления проектом больших данных во всех его аспектах, начиная с того, как определить возможность в организации к тому, что доставляется в области бизнеса.

Мастер в области больших данных и аналитики фокусируется на нескольких решениях. Цель состоит в том, чтобы ответственный специалист мог определить, сталкивается ли организация с проблемой больших данных, и определить определенный процесс, который необходимо выполнить: определить тип решений, которые необходимо принять; профессиональные профили, которые вам понадобятся; Подготовить план экономической жизнеспособности и иметь основы для управления его масштабируемостью.

Конкретные цели

Учебный план магистра в области больших данных и аналитики предназначен для достижения следующих конкретных целей:

  • Понять, как преобразовать традиционную организацию, применяя концепцию анализа данных или Big Data Analytics, в организацию, управляемую данными.
  • Знать основные технологические рамки рынка и его основные приложения: Hadoop, Spark, Neo4j.
  • Определите, каковы различные типы информации, их хранение и качество процессов.
  • Понять, как извлечь знания из данных для создания прогнозных моделей с помощью прогнозной статистики и машинного обучения.
  • Овладеть техниками управления данными: сбор, хранение, обработка, анализ, визуализация.
  • Откройте для себя новые методы визуализации панели инструментов, чтобы улучшить процесс принятия решений.

учебный план

Блок I. Управление и хранение

Курс по выравниванию больших данных

Параллельно с модулем 1 студенты начинают программу Big Data and Analytics с этого курса повышения квалификации, который предоставляет базы технических знаний, необходимые для реализации программы и реализации проектов Big Data. В этом курсе студенты найдут материальные ресурсы, которые позволят им углубиться в различные предметы, необходимые для продолжения курса, и проведут тест типа теста, который послужит руководством для оценки их знаний и окончательной оценки курса.

Модуль 1. Управление аналитикой больших данных

В этом модуле мы познакомим вас с основными понятиями больших данных, чтобы узнать, как определить ключи каждого проекта и масштабируемость. Обнаружение, прежде чем начать, изменчивость данных, объем и скорость, поможет нам определить, какие этапы следует выполнить перед началом проекта больших данных и, что наиболее важно, какую отдачу мы ожидаем от проекта? Какие ожидания у бизнеса?

цели:

  • Определите, когда проект представляет собой большие данные.
  • Найти ROI в проекте Big Data.
  • Понимать и применять концепции Dark Data и Open Data.
  • Руководство организации должно быть организацией, управляемой данными, и поддерживать проект.
  • Знайте законность данных.
  • Определите фигуру науки о данных в организации.

Модуль 2. Архитектура больших данных

Экосистема решений для больших данных будет такой же большой, как типологии данных и мощность процессов, которые нам нужны в проекте. Большинство из них сосредоточены на масштабируемости, разнообразии и основаны главным образом на облачных средах. Некоторые компании не хотят загружать свои наиболее важные данные в облаке и предпочитают хранить их дома, другие предпочитают 100% облачные или гибридные среды.

В этом модуле мы узнаем о PRO и NOC каждой архитектуры, основных поставщиках решений и о том, как мы можем создать максимально гибкую среду, всегда ища наиболее эффективную архитектуру в решениях и стоимости.

цели:

  • Познакомьтесь с типологиями On Premise, Hybrid и On Cloud.
  • Понять роль Hadoop и HDFS как основы для распараллеливания процессов.
  • Узнайте, что такое Spark и экосистема Hive, Pig, Sqoop и Flume.
  • Определите преимущества Kubernetes и Databricks.

Модуль 3. ETL и ELT

Информация может быть получена из источников вне организации (социальные сети, открытые данные, среди прочего) и внутренних баз данных (CRM, ERP, транзакционные, среди прочих). Все эти данные должны быть преобразованы перед их чтением или впоследствии, чтобы затем обрабатывать их с помощью процессов агрегации, которые позволяют нам получать KPI.

В настоящее время мы должны определить правила качества, чтобы убедиться, что данные верны и не истощают наше озеро данных.

В этом модуле мы научимся определять основы, которые должен иметь весь процесс загрузки данных, чтобы гарантировать целостность, очистку, историзацию и рекурсию в нагрузках.

цели:

  • Поймите разницу между ETL и ELT.
  • Понять преимущества процессов ETL.
  • Определите KPI для MDM.
  • Интегрировать разные системы.
  • Возможность управлять использованием исключений.
  • Понять разницу между озером данных и хранилищем данных.

Модуль 4. Data Lakes

Регистрация большого количества информации требует различных типов баз данных, помимо реляционных с более традиционным подходом; Например, видео, маршруты или критические пути, документы или социальные сети становятся все более распространенными источниками данных среди источников информации, которые интересуют бизнес.

Рынок технологий адаптировался ко всем из них и создал решения, позволяющие оптимально их хранить и использовать. В этом модуле мы рассмотрим его преимущества и недостатки, мы проведем небольшие практики для каждого из них, чтобы изучить его потенциал.

цели:

  • Знать реляционные базы данных против NOSQL.
  • Знать столбчатые базы данных.
  • Знать графа базы данных. Neo4j.
  • Знать документальные базы данных.
  • Откройте для себя внешние источники данных организации, чтобы обогатить наше озеро данных.
  • Понимать роль потоков данных в принятии решений в режиме реального времени.
Блок II Процессы и анализ

Модуль 5. Data Mining

В этом модуле мы научимся извлекать информацию из набора данных озера данных и, прежде всего, сделать ее интерпретируемой. На протяжении всего процесса нам необходимо четко понимать цели бизнеса, инструменты, которые помогут нам дезинфицировать данные, определить, какие математические модели лучше, и оценить результаты.

цели:

  • Выберите набор данных, который может наилучшим образом решить бизнес-вопрос, из доступных данных.
  • Преобразуйте входной набор данных.
  • Выберите наиболее подходящий метод анализа данных, например, нейронные сети, деревья решений, правила кластеризации или ассоциации.
  • Понять процесс извлечения знаний.
  • Интерпретировать и оценить данные.

Модуль 6. Расширенная аналитика: R и Python

Как только у нас будут правильные данные, настанет время извлечь знания, интерпретировать их и вывести знания на новый уровень. В этом модуле мы создадим небольшую статистическую базу для работы с двумя основными инструментами Advanced Analytics, представленными на рынке: R и Python. С их помощью будут реализованы небольшие практики, чтобы определить, когда использовать каждый из них, и извлечь максимальный потенциал из данных.

цели:

  • Знать основы статистики и расчета вероятностей.
  • Применить многомерный анализ данных.
  • Понять и применить временной ряд.
  • Понять процесс статистического контроля качества данных.
  • Рассчитать корреляции и закономерности.
  • Знать процесс кластеризации данных.

Модуль 7. Машинное обучение

В предыдущих модулях мы увидели, как интерпретировать существующие данные, как извлекать знания обо всем, что с нами произошло. В этом модуле мы подойдем к машинному обучению, чтобы увидеть, как с хорошей информацией мы можем приблизиться к предикторам. Мы узнаем основные методы и инструменты рынка, какой тип и объем информации необходимы, и выполним небольшие практические модули, чтобы увидеть их применимость.

цели:

  • Поймите разницу между контролируемым обучением и неконтролируемым обучением.
  • Знать различные методы классификации, от деревьев решений до байесовских методов.
  • Понять концепцию машинного обучения.
  • Определите основной открытый исходный код и коммерческое программное обеспечение.
Блок III Визуализация и бизнес

Модуль 8. Управление данными.

Как только у нас будет вся информация, мы должны определить правила использования: кто может видеть данные, определение каждой информации, происхождение и предоставить пользователям инструменты для их интерпретации.

Управление данными, когда многие компании терпят неудачу, имея два разных значения для одного и того же или прогнозирующего KPI, вызывает недоверие между различными областями бизнеса.

В этом модуле мы изучим методы управления информацией для поддержания целостности, безопасности и прослеживаемости, чтобы гарантировать, что данные помогают принимать безопасные решения, не вызывая недоверия.

цели:

  • Понять, что такое доступность данных.
  • Управляйте данными как активом.
  • Обеспечить целостность.
  • Определите основные KPI и прослеживаемость данных.
  • Понять концепцию безопасности.

Модуль 9. Методы визуализации

В этом модуле мы узнаем, каковы различные методы визуализации данных и когда использовать каждый из них. Большие объемы данных нуждаются в новых графических представлениях для их интерпретации: тепловые карты, кластеры, измерения, критические пути и другие.

В дополнение к графикам важно связать оценку с каждой из них и создать интерпретацию. Индикаторы могут запутать и помешать принятию решений, ориентируя их, помещая их в контекст и подвергая их воздействию, поможет лучшая интерпретация:

цели:

  • Откройте для себя доступные типы графики.
  • Знать варианты использования и их основные графические представления. Понимать процесс, связанный с переходом графики к рассказу бизнес-историй.
  • Знать, как упростить и добавить данные для адресных панелей.

Модуль 10. Средства визуализации данных и самообслуживания

Наконец, поскольку экосистема инструментов визуализации является сложной, важно выбрать наиболее подходящую для каждого типа организации. Мы должны помнить, что в организации мы стремимся упростить технологии и должны найти решение для всей организации. Только тогда мы можем легко гарантировать безопасность, доступность и доступность одних и тех же ключевых показателей эффективности.

Самообслуживание является ключевым элементом в крупных организациях с делегациями, филиалами и т. Д. Это позволяет вам децентрализовать информацию и сделать каждый узел организации автономным.В этом модуле мы познакомимся с основными инструментами визуализации данных и самообслуживания.

цели:

  • Определите основные рыночные инструменты: Qlikview / sense, Tableau, PowerBI, Cognos.
  • Знайте сильные и слабые стороны каждого.
  • Сделайте тематическое исследование с данными Qliksense и самообслуживания.
Окончательный проект

Во время финального мастер-проекта (PFM) студент будет работать рука об руку с реальной компанией в разработке проекта. Это будет возможность сделать это для вашей собственной компании или выбрать один из вариантов, предложенных школой.

Предлагаемые проекты могут принимать два подхода: бизнес и / или технологический, и в рамках этих подходов могут принимать несколько форм, некоторые примеры:

Подход 1. Бизнес

  • Пример 1. Разработка бизнес-плана, включающего оборудование, инфраструктуру и бизнес-результаты в теоретическом бизнес-случае с различными типами данных.
  • Пример 2. Бизнес консалтинг проект реального бизнес-кейса.

Фокус 2. Технологический

  • Пример 1. Разработка бизнес-панелей с использованием рыночного инструмента с различными типами данных и определением показателей.
мастерские

В магистратуре по большим данным и аналитике у студента будет возможность провести 2 практических занятия. Эти семинары:

Мастерская 1. Neo4j

На этом семинаре мы узнаем, технически, как работают графовые базы данных. Как использовать возможности, которые они могут внести при поиске наиболее часто используемых критических путей, иерархических повторений перед реляционными базами данных.

Мастерская 2. Уотсон

Решения для настройки среды искусственного интеллекта / машинного обучения могут быть представлены различными взаимосвязанными продуктами Open Soucer или решением, которое добавляет основные рыночные продукты и гарантирует совместимость между версиями, автоматическое обновление и заключение контрактов в качестве услуги. Это основные преимущества Watson, и на этом чисто практическом семинаре мы узнаем, как обеспечить среду для нашей науки о данных, в которой мы можем управлять решениями и стоимостью.

инструменты

На протяжении всего курса мы будем приближаться к основным рыночным решениям на каждом из уровней, которые составляют решение для больших данных. Основные партнеры по решениям (IBM, Amazon, Google Cloud, Azure), базы данных (Neo4J, HDFS, Cassandra, MongoDB), ETL (Kafka, Pentaho, Powercenter), презентация (Tableau, Qlik) и другие.

Мастер не стремится технологически обучать своих учеников каждому из этих инструментов, но подходит с теоретической точки зрения, видит плюсы и минусы каждого из них и выполняет небольшие практики, чтобы из первых рук понять его работу. Практика будет проста и легко решаема, не будучи основной целью, но не просто теоретическим мастером.

Основные требования

Профиль студента и требования к поступающим

Модули программы предназначены для профессионалов из любого сектора, которые хотят реализовать проект Big Data в своей компании, определить, какие типы проектов относятся к этому типу, и определить лучшую дорожную карту для проекта, чтобы успешно его решить.

Профили происхождения:

  • Выпускники в области технической инженерии, ADE и науки (медицина, математика, физика, химия).
  • Профессионалы, которые работают в сфере ИКТ.
  • Промежуточные позиции компаний, которые хотят иметь выгодную позицию перед лицом будущих возможностей в их компании.
  • Профессиональные специалисты BI (Business Intelligence), которые хотят расширить свои знания.
  • Технические профили / консультанты, которые в настоящее время работают с данными и хотят иметь комплексное видение управления.
титрование

По завершении программы студенты получат:

  • Название Три Очка.
  • Собственная степень, аккредитованная СКП, если требования Университета выполнены в конце программы
Последнее обновление: Март 2020

О вузе

OBS Business School nace en 2006 como la primera escuela de negocios 100% online en lengua española. Se funda en el entorno del Grupo Planeta, líder mundial en la publicación de contenidos para el mer ... Подробнее

OBS Business School nace en 2006 como la primera escuela de negocios 100% online en lengua española. Se funda en el entorno del Grupo Planeta, líder mundial en la publicación de contenidos para el mercado de habla hispana y con un importante know-how en e-learning, con la colaboración del partner estratégico: Свернуть
Барселона , Мадрид + 1 Больше Меньше