MIT em Big Data


conteúdo detalhado

A Pós-Graduação é composta por blocos de aprendizado, totalizando 440 horas/aula. Ao término de cada bloco, o aluno consolida seu aprendizado apresentando um Projeto de Bloco, aplicando os conhecimentos promovidos no período.

Obtenção, Análise e Visualização de Dados: Valor 

Cases

Soluções utilizadas em diversas áreas: médica, marketing, mercado financeiro, educação, redes sociais; Arquitetura de Soluções Big Data; Pipeline completo utilizado em soluções de problemas classificados como "Big Data"

Big Data Analytics

Analítica Descritiva, Preditiva e Prescritiva; Formulação de Problemas; Modelagem; Mensuração; Análise de Resultados; Ferramentas Analíticas; Análises Quantitativa e Qualitativa; Formulação de questões; Estudos de Caso Aplicados (Marketing, Cadeia de Fornecimento, Finanças, RH, Pesquisa e Desenvolvimento); Visualização de Resultados (data visualization).

Projeto de Bloco

Com base no estudo de caso da grande rede de varejo, elaborar questões, coletar dados, realizar análises e apresentar resultados que respondam às questões levantadas.

Infraestrutura para Big Data: Volume 

Map Reduce/ Hadoop

Hadoop como framework; Papel desempenhado por servidores master e slaves; Arquitetura: Map Reduce; HDFS e Ferramentas (Hive, HBase, Mahout, Pig, Oozie, Flume, Scoop, Spark/shark); Soluções em Python; Papeis Task tracker, Data node, Job tracker e Name node; Tolerância a falhas; Clusterização; Transparência de programação; Gerência de usuários; Estudo de caso.

Programação

Soluções em R e Python; Lendo e gravando dados; Estruturas de processamento; Simulações; Otimização; Coleta e limpeza de dados (leitura, mescla, agregação); Gráficos; Clusterização de dados; IPython Notebook.

Projeto de Bloco

Modelar e projetar uma solução composta por infraestrutura Hadoop e desenvolvida utilizando a linguagem Python, observando as práticas recomendadas no presente Bloco.

Armazenamento Heterogêneo de Dado: Velocidade 

Gerenciamento de Dados

SGBDs Relacionais vs. NoSQL; Agregações; Esquemas dinâmicos; Bases Distribuídas; Consistência; Gerenciadores Key-Value (Redis, Memcached, Riak); Gerenciadores Orientados a Documento (MongoDb, CouchBase, RavenDB); Bancos InMemory (SAP HANA e VoltDB); Gerenciadores Relacionais para Big Data (Vertica, Pivotal). Neste módulo teremos laboratórios práticos visando realizar comparações entre os diversos produtos.

MongoDB

Instalação; Organização de Dados; Trabalhando com Dados; Consultas; Administração; Storage Engines, Otimização; Replicação; Particionamento de dados (sharding). 

Projeto de Bloco

Prova prática em laboratório envolvendo resolução de problemas de administração e otimização com MongoDB.

Indexação e Tratamento de Dados Heterogêneos: Variedade 

Mecanismos de Busca

Bases do Machine Learning; Algoritmos Supervisionados e Não Supervisionados; Aprendizado por Reforço; Elaboração de modelos; Medição de Acurácia; Implementações em R, Python ou AzureML.

Mineração de Texto

Manipulação de dados brutos; Dados temporais; Algoritmos de busca; Análise de resultados; Busca inferente em bases texto; Identificação de padrões; Ferramentas; Web Mining; Text Mining; Algoritmos genéticos; Análise de sentimento.

Projeto de Bloco

Prova prática em laboratório envolvendo resolução de problemas de mineração de textos.

TCC

O Trabalho de Conclusão de Curso tem como objetivo avaliar os conhecimentos teórico-práticos adquiridos durante a pós-graduação. Ele é desenvolvido individualmente e é constituído por um projeto prático que utilize as competências adquiridas nos blocos do curso.


 

Observação

Em virtude do constante aperfeiçoamento do projeto pedagógico, eventualmente os nomes dos blocos, módulos, suas cargas horárias e ementas podem sofrer mudanças sem aviso prévio. Por favor, verifique as características detalhadas do curso no momento da sua matrícula. A ordem dos blocos não é preestabelecida no projeto pedagógico do curso.

 

 

Saiba mais sobre o processo seletivo e valores.

 

MIT em Big Data

PDF - 1,09 mb

 

Rodrigo Souza
Ex-aluno

"Fui um dos primeiros inscritos
na turma inicial da Pós-Graduação
MIT em Big Data. O Infnet foi
precursor nessa área bem na
época em que eu estava buscando
educação formal sobre o tema.
Foram dois anos de muito estudo
e aprendizado teórico e prático
que me ajudam no dia a dia da
profissão. Tivemos contato com
as mais modernas tecnologias
de Big Data e com desafios
práticos que nos levaram a um
nível muito acima do mercado.
Também é oportuno destacar
a importância da rede de contatos.
Impressiona a quantidade de
oportunidades compartilhadas
entre nós, alunos."