FORMAÇÃO DO BACHAREL EM ESTATÍSTICA À LUZ DAS CIÊNCIAS DE … · pg 32 Francisco Louzada (USP)...
Transcript of FORMAÇÃO DO BACHAREL EM ESTATÍSTICA À LUZ DAS CIÊNCIAS DE … · pg 32 Francisco Louzada (USP)...
SINAPE 2018 pg 1 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Francisco Louzada CER-CEMEAI
ICMC-USP
FORMAÇÃO DO BACHAREL EM ESTATÍSTICA À LUZ DAS CIÊNCIAS DE
DADOS
SINAPE São Pedro, 24-29 de setembro de 2018
SINAPE 2018 pg 2 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
RETROSPECTO
Áreas de Aplicação da Estatística
SINAPE 2018 pg 3 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
AMBIENTE Agricultura, Ecologia, Zoologia, Biologia etc
Governo Censo,
Defesa Nacional, Estratégias Economicas
CIÊNCIAS Quimica, Física,
Astronomia
Áreas onde a ESTATÍSTICA
é utilizada MEDICINA &
SAÚDE Ensaios Clínicos, Genética,
Epidemiologia, farmacologia
ADIMINISTRAÇÃO/FINANÇAS Economia, marketing,
Ciência da Computação
TECNOLOGIA Engenharias em Geral
ESPORTES Previsão Jogos,
Performa do Atleta
SINAPE 2018 pg 4 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
PREOCUPAÇÃO
ANÁLISE PRIMÁRIA DOS DADOS
4 DADOS SÃO COLETADOS COM UMA QUESTÃO PARTICULAR
(CONJECTURA) 4 PODE SER TRADUZIDA EM
HIPÓTESES A SEREM TESTADAS
SINAPE 2018 pg 5 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
POPULAÇÃO
Característica comum: O Tamanho dos Bancos de Dados
SINAPE 2018 pg 6 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
PROBLEMA !!!! (SITUAÇÃO ATUAL)
NOTA: Slide do SINAPE 2000 (Caxambú)
Massa enorme de dados!!!
SINAPE 2018 pg 7 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Nos dias atuais, bancos de dados com Giga, Terabytes, Pentabytes
são comuns!
Estima-se que 90% quantidade de dados no mundo hoje foram obtidos nos últimos 2 anos!
O TAMANHO DOS BANCOS DE DADOS
SINAPE 2018 pg 8 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Processos de coletagem automática de dados
Instrumentação eletônica
Transações on-line
Dados históricos coletados ao longo de muitos anos
RESPONSÁVEIS
SINAPE 2018 pg 9 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Sensores para captação de temperatura
Posts/Fotos/Vídeos em sites de mídia social
Transações de compras
Sinais de GPS de celulares
RESPONSÁVEIS
SINAPE 2018 pg 10 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
SINAPE 2018 pg 11 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Caixa Económica – Bancos de Dados com mais de 70 Terabytes
UOL – Mais de 50 Terabytes de dados diariamente!
SERASA – Transações diárias de uma base com mais de 170 milhões de CPFs
EXEMPLOS
SINAPE 2018 pg 12 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
BIOMÉDICAS Presença de Grandes Base de Dados
EXEMPLO – Disfunção Auditiva: Tinnitus • zumbido tem sido descrito como a
percepção consciente de sons na ausência de uma fonte sonora externa.
• 30% da população geral
INFORMAÇÃO Sinal biológico que é continua- mente medido e
monitorado.
SINAPE 2018 pg 13 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Pre-Post protocol workflow
SINAPE 2018 pg 14 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
ECOLOGIA PROJETO: Soundscape Project Parceiros: VICG-ICMC-USP, Landim, Polytechnique School OBJETIVO: O estudo de sons ambientais para entender a dinâmica das relações homem-natureza em diferentes escalas é chamado de Ecologia Soundscape.
Ondas sonoras
Espectograma
SINAPE 2018 pg 15 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
QUESTÕES ➨ O que fazer como esta grande
quantidade de dados?
➨ Como identificar e utilizar as informações escondidas nos dados?
➨ Como reverter estas informações em benefícios (Conhecimento útil) ?
SINAPE 2018 pg 16 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
CUIDADO: Como Procurar?
DATA MINING / BIG DATA
Procedimentos estatísticos devem ser
devidamente adaptados a essa nova
realidade.
SINAPE 2018 pg 17 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
ü O TAMANHO DO BANCO DE DADOS ü FIXAÇÃO DE ERROS ü DADOS CONTAMINADOS ü DADOS i i d ü NÃO ESTACIONARIEDADE ü No COVARIÁVEIS >>> No OBSERVAÇÕES ü VARIÁVEIS NÃO NUMÉRICAS
PROBLEMAS COM OS PROCEDIMENTOS ESTATÍSTICOS USUAIS QUANDO APLICADOS
À GRANDES BANCOS DE DADOS
SINAPE 2018 pg 18 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Grandes Bases de Dados e seus 5 V’s VOLUME – Terabites/ exabites de dados existentes
VELICIDDADE – Dados de transmissão, milissegun- dos a segundos para responder
VARIEDADE – Dados estruturados, não-estrutura- dos, text, multimídia
VERACIDADE – Inconsitências, ambiguidades, latência, dados faltantes etc
VALOR – Necessidade de gerar valor com os resultados obtidos
SINAPE 2018 pg 19 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Necessidade:
Um novo profissional com
múltiplas habilidades
SINAPE 2018 pg 20 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
“CIENTISTA DE DADOS”
Inferência Estatística
Bancos de Dados
Reconhecimento de Padrão/Inteligência
Artificial
Modelos de Regressão
Algoritmo/ Estrutura de Programação
Teoria dos Grafos
Statistical Data Mining
Pesquisa Operacional e Otimização
Redes Complexas
Visualização de Dados/
Computacional
Amostragem/ Planejamento de Pesquisa
Processamento em Paralelo
SINAPE 2018 pg 21 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Otimization
OR
SINAPE 2018 pg 22 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Necessidade do Mercado:
Analistas de Dados, Estatísticos, Matemáticos com Formação
Diversificada que possam trabalhar com eficiência em
ambiente multidisciplinar
SINAPE 2018 pg 23 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
CIENTISTAS DE DADOS PELO MUNDO
SINAPE 2018 pg 24 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
CIENTISTAS DE DADOS PELO MUNDO – GRADUAÇÃO
http://www2.warwick.ac.uk/fac/sci/statistics/courses/datsci/
SINAPE 2018 pg 25 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
http://www.barcelonagse.eu/master-data-science.html
CIENTISTAS DE DADOS PELO MUNDO – MESTRADO
SINAPE 2018 pg 26 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
CIENTISTAS DE DADOS PELO MUNDO – DOUTORADO
http://datascience.inf.ed.ac.uk
SINAPE 2018 pg 27 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
E AQUI NO BRASIL?
SINAPE 2018 pg 28 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
INEVITAVELMENTE PRECISAMOS PENSAR EM FORMAS DE SUPRIR ESTA DEMANDA,
QUE, EM MUITOS CASOS TEM SIDO ATENDIDA (INEFICIENTEMENTE) POR
PROFISSIONAIS DE OUTRAS ÁREAS DO CONHECIMENTO!
SINAPE 2018 pg 29 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
ESTAMOS PREPARADOS PARA ENFRENTAR ESSA DEMANDA?
O QUE TEMOS FEITO PARA
ENFRENTAR ESSA DEMANDA?
SINAPE 2018 pg 30 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
EMPRESAS COM 70 VAGAS PARA CIENTISTA DE DADOS!!!
SINAPE 2018 pg 31 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
ALGUMAS POSSIBILIDADES INCIAIS...
ü AÇÃO 1: ÊNFASE “CIÊNCIAS DE DADOS” ü AÇÃO 2: MESTRADO EM “DATA SCIENCE” ü AÇÃO 3: MBA EM “DATA SCIENCE” ü AÇÃO 4: GRADUAÇÃO EM “DATA SCIENCE” ü AÇÃO 5: MESTRADO/DOUTORADO EM “DATA SCIENCE”
SINAPE 2018 pg 32 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
MODELOS DE REGRESSÃO
1 2 3 MINERAÇÃO ESTATÍSTICA DE DADOS
q Criação de uma ênfase envolvendo disciplinas do SME e SCC do ICMC. q 5 alunos Estatística, 5 alunos Computação, 5 alunos Matemática
Aplicada e Computação Científica
IDÉIA
INFERÊNCIA ESTATÍSTICA DISCIPLINAS
AÇÃO 1: ÊNFASE “CIÊNCIAS DE DADOS”
ALGORITMOS/ESTRUTURA DE PROGRAMAÇÃO
4 5 6 INTELIGÊNCIA ARTIFICIAL
BANCOS DE DADOS
OTIMIZAÇÃO
7 8 9 REDES COMPLEXAS
VISUALIZAÇÃO DE DADOS
SINAPE 2018 pg 33 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
MODELOS DE REGRESSÃO
1 2 3 MINERAÇÃO ESTATÍSTICA DE DADOS
q Criação de um Módulo no Mestrado Profissional MECAI. IDÉIA
INFERÊNCIA ESTATÍSTICA
DISCIPLINAS
AÇÃO 2: MESTRADO PROFISSIONAL – MÓDULO “DATA SCIENCE”
ALGORITMOS/ESTRUTURA DE PROGRAMAÇÃO
4 5 6 INTELIGÊNCIA ARTIFICIAL
BANCOS DE DADOS
OTIMIZAÇÃO
7 8 9 REDES COMPLEXAS
VISUALIZAÇÃO DE DADOS
SINAPE 2018 pg 34 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
PROGRAMA DE MESTRADO
PROFISSIONAL
SINAPE 2018 pg 35 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Programa de Mestrado Profissonal 2014 (Agosto) u Mestrado Profissional em Matemática Aplicada, Estatística
e Computação Aplicadas à Indústria - MECAI u 1º MÓDULO: FINANÇAS (a partir de agosto 2014) u 2º MÓDULO: DATA SCIENCE (a partir de agosto 2015)
u 3º MÓDULO: DATA SCIENCE (a partir de agosto 2016)
u 4º MÓDULO: DATA SCIENCE (a partir de agosto 2017)
u 5º MÓDULO: DATA SCIENCE (a partir de agosto 2018)
SINAPE 2018 pg 36 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
ALUNOS DE MAIS DE 50 EMPRESAS/INSTITUIÇÕES DIFERENTES
SINAPE 2018 pg 37 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
AÇÃO 3: MBA EM “DATA SCIENCE”
UFBA u Especialização em Ciências de Dados e Big Data
http://dsbd.leg.ufpr.br
UFPR u Especialização em Ciências de Dados e Big Data
http://dsbd.leg.ufpr.br
SINAPE 2018 pg 38 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
GRUPO DE PESQUISA
GRUPO DE CIÊNCIA DE DADOS E ESTATÍSTICA
(G-CIDES)
DEPARTAMENTO DE MATEMÁTICA APLICADA E ESTATÍSTICA DEPARTMENTO DE COMPUTAÇÃO
ICMC-USP
AÇÃO 4: GRADUAÇÃO EM “DATA SCIENCE”
SINAPE 2018 pg 39 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
G-CiDES Linhas de pesquisa ü Visualização de dados ü Aprendizado de Máquina ü Mineração de dados ü Modelos estatísticos para Big data Labs ü Estatística ü CER (UFSCar, USP, Saúde, UFBA) ü Visualization, Imaging and Computer Graphics
Lab
SINAPE 2018 pg 40 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
G-CiDES Principal Projeto ü Elaboração de uma proposta de curso/
reformulação de curso de Bacharelado em Estatística, orientado à Ciência de Dados e Estatística
SINAPE 2018 pg 41 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
DISCIPLINAS NO BACHARELADO EM CIÊNCIAS DE DADOS E ESTATÍSTICA
OBRIGATÓRIAS ü Técnicas de Preparação e exploração de dados ü Análise de Regressão e Aprendizagem Supervisionada ü Análise Multivariada e Aprendizagem Não-Supervisionada ü Modelos Lineares Generalizados e Aprendizagem
Supervisionada ü Tópicos em Aprendizado de Máquina ü Séries Temporais e Aprendizado Dinâmico ou outra
Optativa eletiva
SINAPE 2018 pg 42 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
DISCIPLINAS NO BACHARELADO EM CIÊNCIAS DE DADOS E ESTATÍSTICA OPTATIVAS ü Coleta e Manipulação de Dados em Larga Escala ü Mineração Web e de Texto ü Reconhecimento de Padrões utilizando Aprendizado
Profundo ü Inteligência Artificial ü Tecnicas de Aprendizado Dinâmico ü Redes Complexas ü Análise de dados com base em processamento massivo
em paralelo
SINAPE 2018 pg 43 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
CURIOSIDADE – PESQUISA
Pesquisa com mais de 700 cientistas de dados Feito pelo kdnuggets.com (um dos principais portais de ciência de dados)
SINAPE 2018 pg 44 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
CURIOSIDADE – PESQUISA
Fonte: https://www.kdnuggets.com
SINAPE 2018 pg 45 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
Citação
“A dificuldade não está tanto no desenvolvimento de novas ideias, mas como escapar das antigas.”
(John Maynard Keynes)
https://www.youtube.com/watch?t=2&v=unNtmdTLxDU
SINAPE 2018 pg 46 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
MAS NÓS TAMBÉM PRECISAMOS DE DOCENTES ESPECIALIZADOS
ISTO É ASSUNTO PARA UMA OUTRA PALESTRA!
q CONTRATAÇÃO DE DATA SCIENTISTS
q MATEMÁTICO/ESTATÍSTICO COM FORTE FORMAÇÃO
COMPUTACIONAL
q E EXPERIÊNCIA EM ANÁLISE DE DADOS REAIS
SINAPE 2018 pg 47 São Pedro – 24-29/09/2018 Francisco Louzada (USP)
MUITO OBRIGADO!
www.mwstat.com/franciscolouzada