Post on 28-Jan-2019
2
Case Vallourec
G o l d e n B a t c hA n a l y s i s
Líder mundial em soluções tubulares premium, aVallourec assegura a máxima qualidade de seusprodutos através de processos de ponta e rigorosossistemas de avaliação. Neste cenário, a utilização desoluções de machine learning vem como um caminhonatural na busca contínua da excelência na produção.
A G E N D A
Nossa abordagem
1. Histórico
1.1 Fundadores
1.2 Trajetória
1.3 Cases
2. Case Vallourec
2.1 Golden Batch analysis
2.2 Especificação do problema
3. Solução
3.1 Definição e pesquisa
3.2 Desenvolvimento
4. Resultados
4.1 Resumo
4.2 Simulador
Sócios Fundadores
H i s t ó r i c o
4
Felipe Álvares
felipe.alvares@hence-analytics.com
. Chief Data Scientist
. MatemáticoComputacional
. Mestre e Doutor emEstatística (UFMG))
Milton Pifano
milton.pifano@hence-analytics.com
. Senior Data Scientist
. Cientista da Computação
. Mestre e Doutorandoem Estatística (UFMG))
Acreditamos que a educação é o melhor caminho para a inovação.
Trajetória
H i s t ó r i c o
5Sempre de olho no futuro
1998Microsoft
2008 2014 2017 2018
Especialização Mestrado LwD
hence
2012ImageNet Competition
Deep Learning
2016Doutorado
Cases
H i s t ó r i c o
• Estrutuação e limpeza dos dados
• Modelos dinâmicos para previsão de vendas de sementes híbridas de arroz
• Aplicativo Web interativocom segmentação de previsão por região de interese
6Soluções assertivas e personalizadas. De um jeito fácil e descomplicado.
• Incorporação de IA no desenvolvimento de softwares para varejo
• Sistema de recomendaçãode produtos
• Sistema de previsão de vendas
Statistical Learning Otimização Não-Linear Machine Learning Machine Learning
• Golden Batch Analysis• Aplicativo Web interativo
para identificação de fatoresde influência na geração de peças imperfeitas
• Recomendação de configurações ótimas para minimização de erros
• Alocação ótima de recursos de mídia
• Aplicativo Web interativopara a simulação e otimização de cenáriosvariados
Golden Batch
Analysis
C a s e V a l l o u r e c
A ocorrência de defeitos é um fenômeno observado em qualquer linha de produção.
Podem ocorrer por uma combinação imensa de fatores, inviabilizando a identificação por monitoramentos ‘’tradicionais‘’.
Golden Batch
Analysis
C a s e V a l l o u r e c
A ocorrência de defeitos é um fenômeno observado em qualquer linha de produção.
Podem ocorrer por uma combinação imensa de fatores, inviabilizando a identificação por monitoramentos ‘’tradicionais‘’.
E se pudermos sair do tradicional?
Especificação do
problema
C a s e V a l l o u r e c
• Dados de entrada compostos por variáves comotipos de material, níveis de desgaste e parâmetrosde calibragem
• Linha de produção já eficiente faz com que a identificação de defeitos seja um processo de detecção de anomalias
Input
Produção
Classificação
Especificação do
problema
C a s e V a l l o u r e c
• Dados de entrada compostos por variáves comotipos de material, níveis de desgaste e parâmetrosde calibragem
• Linha de produção já eficiente faz com que a identificação de defeitos seja um processo de detecção de anomalias
• Inteligência artificial como instrumento para a identificação de padrões complexos e influentes nageração de defeitos
Input
Produção
Classificação
Classification /
Prediction /
Recommendation
Data Wrangling
Feature
selection
Input
Produção
Classificação
Definição e
Pesquisa
S o l u ç ã o
• Aprendizagem supervisionada• Dados desbalanceados• Ensemble learning
Chandola, Banerjee and Kumar, 2009. Anomaly detection: A survey. ACM computing surveys (CSUR), 41(3), p.15.
Sun, Wong and Kamel, 2009. Classification of imbalanced data: A review. Internation Journal of Pattern Recognition and Artificial Intelligence, 23(04), pp. 687-719.
Menardi and Torelli, 2014. Training and assessing classification rules with imbalanced data. Data Mining and Knowledge Discovery, 28(1), pp.92-122.
Chen and Guestrin, 2016. Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm international conference on knowledge discovery and data mining, pp. 785-794.
Khoshgoftaar, Golawala and Hulse, 2007. An empirical study of learning from imbalanced data using random forests. In 19th IEEE international conference on tools with artificial intelligence, 2, pp. 310-317.
12
Desenvolvimento
S o l u ç ã o
• 31 variáveis de entrada• 4 tipos de erro considerados• Seleção de métricas adequadas para o tratamento
do desbalanceamento• Seleção de modelos• Estratégia de penalização x Balanceamento artificial• Seleção de atributos mais relevantes• Engenharia de atributos
Resultados
S o l u ç ã o
• O modelo demonstrou ótima capacidade de separação nos cenários de teste
• No pior caso, o modelo teria previstoantecipadamente 66,67% da produção defeituosa
• No melhor caso, este percentual teria sido de 83,60%
Pior caso
Sensitividade (recall) 0.6666
Precisão 0.8182
Acurácia (IC 95%) (0.9869, 0.9959)
Melhor caso
Sensitividade (recall) 0.836
Precisão 0.8214
Acurácia (IC 95%) (0.8815, 0.911)
Simulador
S o l u ç ã o
• Aplicativo Web interativo para identificação de fatores de influência na geração de peças imperfeitas