Desafios de big data para gestão em doenças negligenciadas ...ºbia Boechat - Desafios... ·...

1
C. Lynch, Big data: How do your data grow?, Nature, vol. 455, no 7209, p. 2829, set. 2008. C. M. Morel, S. J. Serruya, G. O. Penna, e R. Guimarães, Co-authorship Network Analysis: A Powerful Tool for Strategic Planning of Research, Development and Capacity Building Programs on Neglected Diseases, PLoS Negl. Trop. Dis., vol. 3, no 8, p. e501, ago. 2009. J. Scott e P. J. Carrington, Handbook of Social Network Analysis. SAGE, 2011. J. S. Brownstein, C. C. Freifeld, B. Y. Reis, e K. D. Mandl, Surveillance Sans Frontières: Internet- Based Emerging Infectious Disease Intelligence and the HealthMap Project, Plos Med., vol. 5, no 7, p. e151, 2008. McKinsey Global Institute. Big Data: The Management Revolution. Harvard Business Review, 2011. Quoniam, L, Lucien, A, Intelligence compétitive 2.0: organisation, innovation et territoire. France: Librairie Lavoisier, 2010. Desafios de big data para gestão em doenças negligenciadas: um estudo de dengue na rede social twitter pela abordagem 2.0 1,2,3 Jorge L Magalhães; 3,4 Luc Quoniam; 2 Núbia Boechat 1 FIOCRUZ/Farmanguinhos. Deptº Síntese. Área Gestão e Inovação Tecnológica 2 Aix-Marseille Université – Institut de Recherches en Sciences de l'Information et de Communication 3 Bolsista Capes pós-doutorado 12.298. 4 Universidade Nove de Julho – UNINOVE, São Paulo. Contato: [email protected] A velocidade da geração de dados no século 21 é praticamente instantânea devido a big data 1 . Assim, a questão é ter habilidade para extrair, analisar e converter os 2,5 quintilhões (2.5×1018) de dados gerados diariamente no mundo (McKinsey Global Institute, 2011). Os serviços online e mídia social têm gerado quantidades de informações a baixo custo e sem precedentes na história. Considerando uma economia global e integrada, é imperativo que os gestores busquem dados cada vez mais precisos para tomada de decisão. Assim, é salutar adaptar-se constantemente nesse novo contexto mundial (Quoniam, 2010). Na saúde, melhores condições de vida e ações de saúde pública estão na agenda mundial e se agravam quando 80% da população mundial negligenciada vive em países de baixa ou média renda, não tendo acesso aos medicamentos essenciais (WHO, 2010), e intensifica- se com doenças que perpetuam essas condições da pobreza, como dengue, malária etc. (Morel et al, 2005). Melhorar a saúde das populações mais pobres depende do desenvolvimento e implantação de variedades de inovações em saúde, aos quais incluem novos medicamentos, dispositivos, diagnósticos e tecnologias em engenharia de processos e manufatura, novas abordagens de gestão, software e políticas em sistemas de saúde. Assim, a internet tem se tornado fundamental para leigos e profissionais da saúde (Brownstein et al, 2008) AGRADECIMENTOS CONCLUSÃO INTRODUÇÃO BIBLIOGRAFIA RESULTADOS E DISCUSSÃO Identificar o big data na área da saúde e algumas ferramentas do conceito web 2.0. A doença dengue foi usada como demonstração no estudo de caso. É realidade o uso do big data na saúde. Portanto, há necessidade de aliar ferramentas 2.0 a fim de melhor entender e adaptar-se às interações das novas abordagens de tecnologias, como por exemplo, as redes sociais. De tal modo, usá-las como método para antever a identificação e análise de doenças e prover ações de saúde pública. OBJETIVOS Assim, dos 150 documentos essenciais obtidos, observa-se a formação de 37 clusters dispostos em cores, sendo que17 tratam do ‘impacto’ sobre o tema pesquisado, 14 associados à dengue, 5 câncer etc. Essa abordagem facilita a visualização e o resgate dos principais documentos na área. O termo ‘big data’ se relaciona em dados com o termo ‘saúde’ em 43% na internet. De acordo com o Twitter Statistics há 550 milhões de usuários no twitter e emitem, em média, 58 milhões de tweets/dia. As nações TOP 5 usuárias são EUA, Brasil, Japão, UK e Indonésia. A figura 2 demonstra uma rede de pessoas do twitter comentando sobre dengue durante o mês de março/2013 no Rio de Janeiro. No software, há possibilidade de clicar nos pontos e identificar a pessoa e o que a mesma comenta. A concentração de pontos pretos indica a quantidade maciça de twitter em determinado local e suas respectivas interligações (retweets). Esse cenário indicaria um possível surto de casos Figura 1: Cluster sobre doenças negligenciadas no PubMed. Dados obtidos sobre doenças, saúde, pesquisas etc., podem ser identificados não somente em abordagens tradicionais, mas também em diversos canais da Web. Devido a existência do big data, a dificuldade é estudar essa gama de informações. Um caminho é o uso de ferramentas colaborativas 2.0 (Lynch, 2008). Existem 55700 documentos sobre doenças negligenciadas e dengue na busca pelo software Carrot®. Ao aplicar data miner e restringir com correlações mais consistentes dentro do PubMed, reduz-se a pesquisa em 97,3% (figura 1). Figura 2: Rede de tweets e retweets sobre dengue. de dengue. Outro exemplo, é o ponto vermelho e suas ramificações, porém em escala menor. Nessa abordagem, a possibilidade de um observatório de saúde focado em redes sociais poderia contribuir no sentido de munir os gestores de vigilância epidemiológica com dados em tempo real, possibilitando ações de saúde pública ágil a fim de conter endemias. 1 Volume de dados criados diariamente pela sociedade e cada vez maiores excedendo a capacidade das tecnologias atuais poderem trata-los adequadamente (McKinsey, 2010).

Transcript of Desafios de big data para gestão em doenças negligenciadas ...ºbia Boechat - Desafios... ·...

Page 1: Desafios de big data para gestão em doenças negligenciadas ...ºbia Boechat - Desafios... · formação de 37 clusters dispostos em cores, sendo que17 tratam do ‘impacto’ sobre

• C. Lynch, Big data: How do your data grow?, Nature, vol. 455, no 7209, p. 28–29, set. 2008.

• C. M. Morel, S. J. Serruya, G. O. Penna, e R. Guimarães, Co-authorship Network Analysis: A

Powerful Tool for Strategic Planning of Research, Development and Capacity Building

Programs on Neglected Diseases, PLoS Negl. Trop. Dis., vol. 3, no 8, p. e501, ago. 2009.

• J. Scott e P. J. Carrington, Handbook of Social Network Analysis. SAGE, 2011.

• J. S. Brownstein, C. C. Freifeld, B. Y. Reis, e K. D. Mandl, Surveillance Sans Frontières: Internet-

Based Emerging Infectious Disease Intelligence and the HealthMap Project, Plos Med., vol. 5,

no 7, p. e151, 2008.

• McKinsey Global Institute. Big Data: The Management Revolution. Harvard Business Review, 2011.

• Quoniam, L, Lucien, A, Intelligence compétitive 2.0 : organisation, innovation et territoire.

France: Librairie Lavoisier, 2010.

Desafios de big data para gestão em doenças

negligenciadas: um estudo de dengue na rede social

twitter pela abordagem 2.0 1,2,3Jorge L Magalhães; 3,4Luc Quoniam; 2Núbia Boechat 1FIOCRUZ/Farmanguinhos. Deptº Síntese. Área Gestão e Inovação Tecnológica

2Aix-Marseille Université – Institut de Recherches en Sciences de l'Information et de Communication 3Bolsista Capes pós-doutorado 12.298. 4Universidade Nove de Julho – UNINOVE, São Paulo.

Contato: [email protected]

A velocidade da geração de dados no século 21 é praticamente

instantânea devido a big data1 . Assim, a questão é ter habilidade para

extrair, analisar e converter os 2,5 quintilhões (2.5×1018) de dados

gerados diariamente no mundo (McKinsey Global Institute, 2011).

Os serviços online e mídia social têm gerado quantidades de

informações a baixo custo e sem precedentes na história. Considerando

uma economia global e integrada, é imperativo que os gestores

busquem dados cada vez mais precisos para tomada de decisão. Assim,

é salutar adaptar-se constantemente nesse novo contexto mundial

(Quoniam, 2010).

Na saúde, melhores condições de vida e ações de saúde pública

estão na agenda mundial e se agravam quando 80% da população

mundial negligenciada vive em países de baixa ou média renda, não

tendo acesso aos medicamentos essenciais (WHO, 2010), e intensifica-

se com doenças que perpetuam essas condições da pobreza, como

dengue, malária etc. (Morel et al, 2005).

Melhorar a saúde das populações mais pobres depende do

desenvolvimento e implantação de variedades de inovações em saúde,

aos quais incluem novos medicamentos, dispositivos, diagnósticos e

tecnologias em engenharia de processos e manufatura, novas

abordagens de gestão, software e políticas em sistemas de saúde.

Assim, a internet tem se tornado fundamental para leigos e profissionais

da saúde (Brownstein et al, 2008)

AGRADECIMENTOS

CONCLUSÃO

INTRODUÇÃO

BIBLIOGRAFIA

RESULTADOS E DISCUSSÃO

Identificar o big data na área da saúde e algumas ferramentas do

conceito web 2.0. A doença dengue foi usada como demonstração no

estudo de caso.

É realidade o uso do big data na saúde. Portanto, há necessidade

de aliar ferramentas 2.0 a fim de melhor entender e adaptar-se às

interações das novas abordagens de tecnologias, como por exemplo, as

redes sociais. De tal modo, usá-las como método para antever a

identificação e análise de doenças e prover ações de saúde pública.

OBJETIVOS

Assim, dos 150 documentos essenciais obtidos, observa-se a

formação de 37 clusters dispostos em cores, sendo que17 tratam do

‘impacto’ sobre o tema pesquisado, 14 associados à dengue, 5 câncer

etc. Essa abordagem facilita a visualização e o resgate dos principais

documentos na área.

O termo ‘big data’ se relaciona em dados com o termo ‘saúde’ em

43% na internet. De acordo com o Twitter Statistics há 550 milhões de

usuários no twitter e emitem, em média, 58 milhões de tweets/dia. As

nações TOP 5 usuárias são EUA, Brasil, Japão, UK e Indonésia.

A figura 2 demonstra uma rede de

pessoas do twitter comentando sobre

dengue durante o mês de março/2013

no Rio de Janeiro.

No software, há possibilidade de

clicar nos pontos e identificar a pessoa

e o que a mesma comenta. A

concentração de pontos pretos indica

a quantidade maciça de twitter em

determinado local e suas respectivas

interligações (retweets). Esse cenário

indicaria um possível surto de casos

Figura 1: Cluster sobre doenças negligenciadas no PubMed.

Dados obtidos sobre doenças, saúde, pesquisas etc., podem ser

identificados não somente em abordagens tradicionais, mas também em

diversos canais da Web. Devido a

existência do big data, a dificuldade

é estudar essa gama de

informações. Um caminho é o uso

de ferramentas colaborativas 2.0

(Lynch, 2008). Existem 55700

documentos sobre doenças

negligenciadas e dengue na busca

pelo software Carrot®. Ao aplicar

data miner e restringir com

correlações mais consistentes

dentro do PubMed, reduz-se a

pesquisa em 97,3% (figura 1).

Figura 2: Rede de tweets e retweets sobre dengue.

de dengue. Outro exemplo, é o ponto vermelho e suas ramificações,

porém em escala menor.

Nessa abordagem, a possibilidade de um observatório de saúde

focado em redes sociais poderia contribuir no sentido de munir os

gestores de vigilância epidemiológica com dados em tempo real,

possibilitando ações de saúde pública ágil a fim de conter endemias.

1Volume de dados criados diariamente pela sociedade e cada vez maiores excedendo a

capacidade das tecnologias atuais poderem trata-los adequadamente (McKinsey, 2010).