Apresentao do PowerPoint
Vocabulrios controlados na descrio de dados de investigao no DendroYulia [email protected] de Engenharia da Universidade do Porto/ INESC TEC
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Boa tarde a todos, o meu nome Yulia e fao parte de grupo de investigadores ligados a gesto de dados de investigao na Universidade do Porto.
2
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Com aumento da reutilizao dos dados de investigao a gesto de dados cada vez mais valorizada. Metadados neste contexto tem um papel fundamental, pois dados com descrio mais detalhada so mais fceis de interpretar e reutilizar.
Mas o processo da descrio de dados exigente e demorado e pode desmotivar os investigadores na descrio de dados.
3
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016A falta de tempo, ferramentas adequadas, conhecimentos tambm complicam a descrio de dados.
Por isso importante fornecer as ferramentas que simplificam o processo de criao de metadados.
4
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Reconhecendo essas dificuldades, estamos a desenvolver a plataforma Dendro, que ajuda na organizao e documentao dos dados.
5
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016O Dendro consiste numa interface web e facilita a descrio dos dados com a utilizao de vrios esquemas de metadados existentes, por exemplo Dublin Core,
E tambm descritores criados para domnios de investigao especficos, como por exemplo Produo de Hidrognio.
6
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Os objetivos do meu trabalho sa:simplificar e normalizar a descrio de dados na plataforma Dendro.De forma a motivar o interesse dos investigadores na organizao dos seus dados. Contribuir para melhoria da qualidade dos metadados
7
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Neste contexto os vocabulrios controlados apresentam-se como uma boa ferramenta, porque podem definir o contedo admissvel para cada descritor, contribuindo assim para a simplificao de introduo de conteudo e controlo de qualidade.
8
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Colaborao com investigadores muito importante. Pois, s eles podem indicar quais descritores e quais conceitos para vocabulrios lhes faam mais sentido e quais so mais utilizveis, assim ajudando a modelar as ontologias.
9Produo de Hidrognio
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016O primeiro dos projetos selecionados como caso de estudo o pequeno grupo de investigadores de dominio de Produo de Hidrognio que partilharam os seus dados atravs de email e guardaram os nos discos externos.
10
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Durante entrevistas com investigadores foram identificados as necessidades e dificuldades deste grupo na gesto dos dados. Assim foram definidos os descritores para este domnio, criada ontologia, implementada no Dendro e realizada uma srie de experiencias da descrio de dados.
11
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Os resultados mostraram existncia dos erros sintticas e gramaticais, descrio incompleta, tal por exemplo Ovoid e Egg Reactor o mesmo tipo de reactor, mas essa descrio incompleta pode dificultar interpretao e reutilizao dos mesmos.
12
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Para diminuir os erros e ter descrio mais completa, em conjunto com os investigadores foram escolhidos os descritores para criao de vocabulrios controlados e definidos os conceitos para determinado descritor.
13
Annotation Property
hasAlternative
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Analisando vrios estudos e exemplos de ontologias com vocabulrios controlados decidiu-se modelar os atravs de Annotation Property. Foi criada has Alternative que uma das alternativas possveis para o valor de um descritor como conceito de vocabulrio controlado.
14
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Aps a implementao da ontologia, os descritores com vocabulrios controlados apaream no Dendro de forma de listas de escolhas com conceitos definidos.
Assim o investigador abrindo a lista de vocabulrios controlados, pode com facilidade escolher o conceito certo para a descrio dos seus dados.
15
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Para avaliao de qualidade de descrio, baseamos na literatura e escolhemos as mtricas mais apropriados ao nosso estudo e realizamos srie de analises: uma sem uso de vocabulrios controlados, outro com uso dos mesmos.
16
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016A comparao dos resultados de anlises mostra que a maioria dos valores aplicando as mtricas definidas subiram.
Por exemplo, o valor de qualidade de metadados de descritor Reactor Type, aplicando a mtrica Correctness passou de 28% para 100%.
17
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016No geral podemos dizer que a qualidade da descrio aps a implementao dos vocabulrios controlados melhorou.
As experincias deixaram os investigadores satisfeitos com a usabilidade da plataforma. Contudo,
18
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016os investigadores afirmaram que a utilizao de vocabulrios controlados facilitou o processo da descrio.
Utilizando praticamente a mesma quantidade de descritores tempo da tarefa da descrio diminuiu.
19
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Baseando nestes resultados podemos afirmar que os objetivos foram alcanados.
A descrio efetuada com uso de vocabulrios controlados simplificou todo o processo de criao de metadados, permitiu obter descries mais completas e corretas, sem o aumento do tempo necessrio para o efeito.
20exemplo:Expresses Regulares
Annotation Property hasRegEx hasErrorMessage
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Uma das perspetivas de trabalho futuro elaborao de expresses regulares, que tambm pode reduzir o esforo manual na introduo da informao e ajudar na qualidade de dados.
21Muito obrigada!
Dados de investigaoMetadadosDendroMotivao de investigadoresDesafios na gesto de dados de investigaoVocabulrios controladosSimplificao de processo de descrioQualidade de metadados
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Alem disto, vamos continuar colaborar e realizar mais experiencias com investigadores de outros domnios, obtendo assim mais informao que ajuda nos continuar melhorar o Dendro e essa colaborao ajuda familiarizar e aumentar interesse dos investigadores nas atividades, ligadas ao gesto de dados de investigao.
Muito obrigada.
Top Related