Visita_mar2014_herbário_UPCB

9
RELATÓRIO DE VISITA A HERBÁRIOS DO PARANÁ Período: 10 a 14 de março de 2014 Participantes: Flávia Pezzini (CRIA/INCT-HVFF/REFLORA), curadores, técnicos e bolsistas dos herbários visitados. Financiador: CNPq, Projeto Reflora do Instituto Nacional de Ciência e Tecnologia – Herbário Virtual da Flora e dos Fungos (INCT-HVFF) I. OBJETIVO O objetivo da visita foi conhecer os principais avanços e as principais dificuldades de cada herbário, discutir a qualidade dos dados e realizar uma análise conjunta do relatório dataCleaning disponível no site do CRIA. Essa visita faz parte das atividades para melhoria da qualidade dos dados das coleções participantes do INCT-HVFF e irá auxiliar a traçar a estratégia para os próximos treinamentos e para o material de apoio, além de aprimorar a ferramenta de dataCleaning. Durante os cinco dias, três herbários pertencentes ao INCT foram visitados em duas cidades (Tabela 1). Tabela 1. Herbários visitados no período de 10 a 14 de março de 2014. Herbário Cidade Estado dias de visita Software Acervo 1 IRAI Pinhais PR 1 Brahms 7.3.6 8.530 2 MBM Curitiba PR 3 Brahms 7.2 400.000 3 UPCB Curitiba PR 1 Brahms 5 78.559 Esse relatório apresenta as informações relativas ao herbário UPCB. II. HERBÁRIOS VISITADOS 1. UPCB HERBÁRIO DO DEPARTAMENTO DE BOTÂNICA UNIVERSIDADE FEDERAL DO PARANÁ O acervo conta hoje com cerca de 52.000 amostras de plantas (Angiospermas, Gimnospermas, Pteridófitas, Briófitas, Líquens, Macroalgas em coleções secas, Microalgas em coleções líquidas). Possui uma forte ênfase sobre a Flora do Paraná, mas têm coletas de outros estados do Brasil e exterior. É a segunda maior coleção do estado. O herbário possui programa de permuta com outros herbários no Brasil e exterior, e é utilizado para identificação de plantas por leigos e pesquisadores das áreas taxonômica, ecológica, farmacêutica, agronômica e florestal (Fonte: http://splink.cria.org.br/manager/detail?setlang=pt&resource=UPCB). O UPCB disponibiliza seus dados na rede speciesLink desde 2006, e atualmente mais de 90% do acervo está online (Figura 1), entretanto esse número pode estar superestimado devido a um problema de envio de registros duplicados para a rede: todas as determinações, antigas e novas, estão sendo exportadas como registros separados. O herbário possui somente uma bióloga responsável para gerenciar as coleções de fungos, algas, briófitas, samambaias e licófitas, gimnopermas e angiospermas, cada uma com seu curador,

description

Relatório da visita ao UPCB em março de 2014. O objetivo da visita foi conhecer os principais avanços e as principais dificuldades de cada herbário, discutir a qualidade dos dados e realizar uma análise conjunta do relatório dataCleaning disponível no site do CRIA.

Transcript of Visita_mar2014_herbário_UPCB

Page 1: Visita_mar2014_herbário_UPCB

RELATÓRIO DE VISITA A HERBÁRIOS DO PARANÁ

Período: 10 a 14 de março de 2014 Participantes: Flávia Pezzini (CRIA/INCT-HVFF/REFLORA), curadores, técnicos e bolsistas dos

herbários visitados. Financiador: CNPq, Projeto Reflora do Instituto Nacional de Ciência e Tecnologia – Herbário

Virtual da Flora e dos Fungos (INCT-HVFF)

I. OBJETIVO O objetivo da visita foi conhecer os principais avanços e as principais dificuldades de cada herbário, discutir a qualidade dos dados e realizar uma análise conjunta do relatório dataCleaning disponível no site do CRIA. Essa visita faz parte das atividades para melhoria da qualidade dos dados das coleções participantes do INCT-HVFF e irá auxiliar a traçar a estratégia para os próximos treinamentos e para o material de apoio, além de aprimorar a ferramenta de dataCleaning.

Durante os cinco dias, três herbários pertencentes ao INCT foram visitados em duas cidades (Tabela 1).

Tabela 1. Herbários visitados no período de 10 a 14 de março de 2014.

Herbário Cidade Estado dias de visita Software Acervo

1 IRAI Pinhais PR 1 Brahms 7.3.6 8.530 2 MBM Curitiba PR 3 Brahms 7.2 400.000 3 UPCB Curitiba PR 1 Brahms 5 78.559

Esse relatório apresenta as informações relativas ao herbário UPCB.

II. HERBÁRIOS VISITADOS

1. UPCB – HERBÁRIO DO DEPARTAMENTO DE BOTÂNICA – UNIVERSIDADE FEDERAL DO PARANÁ

O acervo conta hoje com cerca de 52.000 amostras de plantas (Angiospermas, Gimnospermas, Pteridófitas, Briófitas, Líquens, Macroalgas em coleções secas, Microalgas em coleções líquidas). Possui uma forte ênfase sobre a Flora do Paraná, mas têm coletas de outros estados do Brasil e exterior. É a segunda maior coleção do estado. O herbário possui programa de permuta com outros herbários no Brasil e exterior, e é utilizado para identificação de plantas por leigos e pesquisadores das áreas taxonômica, ecológica, farmacêutica, agronômica e florestal (Fonte: http://splink.cria.org.br/manager/detail?setlang=pt&resource=UPCB).

O UPCB disponibiliza seus dados na rede speciesLink desde 2006, e atualmente mais de 90% do acervo está online (Figura 1), entretanto esse número pode estar superestimado devido a um problema de envio de registros duplicados para a rede: todas as determinações, antigas e novas, estão sendo exportadas como registros separados.

O herbário possui somente uma bióloga responsável para gerenciar as coleções de fungos, algas, briófitas, samambaias e licófitas, gimnopermas e angiospermas, cada uma com seu curador,

Page 2: Visita_mar2014_herbário_UPCB

receber material, montar, tombar e distribuir duplicatas, o que acarreta em muito acúmulo de trabalho.

Figura 1. Histórico de movimentação de dados do UPCB, desde sua entrada na rede speciesLink em abril de 2006

Figura 2. Percentual de registros por família no herbário UPCB.

Page 3: Visita_mar2014_herbário_UPCB

Equipe do UPCB

Status de identificação dos dados

Fazendo a busca por registros com valores em branco somente para os campos gênero e espécie e não branco para família, podemos recuperar os registros identificados até família, da mesma forma utilizando as mesmas expressões, podemos recuperar os registros identificados até gênero.

Essa análise resultou em uma superestimação de amostras não identificadas devido ao problema de envio em duplicidade dos dados com determinação atualizada. Quando esse problema for resolvido, essa análise poderá ser feita.

dataCleaning

Durante a visita, foram demonstradas as ferramentas do dataCleaning, ferramenta com a qual o herbário já possui familiaridade e a nova interface de busca no speciesLink. O relatório mostra um perfil dos dados da coleção, com inventários dos nomes científicos, coletores, tipos, países, estados, municípios e sequência dos números de tombo, com os números que não estão sendo utilizados listados (gap). Além disso, mostra registros suspeitos agrupados da seguinte forma: gestão, taxonomia, georreferenciamento e data.

Um conceito importante é o de registro suspeito. Os aplicativos procuram identificar registros que podem ter erros, ou seja, um registro suspeito pode não estar errado. O número de registros suspeitos é sempre muito superior ao número de registros com erros.

Page 4: Visita_mar2014_herbário_UPCB

No site do CRIA, cada um dos itens em verde é clicável e mostra os registros suspeitos para cada grupo, a comparação com outros registros de toda a rede speciesLink e/ou sugestões de preenchimento, que podem ser acatadas ou não pelo curador.

Relatório dataCleaning do Herbário UPCB em 01/04/2014

Gestão

O UPCB apresenta um problema relacionado à exportação: todos os registros que possuem determinação atualizada estão sendo exportados duas vezes para a rede, uma com cada determinação. Os registros com número de catálogo em branco ou repetidos refletem esse problema. Por exemplo, os mais de 4.900 registros com número de catálogo repetido ou em branco na verdade são os nomes antigos que estão sendo exportados como registros independentes e sem número de tombo.

Taxonomia

O sistema faz uma comparação fonética de nomes e apresenta como suspeitos todos os nomes foneticamente iguais com diferentes grafias. Por exemplo, se um herbário possuir 93 registros com o campo família Chrysobalanaceae e 1 registro com o campo família Chrisobalanaceae, o

Page 5: Visita_mar2014_herbário_UPCB

relatório dataCleaning apresenta como resultado 94 registros suspeitos, quando apenas 1 está, de fato, errado.

O item duplicata merece especial atenção, pois possibilita a atualização ou correção de identificação entre duplicatas enviadas para diferentes coleções. Nesse item, para os dados de mesmo número, nome de coletor e data de coleta são comparados os campos gênero + espécie + subespécie entre diferentes coleções e, caso algum especialista tenha visitado alguma dessas coleções e atualizado a identificação, essa atualização é mostrada junto com o nome do determinador e data. O UPCB não possuía registros no item duplicata pois não atualizava os dados há bastante tempo (desde junho de 2013), fato que já foi corrigido.

No UPCB, o elevado número de registros suspeitos para gênero são, na maioria, da coleção de Microalgas. Os registros de microalgas devem ficar separados dos demais, porém ainda não estão identificados, o que torna difícil encontrar uma categoria para separá-los dos demais registros. Enquanto não há uma outra solução, uma sugestão é a coleção armazenar o nome “Microalagas” somente em família ou gênero, e não nos dois, como está feito hoje.

Georreferenciamento

Para os registros georreferenciados, o aplicativo compara os dados relativos aos campos país, estado e município com os dados do IBGE para a coordenada informada. Havendo diferenças, os registros são apresentados como suspeitos. Para cada registro suspeito é disponibilizado um mapa mostrando o ponto informado e os limites do município, estado ou país. É importante entender que esses registros considerados suspeitos são uma sugestão, cabendo ao curador optar pela mudança ou não dos seus dados.

O UPCB possui alguns registros antigos que de fato têm coordenadas imprecisas, e aparecem como registros suspeitos relacionados ao georreferenciamento.

A maioria dos registros com long/lat no mar está com uma das coordenadas iguais a zero e a maioria dos registros que apresenta latitude ou longitude igual a zero possui algum tipo de erro ou caractere especial que não puderam ser lidos pelo sistema no momento da importação. Caracteres que não podem ser lidos são substituídos por zero. Por exemplo, dados com valores de minutos ou segundos maiores que 60 ou símbolos de graus, minutos ou segundos desconfigurados aparecem como zero no sistema. Cada um desses erros são registrados nos registros de logs de erros da coleção quando da importação dos dados e estão disponíveis no Network Manager1 em dados técnicos localizado no combo superior esquerdo e logs de erro, no combo superior direito.

Data

O UPCB apresenta 2 registros com ano de coleta maior do que o ano de atualização e 239 registros apresentam a data de coleta maior do que a data de identificação.

Qualidade dos nomes

Para o UPCB não foi realizada a análise de qualidade dos nomes devido ao problema na exportação dos dados. Todos os nomes antigos que já foram atualizados aparecem na busca, inflando os números para sinônimos ou nomes não encontrados.

Infraestrutura

1 http://splink.cria.org.br/manager/detail?system=&resource=UPCB&setlang=pt

Page 6: Visita_mar2014_herbário_UPCB

Recentemente as caixas antes utilizadas pelo herbário foram substituídas por armários de trilho. Porém os armários não possuem vedação suficiente para impedir a entrada de insetos, que tem danificado algumas exsicatas.

Principais demandas:

O herbário utiliza o software BRAHMS para gerenciamento do banco de dados, porém uma versão muito antiga (BRAHMS 5.6501). A atualização direta para a última versão parece não ser possível. Além disso, foi relatado pela curadora que o sistema operacional da máquina onde o banco fica armazenado não é compatível com a última versão do BRAHMS.

Todos os registros com determinação atualizada estão sendo exportados duplamente para o speciesLink. Ex. Amorim, A.M. 7562, Goldenberg, R. 786.

O herbário possui um arquivo acessório dentro do BRAHMS que armazena informações de grupos taxonômicos. É preciso verificar se esse arquivo pode ser integrado ao banco principal para que seja exportado para o speciesLink.

Todas as amostras de microalgas não têm identificação, sendo referenciadas somente como Microalgas no campo Família ou Gênero. São registros antigos que demandariam um aluno dedicado à identificação.

Page 7: Visita_mar2014_herbário_UPCB
Page 8: Visita_mar2014_herbário_UPCB

Infraestrutura e exemplos de amostras do UPCB

Considerações finais:

As visitas individuais têm se mostrado bastante eficientes para a melhoria da qualidade dos dados dos herbários e para apresentar detalhadamente as ferramentas aos seus usuários. Muitos já haviam visto o relatório dataCleaning em palestras, mas revisar os dados suspeitos no próprio sistema do herbário e consultando as exsicatas in loco facilita o entendimento do sistema e a identificação do passo no qual está ocorrendo o erro: digitação da etiqueta, digitação dos dados etc.

Page 9: Visita_mar2014_herbário_UPCB

Nota-se também que o formulário de busca do speciesLink frequentemente é utilizado aquém da sua capacidade, sendo que a exposição das novidades e dicas de uso durante as visitas é sempre muito bem recebida.

Da mesma forma, ao visualizar os dados de todas as coleções na rede, os técnicos, bolsistas e curadores compreendem melhor a importância da qualidade das informações fornecidas por eles. Esse fato é especialmente relevante quando se trata da qualidade das coordenadas geográficas e da completude das informações taxonômicas.

É notável que os herbários que possuem técnicos ou biólogos, ou seja, funcionários, possuem maior domínio sobre o banco de dados e melhor controle da qualidade dos dados do que herbários que possuem bolsas para tal, pois a constante troca dos bolsistas reflete na continuidade do trabalho.

Em relação às informações taxonômicas, nota-se constante dúvida em relação a qual sistema utilizar, devido as freqüentes mudanças na classificação biológica, principalmente nas hierarquias superiores. Nesse caso, quando a informação não está presente nos listas oficiais (p. ex. Lista da Flora e dos Fungos do Brasil), sugerimos entrar em contato com os especialistas em cada área do próprio herbário. O importante nesse caso é informar qual sistema está seguindo. De maneira geral, foi sugerido o preenchimento ao menos das classificações mais elevadas (Reino, Ordem) que em geral não variam com os diferentes sistemas existentes.

Algumas fontes de dados foram sugeridas, como: Genbank para todos os organismos e Mycobank ou Index Fungorum para fungos.

Campinas, março de 2014.

Flávia Fonseca Pezzini

CRIA