Google lança nova ferramenta de busca para dados científicos

Por: revistaamazonia.com.br

Voltada especialmente para a comunidade acadêmica, uma nova ferramenta de busca lançada pela Google promete facilitar o acesso de pesquisadores a conjuntos de dados científicos que atualmente estão pulverizados em milhares de repositórios online mantidos por instituições de pesquisa.

Lançada em setembro, a ferramenta, chamada Dataset Search, ajuda pesquisadores a encontrar facilmente os dados completos de estudos disponíveis em repositórios dos mais variados tipos – como sites de editoras, agências governamentais e instituições de pesquisa, em bibliotecas digitais e em páginas pessoais de cientistas, por exemplo.

A empresa já havia lançado um serviço voltado para a comunidade científica, o Google Scholar – em português Google Acadêmico –, que é uma ferramenta de busca de artigos e relatórios de pesquisa. Havia demanda, porém, para um sistema de busca específico para dados, já que, segundo a empresa, “no mundo atual, cientistas de muitas disciplinas e um número crescente de jornalistas vivem e respiram dados” e eles estão dispersos na internet.

Bons resultados

A nova ferramenta será de grande importância para a ciência, especialmente em áreas que utilizam grandes volumes de dados, segundo o professor Marcelo Finger, chefe do Departamento de Ciências da Computação do Instituto de Matemática e Estatística (IME) da Universidade de São Paulo (USP).

“É surpreendente que a Google, que lida com um público da ordem de bilhões de usuários, lance mais uma ferramenta voltada para a comunidade científica, que é um público numericamente limitado. Mas ela será sem dúvida muito importante para a comunidade”, disse Finger.

Convidado por Direto da Ciência para testar o Dataset Search, Finger – que é um dos coordenadores da área de Ciência e Engenharia da Computação da Fapesp – considerou a ferramenta útil para aumentar a disponibilidade de dados.

“Fiquei bem impressionado e cheguei a recomendar para um aluno. Ainda há algumas limitações – notei, por exemplo, que quando se faz uma busca só aparecem os dez primeiros resultados. Mas, do ponto de vista científico, para quem desenvolve trabalhos com bases em dados, já é muito útil. A disponibilidade de dados é fundamental para a ciência, porque permite elevar o grau de reprodutibilidade das pesquisas”, disse Finger.

Maior disponibilidade de dados

O pesquisador diz acreditar que o Dataset Search crescerá rapidamente. “Quem possui dados de pesquisa em um repositório, ou é responsável por uma biblioteca de dados online, vai se interessar por tornar seus dados mais disponíveis e por indexá-los na ferramenta”, afirmou.

Natasha Noy, pesquisadora em inteligência artificial da Google, divulgou que a empresa estimulará fornecedores de dados a adotarem o padrão aberto desenvolvido pela empresa para descrever as informações relacionadas a seus dados, aos metadados e à própria instituição que os produziu.

“Desenvolvemos diretrizes para que os fornecedores de conjuntos de dados descrevam seus dados de uma forma que o Google possa entender melhor o conteúdo das páginas: quem criou, quando foi publicado, como os dados foram coletados, quais são os termos de uso, etc.”, disse a pesquisadora no Blog da Google.

“Notei que, além de dar acesso aos conjuntos de dados, a ferramenta também indica artigos da literatura científica que mencionam, utilizam, ou descrevem esses dados. Acredito que será de grande utilidade em todas as áreas do conhecimento – biologia, linguística, física, oceanografia e assim por diante. Minha área de pesquisas, em processamento de linguagem natural, vai se beneficiar muitíssimo”, afirmou Finger.

Segundo Natasha Noy, a ferramenta foi lançada com foco em dados de ciência ambiental, ciências sociais e de pesquisa governamental, mas a quantidade de conjuntos de dados disponível aumentará continuamente à medida que o serviço se torne mais popular.

“Esse tipo de busca tem sido um sonho para muitos pesquisadores nas comunidades de dados abertos de ciência”, disse ao blog da Google o chefe da área de dados da agência Administração Oceânica e Atmosférica Nacional dos Estados Unidos (NOAA, na sigla em inglês), Ed Kearns.

“Para a NOAA, cuja missão inclui o compartilhamento de nossos dados com outros cientistas, essa ferramenta é chave para que tornemos nossas informações mais acessíveis para uma comunidade de pesquisadores cada vez maior”, disse Kerns.

COMPARTILHAR