Filtrando dados com inteligência científica

#inteligênciadevalor #valor #inteligência #inteligênciacientífica #produçãocientífica #papers #basesdedadoscientíficas #instituiçõesdepesquisas #pesquisadores

Já vimos que a “competência científica” é algo que se cultiva desde a mais tenra idade. Também vimos que as “instituições de pesquisas” são o segredo para o desenvolvimento de um país. Discorremos então sobre o que é e qual a importância da tal da “inteligência científica”. Mas ficou algo em aberto, uma pergunta cabal: como colocá-la em prática?

Tudo começa com o que chamamos aqui de data mining ou, no universo acadêmico, mais propriamente “vigília informacional”. Deve-se monitorar apenas uma métrica: a produção científica dos pesquisadores e das instituições de pesquisas a que estes são afiliados. Mede-se pelo número de papers publicados em periódicos científicos que, por sua vez, são acessíveis através de bases de dados especializadas.

São as “bases de dados científicas”, portanto, o ponto de partida para todo e qualquer processo de inteligência científica. Não importa se ela é multidisciplinar ou específica, nem tampouco se a sua abrangência é nacional ou internacional. Importante mesmo é saber se é a top of mind na sua linha de pesquisas! Vejamos como isto se dá.   

Seleção das bases de dados científicas

Antes de mais nada, deve-se dispor de uma lista de bases de dados científicas de acesso aberto para validação pela maior produção científica no último ano com as TAGs (ou palavras-chave) mais importantes na sua “pesquisa de interesse” e na principal “pesquisa relacionada”. Vejamos um exemplo prático.

Supondo que você atue como pesquisador dentro de uma indústria farmacêutica, interessado evidentemente na descoberta de novas drogas. Muito possivelmente sua TAG de interesse seria drug candidates e a TAG relacionada drug design. Então, você deve efetuar as buscas pelo abstract (ou título) em cada uma das bases de dados da lista.

Ao final do processo, você deverá selecionar minimamente duas bases: a TOP 1 entre as internacionais e multidisciplinares, bem como a TOP 1 entre as nacionais e específicas. Essa é a melhor maneira de se garantir boa representatividade e abrangência ao mesmo tempo… Neste caso específico (veja abaixo) ficamos com a PubMed e a ScienceDirect.

Figura I. Lista de bases de dados científicas.

Identificando pesquisas relacionadas

Agora, vamos supor que você não soubesse quais são as pesquisas relacionadas com a sua pesquisa de interesse. Como poderias repidamente identificar as mair importantes? As técnicas de text mining são essenciais nesta tarefa e muitas outras… Vamos continuar com o nosso exemplo do pesquisador da indústria farmacêutica.

O primeiro passo é acessar a base de dados TOP 1 selecionada anteriormente (a ScienceDirect, por exemplo) e pesquisar com a TAG da sua pesquisa de interesse (no caso “drug candidates”) no abstract e identificar TAGs de pesquisas relacionadas nos títulos dos resultados dos artigos mais recentes ou mais relevantes.

O próximo passo é descobrir qual o Grau de Correlação (GC) de cada uma das pesquisas relacionadas com a pesquisa de interesse. Basta realizar uma busca simple pelo abstract empregando as duas TAGs ao mesmo tempo e, posteriormente, calcular a contribuição relativa (%) de cada uma delas. Na tabela abaixo pode-se observar facilmente que as drogas anti-inflamatórias são uma pesquisa relacionada bem importante! 

Figura II. Pesquisas relacionadas pelo Grau de Correlação.

Identificando instituições e pesquisadores

Aplicando-se a mesma técnica, é também muito simples para se identificar os pesquisadores e instituições com maiores esforços na pesquisa de interesse ou na pesquisa relacionada. Basta realizar as buscas na mesma base de dados com a TAG no abstract e identificar as instituições e pesquisadores dos resultados mais relevantes.

Então, você deverá repetir a pesquisa combinando a TAG da pesquisa de interesse (no caso drug candidate) pelo abstract ao mesmo tempo com o nome da instituição em affiliation (ex. Pfizer) ou do pesquisador em author (ex. Carlos A.M. Fraga). Após registrar a respectiva produção científica de cada um deles, ordene a lista decrescente para obter o ranking de relevância (figura III). 

Observe que a produção científica mede tão somente o número de papers publicados em determinado período. Não pode ser tomado como uma verdadeira medida do “impacto” das pesquisas na referida área acadêmica. Veremos mais a frente que outros parâmetros devem ser considerados para uma avaliação mais fidedigna para tomada de decisão. De qualquer forma, não deixa de ser um belo indício… Afinal de contas: não é à toa que a gigante da indústria farmacêutica Pfizer está em primeiro lugar e disparado!

Figura III. Instituições e pesquisadores pela produção científica.

§

Vimos, afinal, que filtrar dados com inteligência científica não é um “bicho de sete cabeças”! Longe disso. Não importa qual seja sua pesquisa de interesse e pesquisas relacionadas. Depois de encontrar a base de dados científica mais apropriada, usando técnicas muito simples para realizar as buscas, você estará a um passo de obter as informações de que precisa para decidir com sucesso o rumo das suas pesquisas…

Imagine quão mais produtivo e efetivo você seria como pesquisador, independente da afiliação, se constantemente avaliasse as bases de dados científicas, identificando sempre novas oportunidades de investigação, bem como um “farol” sobre as instituições de pesquisas e pesquisadores de excelência em cada uma delas? Veremos então como ir além.

Créditos:

Autoria por Ricardo Barreto

Obra no prelo: INTELIGÊNCIA DE VALOR: boas decisões sempre

Gostou? Mãos ao BUZZ nas redes!