BIREME/OPAS/OMS

Desenvolvimento de Fontes de Informação

DeCS – Descritores em Ciências da Saúde

 

Projeto DeCS-Non-Print Entry Terms

 

Introdução

 

Este documento descreve o projeto DeCS non-print entry terms para ampliação da recuperabilidade e navegabilidade conceitual das fontes de informação científico-técnicas da Biblioteca Virtual em Saúde indexadas com descritores DeCS. A terminologia em questão existe hoje no MeSH em inglês e com este projeto também fará parte do componente integrador da BVS que é o DeCS – Descritores em Ciências da Saúde.

 

Conceito

 

Non-print entry terms são um tipo de termos existentes no campo de sinônimos (“see” cross references) do MeSH que não aparecem no MeSH Alfabético impresso, ou seja, são sinônimos extras. Na base MeSH em formato ASCII, estes sinônimos se encontram no campo ENTRY e são denominados non-print entry terms, em oposição aos PRINT ENTRY terms, e que são encontrados no DeCS desde o seu ínicio. No MeSH e DeCS 2003 existem 23,515 print entry terms e com este projeto, o DeCS passará a conter também os 103,436 non-print entry terms.

 

 

Antecedentes e justificativa

 

Até recentemente, a limitação de capacidade dos discos rígidos, do tamanho de registros e campos, impediu que a base DeCS contivesse todos os campos da base MeSH, que a primeira via triplicada o número de campos para os descritores, sinônimos, definições e notas de indexação ao traduzí-los ao espanhol e português. Agora que esta restrição em grande parte não existe, nos vemos na possibilidade de melhorar a eficácia do DeCS como componente integrador das fontes da BVS para fontes indexadas tradicionalmente e automaticamente (exemplo: projeto Collexis).

 

 

Objetivo geral

 

Este projeto visa facilitar a recuperação da informação científico-técnica em saúde indexada na BVS com a terminologia DeCS por meio de um aumento no número de sinônimos na ordem de 400 por cento.

 

 

Objetivo específico

 

O projeto visa permitir que o usuário da BVS utilize um número bastante superior de termos que o atual para na busca da informação utilizando o índice descritor de assunto, como é possível ao usuário do PubMed que utiliza o vocabuário MeSH. Além disso, no caso da BVS, que utiliza o DeCS, este número será ainda maior pois grande parte destes termos serão traduzidos ao espanhol e português.

 

 

Etapas

 

I)                  Carregamento dos non-print Entry Terms

 

Incluir Non-Print Entry Terms (campo 23 do MESH completo em formato ISIS) entre os sinônimos do DeCS (no campo 50, que é o campo de sinônimos, marcando-o com o subcampo ^m.  Posteriormente, com o DeCS XML, estarão no tag <Terms >, PrintFlagYN *, IsPermutedTermYN *;

 

II)               CASO 1 - duplicações ortográficas identificáveis e solucionáveis automaticamente

 

CASO 1A - Check automático de duplicação ortográfica entre non-print entry terms vs sinônimos extras BIREME em inglês

-   encontrar no DeCS os registros MeSH (os que contêm v480) que possuem sinônimos com ^m (marcação para non-print entry terms) e que também possuem sinônimos em inglês com subcampo ^t (marcação para sinônimos extras BIREME, muitos destes possuirão também traduçoes espanhol (^e) e/ou português (^p); (elimina alguns casos que não necessitarão de tradução)

-   nestes registros acima, identificar dentre os sinônimos extras BIREME em inglês aqueles que duplicam com os Non-print entry terms;

 

Acerto/adequação

-   automaticamente ou, não sendo possível, manualmente, eliminar a duplicação e relocar as traduções para aquele Entry causador da duplicação;

 

CASO 1B - Check automático de duplicação ortográfica entre todas as palavras constituintes dos non-print entry terms vs todas as palavras constituindes dos 211 sinônimos extras BIREME em inglês (campo 50^i que contêm ^t) e vs 25000 sinônimos MeSH (registros que contêm v480 e que contêm  campo 50^i e que não contêm ^m e que não contêm ^t) excluindo vírgulas.(elimina grande número de casos que não necessitarão de tradução)

 

Acerto/adequação

- automaticamente, incluir um subcampo ^nN após a ocorrência do ENTRY term, e não listando estes para tradução.

 

III)            CASO 2 – possíveis duplicações conceituais identificáveis/solucionáveis manualmente

 

Registros com Entry terms e sinônimos extras que não duplicam

 

CASO 2A - Check automático de não-duplicação ortográfica Entry vs sinônimos extras BIREME em inglês

-   encontrar no DeCS os registros MeSH (os que contêm v480) que possuem sinônimos com ^m (marcação para non-print entry terms) e que também possuem sinônimos em inglês com subcampo ^t (marcação para sinônimos extras BIREME, muitos destes possuirão também traduções espanhol (^e) e/ou português(^p); (intersecção entre 104000 entries e 211 Ups extras em inglês.)

-   nestes registros acima, identificar dentre os sinônimos extras BIREME em inglês aqueles que não duplicam com os Non-print entry terms (se este passo for efetuado após o passo anterior, nenhum caso de duplicação será encontrado e todo o resultado deste passo será de interesse

-   geração de listagem do CASO 2A que entrará no bloco de listagens quando da tradução dos non-print entry terms;

 

CASO 2B – Registros DeCS com non-print Entry terms e sinônimos extras BIREME sem inglês

 

-   indentificação de Entry * sinônimos extras BIREME sem inglês - encontrar no DeCS os registros MeSH (os que contêm v480) que possuem sinônimos com ^m (non-print entry terms) e que também possuem ocorrências de sinônimos que não possuem inglês ou que possuem ^t, ou seja, sinônimos que não são do MeSH (extras BIREME sem inglês);

-   geração de listagem do CASO 2B que entrará no bloco de listagens para tradução dos non-print entry terms

 

IV)             CASO 3 – Registros DeCS com non-print entry terms, sem sinônimos extras BIREME

 

CASO 3A – Registros DeCS com non-print entry terms, sem sinônimos extras BIREME, com sinônimos MeSH (print entry terms)

 

- Geração de listagem para tradução

 

CASO 3B - Registros DeCS com non-print entry terms, sem sinônimos extras BIREME, sem sinônimos MeSH (print entry terms)

 

- Geração de listagem para tradução

 

 

V)                Tradução dos non-print Entry Terms

 

Análise da listagem gerada para o CASO 2A

 

-   visualmente, verificar se as traduções existentes nos sinônimos extras BIREME se adequam melhor a algum dos Non-print entry terms existentes no mesmo registro e se for o caso, transferí-lo com cut/paste de acordo;

 

Análise da listagem gerada para o CASO 2B

 

-  visualmente, verificar das ocorrências de sinônimos extra espanhol e/ou português que não contêm inglês aquele(s) sinônimo(s) que se adequariam como traduções de algum non-print entry term, transferindo-o(s) para .

 

Análise da listagem gerada para o CASO 3A

 

Análise da listagem gerada para o CASO 3B

 

 

 

VI)             Orçamento

 

Cálculo aproximado para os Non-Print Entry Terms, com base nos números relativos ao projeto Notas de escopo, recém-concluído:

 

                    17.000 notas – 11 pessoas -  3 meses (projeto Notas)

 

Se fossem 104.000 notas

 

                   104.000 notas – 67 pessoas          -  3 meses (projeto Notas)

 

Considerando que um UP demore para traduzir que um ENTRY term, e que o tempo desejado é de 1 ano ao invés de 3 meses,

 

                   104.000 ENTRIES   – 17 pessoas - 12 meses (projeto Entry)

 

Contacto com os 11 tradutores que participaram no projeto Notas de escopo. Busca de outros 6 tradutores.

 

Valor sugerido: R$0,50/ENTRY. Total: R$ 51.700,00.

 

Cada tradutor ficaria com aproximadamente 6.100 ENTRIES.

 

Obs.: os CASOS 1A e 1B irão diminuir este número pois, como mencionamos, muitos ENTRY terms receberão um subcampo N (não traduz) pois duplicarão com UPs extras hoje existentes no DeCS e com UPs MeSH cujas palavras integrantes do termo são as mesmas mas escritas em ordem diversa (com e sem vírgula)

 

Exemplo caso 1B:

 

Descritor: Mammary Neoplasms, Experimental

Non-Print Entry Term: Experimental Mammary Neoplasms

Non-Print Entry Term: Neoplasms, Experimental Mammary

 

Os dois Non-Print Entry Terms receberão automaticamente o subcampo ^nN