BIREME/OPAS/OMS
Desenvolvimento de Fontes de Informação
DeCS – Descritores em Ciências da Saúde
Projeto DeCS-Non-Print Entry Terms
Introdução
Este documento descreve o projeto DeCS
non-print entry terms para ampliação da recuperabilidade
e navegabilidade conceitual das fontes de informação científico-técnicas da Biblioteca Virtual em Saúde indexadas com descritores DeCS. A terminologia em questão já existe hoje no MeSH em inglês e com este projeto também fará parte do componente integrador da BVS que é o DeCS – Descritores em Ciências da Saúde.
Conceito
Non-print entry terms são um tipo de termos existentes
no campo de sinônimos (“see” cross
references) do MeSH que não aparecem no MeSH Alfabético impresso,
ou seja, são sinônimos extras. Na base MeSH em formato ASCII, estes sinônimos se encontram
no campo ENTRY e são denominados
non-print entry terms, em oposição aos PRINT
ENTRY terms, e que já são encontrados
no DeCS desde o seu ínicio. No
MeSH e DeCS 2003 existem 23,515 print entry terms e com este
projeto, o DeCS passará a conter também os 103,436 non-print entry terms.
Antecedentes e justificativa
Até recentemente, a limitação de capacidade dos discos rígidos, do tamanho de registros e campos, impediu que a base DeCS
contivesse todos os campos da base MeSH, já que a primeira via triplicada o
número de campos para os
descritores, sinônimos, definições e notas de indexação ao
traduzí-los ao espanhol e português. Agora que esta restrição em grande parte já não existe, nos vemos na possibilidade de melhorar a eficácia do DeCS como componente integrador
das fontes da BVS para fontes indexadas
tradicionalmente e automaticamente (exemplo: projeto Collexis).
Objetivo geral
Este projeto visa facilitar a recuperação da informação
científico-técnica em saúde indexada na BVS com a terminologia DeCS por meio de um aumento no número de sinônimos na ordem de 400 por cento.
Objetivo específico
O projeto visa permitir que o usuário da BVS
utilize um número bastante superior de termos que o atual para na busca da informação utilizando o
índice descritor de assunto, como já é possível ao usuário do PubMed que utiliza o
vocabuário MeSH. Além disso, no caso da BVS, que utiliza o
DeCS, este número será ainda maior pois grande parte destes termos serão traduzidos
ao espanhol e português.
Etapas
I)
Carregamento dos non-print Entry Terms
Incluir Non-Print
Entry Terms (campo 23 do MESH completo em formato ISIS) entre os sinônimos do DeCS (no campo 50, que é o campo de sinônimos, marcando-o com o subcampo
^m. Posteriormente, com o DeCS XML,
estarão no tag <Terms >, PrintFlagYN *, IsPermutedTermYN *;
II)
CASO 1 - duplicações ortográficas identificáveis e solucionáveis
automaticamente
CASO
1A - Check automático de duplicação ortográfica entre non-print entry terms vs sinônimos extras BIREME em
inglês
-
encontrar no DeCS os registros MeSH (os que contêm v480)
que possuem sinônimos com ^m (marcação para non-print
entry terms) e que também possuem sinônimos em inglês com subcampo ^t
(marcação para sinônimos extras BIREME, muitos destes
possuirão também traduçoes espanhol (^e) e/ou português (^p); (elimina alguns casos que não necessitarão de tradução)
-
nestes registros acima, identificar dentre os sinônimos extras BIREME em inglês aqueles que
duplicam com os Non-print entry
terms;
Acerto/adequação
-
automaticamente ou, não sendo possível, manualmente, eliminar a duplicação e relocar as traduções para aquele Entry causador da duplicação;
CASO
1B - Check automático de duplicação ortográfica entre todas as palavras constituintes dos non-print entry terms vs todas as palavras constituindes dos 211 sinônimos extras BIREME em
inglês (campo 50^i que contêm ^t) e vs 25000 sinônimos MeSH (registros que contêm v480 e que
contêm campo 50^i e que
não contêm ^m e que
não contêm ^t) excluindo vírgulas.(elimina grande número de casos que não necessitarão de tradução)
Acerto/adequação
-
automaticamente, incluir
um subcampo ^nN após
a ocorrência do ENTRY term, e não
listando estes para tradução.
III)
CASO 2 – possíveis duplicações conceituais identificáveis/solucionáveis manualmente
Registros com Entry terms e sinônimos extras que não duplicam
CASO
2A - Check automático de não-duplicação
ortográfica Entry vs sinônimos extras BIREME em inglês
- encontrar no DeCS os registros MeSH (os que contêm v480)
que possuem sinônimos com ^m (marcação para non-print
entry terms) e que também possuem sinônimos em inglês com subcampo ^t
(marcação para sinônimos extras BIREME, muitos destes
possuirão também traduções espanhol (^e) e/ou português(^p);
(intersecção entre 104000 entries e 211
Ups extras em inglês.)
- nestes registros acima, identificar dentre os sinônimos extras BIREME em inglês aqueles que não duplicam com os Non-print
entry terms (se este passo for efetuado
após o passo anterior, nenhum caso de duplicação será
encontrado e todo o resultado deste passo será de interesse
- geração de listagem do CASO 2A que entrará no bloco de listagens quando da tradução dos non-print
entry terms;
CASO
2B – Registros DeCS com non-print Entry terms e sinônimos extras BIREME sem inglês
-
indentificação de Entry * sinônimos extras BIREME sem inglês - encontrar no DeCS os registros MeSH (os que contêm v480)
que possuem sinônimos com ^m
(non-print entry terms) e que também possuem ocorrências de sinônimos que não possuem inglês ou que possuem ^t, ou seja, sinônimos que não são do MeSH (extras BIREME sem inglês);
-
geração de listagem do CASO 2B que entrará no bloco de listagens para tradução dos
non-print entry terms
IV)
CASO 3 – Registros DeCS com non-print entry terms, sem
sinônimos extras BIREME
CASO 3A – Registros DeCS com non-print entry
terms, sem sinônimos extras BIREME, com sinônimos MeSH (print
entry terms)
- Geração de listagem para tradução
CASO 3B - Registros DeCS com non-print
entry terms, sem sinônimos extras BIREME, sem sinônimos MeSH (print
entry terms)
- Geração de listagem para tradução
V)
Tradução dos non-print Entry Terms
Análise da listagem gerada para o CASO 2A
-
visualmente, verificar se as traduções existentes nos sinônimos extras BIREME se
adequam melhor a algum dos
Non-print entry terms existentes no mesmo registro e se for o caso,
transferí-lo com cut/paste de acordo;
Análise da listagem gerada para o CASO 2B
- visualmente, verificar das ocorrências de sinônimos extra espanhol e/ou português que não contêm inglês aquele(s) sinônimo(s) que se
adequariam como traduções de algum non-print
entry term, transferindo-o(s) para lá.
Análise da listagem gerada para o CASO 3A
Análise da listagem gerada para o CASO 3B
VI)
Orçamento
Cálculo aproximado para os Non-Print Entry Terms, com base nos números relativos ao projeto Notas de escopo, recém-concluído:
17.000 notas – 11 pessoas - 3 meses (projeto Notas)
Se fossem 104.000 notas
104.000 notas – 67 pessoas
- 3 meses (projeto Notas)
Considerando que um UP demore para traduzir que um ENTRY term, e que o tempo desejado é de 1 ano ao invés de 3 meses,
104.000 ENTRIES – 17 pessoas - 12 meses (projeto Entry)
Contacto com os 11 tradutores que participaram no projeto Notas de escopo. Busca de outros 6 tradutores.
Valor sugerido: R$0,50/ENTRY. Total: R$ 51.700,00.
Cada tradutor ficaria com aproximadamente 6.100 ENTRIES.
Obs.: os CASOS 1A e 1B irão diminuir este número pois, como já mencionamos, muitos ENTRY terms receberão um subcampo N (não traduz) pois duplicarão com UPs extras hoje existentes no DeCS e com UPs MeSH cujas palavras integrantes do termo são as mesmas mas escritas em ordem diversa (com e sem vírgula)
Exemplo caso 1B:
Descritor:
Mammary Neoplasms, Experimental
Non-Print
Entry Term: Experimental Mammary Neoplasms
Non-Print
Entry Term: Neoplasms, Experimental Mammary
Os
dois Non-Print Entry Terms receberão automaticamente o
subcampo ^nN