Busca de autoridades: uso do texto libre

21/05/2009

Son habituais as preguntas sobre as capacidades e limitacións do uso de texto libre nas buscas de autoridades.

A busca por texto libre é especialmente importante para aproveitar a información de profesión, palabras clave, políticas ou áreas de actividade económica (valores que se toman de listas predefinidas), dado que actualmente para as buscas non se amosan estas listas e só se pode facer uso da busca por texto libre. Porén esta forma de busca ten fortes limitacións que hai que coñecer para usala adecuadamente:
  • O sistema que usa non é tipo ‘Google’ senón moito máis simple. O texto que escribamos búscase ‘tal cal’ dentro de todos os campos (descrición curta e longa, palabras clave, áreas políticas e económicas, profesións, etc.) que describen unha autoridade.
  • Se escribimos varias palabras busca a cadea formada por todas elas e na orde na que a escribamos (‘contaminación acústica’ localizaría resultados pero ‘acústica contaminación’ non). Por este mesmo motivo pode suceder que ‘radiografía estremadura’ non produza ningún resultado (pese a que si exista unha autoridade que apareza na lista ao buscar separadamente tanto ‘radiografía’ como ‘estremadura’).
  • Non distingue maiúsculas / minúsculas (‘médico’, ‘Médico’, e ‘MÉDICO’ ofrecerán os mesmos resultados).
  • Lamentablemente si é sensible ao uso dos acentos (‘MEDICO’ non ofrece os mesmos resultados que ‘MÉDICO’)
  • O uso de plural/singular dificulta ás veces as buscas. Así ‘arquitectos’ podería non localizar ningunha autoridade, mentres ‘arquitecto’ si (noutros termos pode haber maiores diferenzas entre as formas singular e plural -especialmente noutros idiomas: 'foot/feet' por exemplo).
  • Pódese usar só a raíz (ou calquera outra parte) dun termo (‘arquitec’ localizaría resultados que conteñan arquitecto ou arquitectura, e ‘ntaminac’ localizaría resultados que conteñan contaminación)
  • Non usa ningún dicionario de sinónimos (buscar por ‘contaminación’ e por ‘polución’ non ofrece os mesmos resultados)
  • Hai que ter precaución coa cuestión multilingüe na busca por texto libre: 
    • As traducións das designacións non oficiais e descricións poden tardar (ata un mes) en estar realizadas, e incluso aínda que estean dispoñibles pode que se usasen palabras diferentes ás que inicialmente estamos aplicando nas buscas (o exemplo de contaminación vs. polución).
    • O sistema si coñece as traducións de todas as palabras clave (keywords), profesións, áreas políticas e económicas (en definitiva das ‘listas’ que contén IMI), pero debemos escribilas tal e como aparecen nas listas de IMI (p.ex. hai unha área política de ‘contaminación’ que en inglés IMI presenta como ‘polution’, nunca localizariamos unha autoridade buscando por ‘polución’)
    • Como exemplo práctico a área de actividade económica E.39.0.0 está descrita en castelán como ‘Actividades de descontaminación e outros servizos de xestión de residuos’ mentres que en inglés aparece como ‘Remediation activities and other waste management services’. Está claro que buscando ‘decontamination’ (un termo válido en inglés) o sistema non atoparía as autoridades que están descritas como ‘remediation’.

En definitiva, o uso da opción para texto libre nas buscas é un apoio pero débese usar con imaxinación e intelixencia cando non logremos localizar autoridades competentes con ela.