Búsqueda de autoridades: uso del texto libre

21/05/2009

Son habituales las preguntas sobre las capacidades y limitaciones del uso de texto libre en las búsquedas de autoridades.

La búsqueda por texto libre es especialmente importante para aprovechar la información de profesión, palabras clave, políticas o áreas de actividad económica (valores que se toman de listas predefinidas), dado que actualmente para las búsquedas no se muestran estas listas y sólo se puede hacer uso de la búsqueda por texto libre. Sin embargo esta forma de búsqueda tiene fuertes limitaciones que hay que conocer para usarla adecuadamente:

  • El sistema que usa no es tipo ‘Google’ sino mucho más simple. El texto que escribamos se busca ‘tal cual’ dentro de todos los campos (descripción corta y larga, palabras clave, áreas políticas y económicas, profesiones, etc.) que describen a una autoridad.
  • Si escribimos varias palabras busca la cadena formada por todas ellas y en el orden en que la hayamos escrito (‘contaminación acústica’ localizaría resultados pero ‘acústica contaminación’ no). Por este mismo motivo puede suceder que ‘radiografía extremadura’ no produzca ningún resultado (pese a que sí exista una autoridad que aparezca en la lista al buscar separadamente tanto ‘radiografía’ como ‘extremadura’).
  • No distingue mayúsculas / minúsculas (‘médico’, ‘Médico’, y ‘MÉDICO’ ofrecerán los mismos resultados).
  • Lamentablemente sí es sensible al uso de tilde (‘MEDICO’ no ofrece los mismos resultados que ‘MÉDICO’)
  • El uso de plural/singular dificulta a veces las búsquedas. Así ‘arquitectos’ podría no localizar ninguna autoridad, mientras ‘arquitecto’ sí (en otros términos puede haber mayores diferencias entre las formas singular y plural -especialmente en otros idiomas: 'foot/feet' por ejemplo).
  • Puede usarse sólo la raíz (o cualquier otra parte) de un término (‘arquitec’ localizaría resultados que contengan arquitecto o arquitectura, y ‘ntaminac’ localizaría resultados que contengan contaminación)
  • No usa ningún diccionario de sinónimos, ni menos aún algún tesauro (buscar por ‘contaminación’ y por ‘polución’ no ofrece los mismos resultados)
  • Hay que tener precaución con la cuestión multingüe en la búsqueda por texto libre: 
    • Las traducciones de las designaciones no oficiales y descripciones pueden tardar (hasta un mes) en estar realizadas, e incluso aunque estén disponibles pueden haber usado palabras diferentes a las que inicialmente estemos aplicando en las búsquedas (el ejemplo de contaminación vs. polución).
    • El sistema sí conoce las traducciones de todas las palabras clave (keywords), profesiones, áreas políticas y económicas (en definitiva de las ‘listas’ que contiene IMI), pero debemos de escribirlas tal como aparecen en las listas de IMI (p.ej. hay un área política de ‘contaminación’ que en inglés IMI presenta como ‘polution’, jamás localizaríamos una autoridad buscando por ‘polución’)
    • Como ejemplo práctico el área de actividad económica E.39.0.0 está descrita en castellano como ‘Actividades de descontaminación y otros servicios de gestión de residuos’ mientras en inglés aparece como ‘Remediation activities and other waste management services’. Es claro que buscando ‘decontamination’ (un término válido en inglés) el sistema no hubiera encontrado las autoridades que estén descritas como ‘remediation’.

En definitiva, el uso de la opción para texto libre en las búsquedas es un apoyo pero debe usarse con imaginación e inteligencia cuando no logremos localizar autoridades competentes con ella.