Buscando mejores buscadores

Según este review, dado el uso masivo y creciente de internet entre todo tipo de usuarios y en todo el mundo, se está dedicando mucho esfuerzo para mejorar la capacidad y agilidad de las tecnologías de búsqueda; todo, evidentemente a partir de la revolución que ha significado Google, su PageRank, etc. La autora considera que los dos grandes retos que se afrontan son: el alcance o exhaustividad de los contenidos buscados y la ordenación satisfactoria de los resultados de las búsquedas.

Henzinger realiza una breve revisión de las tendencias de la investigación para la mejora de los buscadores de Internet: expone los objetivos que se afrontan y las líneas de trabajo en las que se progresa, a partir del análisis de abundante bibliografía reciente:

  • Objetivo: explorar mejor las profundidades de Internet, los contenidos ahora invisibles, como las bases de datos. Líneas de trabajo: protocolos de apertura que desvelen a los buscadores las URLs de las páginas recuperables, incluso las generadas dinámicamente, para que las indicen.
  • Objetivo: mejorar los resultados en búsquedas poco precisas por parte del usuario, con pocos y esquemáticos términos de búsqueda. Líneas de trabajo: explotar información específica adicional sobre el usuario para matizar y personalizar la búsqueda y ordenación de resultados; o sea, usar el historial de búsquedas, las páginas vistas, u otra información recogida sobre el usuario y sus intereses, para concretar la demanda automáticamente, interpretando las necesidades más allá de la sintaxis efectiva de búsqueda.
  • Objetivo: gestión de sinónimos y homónimos. Líneas de trabajo: investigación para detectar el contexto geográfico de una consulta y así deshacer ambigüedades al menos entre topónimos y otros términos.
  • Objetivo: luchar contra el “spam” en los resultados de las búsquedas, la optimización fraudulenta del posicionamiento web. Líneas de trabajo: sistemas automáticos de clasificación e identificación de contenidos spam.
  • Objetivo: filtros para contenidos inadecuados. Líneas de trabajo: sofware filtro desarrollado mediante técnicas de aprendizaje automático a través de ejemplos.
  • Objetivo: recuperación más especializada de información. Líneas de trabajo: buscadores especializados, como Google Scholar.
  • Objetivo: nuevos interfaces más avanzados y exhaustivos. Líneas de trabajo: búsqueda multifacetada (clustering), metabuscadores e integración de rankings de resultados de varias fuentes, etc.
  • Objetivo: más inteligencia y semántica. Líneas de trabajo: interfaces capaces de razonar, interpretar y aprender; promoción de páginas web semiestructuradas, para un mejor análisis de la información.

En algún otro sitio he oído hablar de la diferencia entre maraña y telaraña. Parece que de algo así se trata: que la Web aparezca más como telaraña y menos como maraña. Y también: poner más inteligencia en la Red, que no sea tan necesaria la de los cerebros.

Una respuesta para “Buscando mejores buscadores”

  1. ¿Por qué confiamos más en Google que en otros motores de búsqueda? « La información es poder Dice:

    [...] Buscando mejores buscadores [...]

Escribe un comentario