- Henzinger, M. (2007). Search technologies for the internet. Science, 317(5837):468-471.
Según este review, dado el uso masivo y creciente de internet entre todo tipo de usuarios y en todo el mundo, se está dedicando mucho esfuerzo para mejorar la capacidad y agilidad de las tecnologías de búsqueda; todo, evidentemente a partir de la revolución que ha significado Google, su PageRank, etc. La autora considera que los dos grandes retos que se afrontan son: el alcance o exhaustividad de los contenidos buscados y la ordenación satisfactoria de los resultados de las búsquedas.
Henzinger realiza una breve revisión de las tendencias de la investigación para la mejora de los buscadores de Internet: expone los objetivos que se afrontan y las líneas de trabajo en las que se progresa, a partir del análisis de abundante bibliografía reciente:
- Objetivo: explorar mejor las profundidades de Internet, los contenidos ahora invisibles, como las bases de datos. Líneas de trabajo: protocolos de apertura que desvelen a los buscadores las URLs de las páginas recuperables, incluso las generadas dinámicamente, para que las indicen.
- Objetivo: mejorar los resultados en búsquedas poco precisas por parte del usuario, con pocos y esquemáticos términos de búsqueda. Líneas de trabajo: explotar información específica adicional sobre el usuario para matizar y personalizar la búsqueda y ordenación de resultados; o sea, usar el historial de búsquedas, las páginas vistas, u otra información recogida sobre el usuario y sus intereses, para concretar la demanda automáticamente, interpretando las necesidades más allá de la sintaxis efectiva de búsqueda.
- Objetivo: gestión de sinónimos y homónimos. Líneas de trabajo: investigación para detectar el contexto geográfico de una consulta y así deshacer ambigüedades al menos entre topónimos y otros términos.
- Objetivo: luchar contra el “spam” en los resultados de las búsquedas, la optimización fraudulenta del posicionamiento web. Líneas de trabajo: sistemas automáticos de clasificación e identificación de contenidos spam.
- Objetivo: filtros para contenidos inadecuados. Líneas de trabajo: sofware filtro desarrollado mediante técnicas de aprendizaje automático a través de ejemplos.
- Objetivo: recuperación más especializada de información. Líneas de trabajo: buscadores especializados, como Google Scholar.
- Objetivo: nuevos interfaces más avanzados y exhaustivos. Líneas de trabajo: búsqueda multifacetada (clustering), metabuscadores e integración de rankings de resultados de varias fuentes, etc.
- Objetivo: más inteligencia y semántica. Líneas de trabajo: interfaces capaces de razonar, interpretar y aprender; promoción de páginas web semiestructuradas, para un mejor análisis de la información.
En algún otro sitio he oído hablar de la diferencia entre maraña y telaraña. Parece que de algo así se trata: que la Web aparezca más como telaraña y menos como maraña. Y también: poner más inteligencia en la Red, que no sea tan necesaria la de los cerebros.
5 Agosto 2007 a las 2:03 pm |
[...] Buscando mejores buscadores [...]