1.2. Los sistemas de recuperación en internet
Las bases del éxito en la búsqueda y recuperación de información en Internetinternet son el conocimiento de los principios básicos de la recuperación de información y de los sistemas que la hacen posible, y de las características propias de los documentos existentes en Internet, y de la teoría de la recuperación de información.internet. Las herramientas de búsqueda en internet aplican los mismos principios sobre tratamiento y recuperación de información textual que se se han revisado en el apartado anterior, y los usuarios disponen de las mismassimilares prestaciones para la recuperación.n, y para su consulta y filtrado. Por lo tanto, resulta crucial que el usuario conozca los tipos de información, la variabilidad de formatos y las diferentes presentaciones que puede adoptar la información en internet. Ello le dotará de una mayor capacidad para conocer y valorar los resultados obtenidos durante el proceso de búsqueda.
Si bien un sistema de recuperación, en su formulación clásica, trabajaba sobre corpus documentales bastante homogéneos, no puede decirse lo mismos de los sistemas de recuperación en internet. Al tratarse de un entorno abierto y cambiante, las herramientas de búsqueda ofrecen listados de resultados, que dirigen al usuario hacia el documento original. Los cambios que se producen, por la propia dinámica del web, hacen que en ocasiones esa redirección no ofrezca los resultados esperados, y que en numerosas ocasiones haya que completar la búsqueda mediante procesos de exploración basados en la navegación. El usuario siempre debe pensar que no es suficiente, en recuperación de información en Internet,internet, con seguir los resultados obtenidos de un motor de búsqueda: hay que explorarlos, analizarlos, valorarlos, y seleccionarlos como adecuados, o desecharlos como no pertinentes. LasLos herramientassistemas de recuperación de información en el web son un medio más, una fase intermedia, no un fin.
Una cuestión que debe tenerse en cuenta cuando se busca información en internet es que, contra la extendida creencia, no todo está disponible a través de los motores de búsqueda, ni en Wikipedia. La puesta en línea a través de internet,desde la década de 2000, de un gran número de fuentes y recursos de información, no supuso que su contenido fuese automáticamente incorporado al contenido procesado por los motores de búsqueda. Diferentes intereses comerciales y/o limitaciones técnicas excluyen enormes volúmenes de información de la vigilancia de los motores, configurando lo que se ha dado en llamar la “internet invisible”.
En realidad, estos contenidos no son invisibles para el usuario: los son para los motores. La noción de Internetinternet invisible se asocia a la presencia en la misma red de gran cantidad de recursos de información, cuyo contenido nosólo se encuentraestá disponible usandoa través de los motoressistemas de búsquedarecuperación oque ofrecen los agentespropios personales.recursos. Esto es debido precisamente a que, a su vez, esta “Internetinternet invisible”invisible se encuentra recogida en bases de datos que sólo muestran su contenido cuando son interrogadas, generando páginas web dinámicas, que evidentemente no pueden ser descubiertas y analizadas por los robots que utilizan los buscadores tradicionales. Dentro de la esta área invisible se englobaengloban los directorios y las bases de datos especializadas, los catálogos de bibliotecas, archivos y museos, las bases de datos de prensa, etc. La aproximacióconclusión lógica que se deriva de ello es que el usuario debería conocer aquellos recursos de información especializada que resulten más provechosaadecuados apara cualquiersus temanecesidades. deUna aproximación común es comenzar la Internet invisible suele ser las recopilaciones realizadas y publicadas por expertosbúsqueda en losun diferentesmotor temas.generalista, para completala en recursos especializados en una segunda fase.