Los elementos de un motor de búsqueda

Hemos estado recopilando información sobre los motores de búsqueda, sobre todo en lo que se refiere a los diferentes términos que suelen recibir los robots de búsqueda. Seguro que os resulta interesante saber algo mas sobre estas herramientas que utilizamos día a día. Son tres los elementos que componen un motor de búsqueda:

1. Interfaz

Es la página Web a la que accede el usuario. En ella se establece el tipo de búsqueda. Hay dos tipos :

  • Formularios: Se presenta una página con formularios en los que se introducen las palabras claves de búsqueda relacionadas con el tema que nos interesa, junto con la lógica a emplear.
  • Con Directorios: Además de contar con formularios, estructuran la información jerárquicamente por materias. Para encontrar la información hay que ir descendiendo por el árbol desde los temas más generales hasta los más específicos.

2. Base de datos textual

Índice de palabras, frases y datos asociados con la dirección de páginas Web (URL) , programas, ficheros, etc. La información se da de alta y de baja, pero siempre dejando una referencia para que después, quien busque un tema relacionado, pueda encontrar la dirección y un pequeño resumen de lo que contiene.

3. Robot

Programa de ordenador que está diseñado para recorrer de forma automática, la estructura hipertexto de la Web con el fin de llevar a cabo una o varias de las siguientes funciones:

Análisis estadístico: Miden el crecimiento de la Web, número de servidores conectados, etc.

  • Mantenimiento de la estructura hipertextual de la World Wide Web: Verificando la corrección de los enlaces entre documentos y eliminando o guardando información de los denominados "enlaces muertos" (dead links), es decir, páginas Web que ya han desaparecido.
  • Duplicación de directorios Ftp (Mirrors): Incrementando su utilidad a un número mayor de usuarios.
  • Creación automática de bases de datos textuales a partir de los documentos html distribuidos por los distintos servidores . Debido a que cada robot está programado para buscar en la Red de diferente forma, la información almacenada en cada base de datos puede ser diferente.

Los términos robots, spiders, Wanderers, knowbots, webcrawlers y web scanners suelen considerarse sinónimos, aunque es posible encontrar matizaciones, como la recogida por Michael Berns quien distingue entre Spiders, Knowbots y Wanderers. 

  • Spiders (Arañas): Crean bases de datos tomando como referencia los distintos nexos que configuran la estructura hipertexto de la Red.
  • Knowbots: Robots programados para localizar referencias hipertexto dirigidas hacia un documento, servidor, etc., en particular. Este tipo de robots permite evaluar el impacto de las distintas aportaciones que engrosan las distintas áreas de conocimiento presentes en la Red.
  • Wanderers (Vagabundos): Robots encargados de la medición del crecimiento de la Web.

Otra matización interesante es la aportada por Martijn Koster , quien entiende como sinónimos los términos robots, spiders y webcrawlers, a los que añade el término Worms (Gusanos): Robots encargados de tareas de duplicación (creación de Mirrors).

Por ultimo, hay otro término que es importante no olvidar, los WebAnts (Hormigas): Conjunto de robots físicamente alejados que cooperan para la consecución de distintos objetivos. Por ejemplo, compartiendo los resultados obtenidos para asegurarse de no duplicar esfuerzos.

2 respuestas a Los elementos de un motor de búsqueda

  1. valeria dice:

    q buena pagina

  2. saume ccaccro kenia lizeth dice:

    que buena pagina ….me sirvio para mi exposicion..!!!!

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: