Motores de búsqueda

¿Cómo funcionan los motores de búsqueda?

El funcionamiento de un motor de búsqueda se puede resumir en dos pasos: rastreo e indexación.

Rastreo

Un motor de búsqueda recorre la web rastreando con lo que se llaman bots. Estos recorren todas las páginas a través de los enlaces. De ahí la importancia de una buena estructura de enlaces. Al igual que haría cualquier usuario al navegar por el contenido de la Web, pasan de un enlace a otro y recopilan datos sobre esas páginas web que proporcionan a sus servidores.

El proceso de rastreo empieza con una lista de direcciones web de rastreos anteriores y de sitemaps proporcionada por otras páginas web. Una vez acceden a estas web, los bots buscan enlaces a otras páginas para visitarlas. Los bots se sienten especialmente atraídos por los sitios nuevos y a los cambios en las web existentes.

Son los propios bots los que deciden qué páginas visitar, con qué frecuencia y cuánto tiempo van a rastrear esa web, por eso es importante tener un tiempo de carga óptimo y un contenido actualizado.

Es muy común que en una página web se necesita restringir el rastreo de algunas páginas o de cierto contenido para evitar que estas aparezcan en los resultados de búsqueda. Para esto se le puede decir a los bots de los motores de búsqueda que no rastreen ciertas páginas a través del archivo «robots.txt«.

Indexación

Una vez que un bot ha rastreado una web y ha recopilado la información necesaria, estas páginas se incluyen en un índice. Ahí se ordenan según su contenido, su autoridad y su relevancia. De este modo, cuando hagamos un consulta al motor de búsqueda le resultará mucho más fácil mostrarnos los resultados que están más relacionados con nuestra consulta.

Al principio los motores de búsqueda se basaban en el número de veces que se repetía una palabra. Al hacer una búsqueda rastreaban en su índice esos términos para encontrar qué páginas los tenían en sus textos, posicionando mejor la que más veces lo tenía repetido. Actualmente, son más sofisticados y basan sus índices en cientos de aspectos diferentes. La fecha de publicación, si contienen imágenes, vídeos o animaciones, microformatos, etc. son algunos de esos aspectos. Ahora dan más prioridad a la calidad del contenido.

Una vez que las páginas son rastreadas e indexadas, llega el momento en el que actúa el algoritmo: los algoritmos son los procesos informáticos que deciden qué páginas aparecen antes o después en los resultados de búsqueda. Realizada la búsqueda, los algoritmos revisan en los índices. Así sabrán cuáles son las páginas más relevantes teniendo en cuenta los cientos de factores de posicionamiento. Y todo esto sucede en cuestión de milisegundos.

Deja un comentario