Fundamentos de los motores de búsqueda
| by John Colascione | November 23, 2005
Apenas sobre cada Search Engine importante tiene básicamente 3 porciones. El primer es la araña, si no llamado una robusteza. La araña visita un Web page, lo lee, y después sigue acoplamientos a otras páginas dentro del sitio. Esto es lo que significa cuando alguien refiere a un sitio que es “spidered” o “se arrastró.” La araña vuelve al sitio sobre una base regular, tal como cada mes o dos, para buscar cambios y actualizaciones. (Si un sitio se pone al día a menudo y se pone bien, esto sucederá mucho más a menudo, iguala a veces diario)
Todo los hallazgos de la araña entra la segunda parte de un Search Engine, el índice. El índice, a veces llamado la base de datos, es como una biblioteca gigante que contiene una copia de cada Web page que la araña encuentre. Si un Web page es diferente o aparece tener cambios, después el sitio será vuelto a clasificar y este “libro” se pone al día con la nueva información.
Puede tomar a veces un rato para las nuevos páginas o cambios que la araña encuentra para ser agregada al índice. Así, un Web page puede haber sido “spidered” pero no todavía “puso en un índice.” Hasta que se pone en un índice la nueva información, no está disponible para ésas que buscan con el Search Engine.
El tercero, y la mayoría de la parte sofisticada de un Search Engine es el software de la graduación (designado a veces el algo o el algoritmo). Éste es el programa que tamiza con millones de páginas registradas en el índice para encontrar fósforos a una búsqueda y alinearlos en la orden de lo que cree sean los más relevantes. Todos los motores de búsqueda tienen las piezas básicas descritas arriba, pero hay diferencias en cómo se templan estas piezas. Ése es porqué la misma búsqueda en diversos motores de búsqueda produce a menudo diversos resultados.
Todo los hallazgos de la araña entra la segunda parte de un Search Engine, el índice. El índice, a veces llamado la base de datos, es como una biblioteca gigante que contiene una copia de cada Web page que la araña encuentre. Si un Web page es diferente o aparece tener cambios, después el sitio será vuelto a clasificar y este “libro” se pone al día con la nueva información.
Puede tomar a veces un rato para las nuevos páginas o cambios que la araña encuentra para ser agregada al índice. Así, un Web page puede haber sido “spidered” pero no todavía “puso en un índice.” Hasta que se pone en un índice la nueva información, no está disponible para ésas que buscan con el Search Engine.
El tercero, y la mayoría de la parte sofisticada de un Search Engine es el software de la graduación (designado a veces el algo o el algoritmo). Éste es el programa que tamiza con millones de páginas registradas en el índice para encontrar fósforos a una búsqueda y alinearlos en la orden de lo que cree sean los más relevantes. Todos los motores de búsqueda tienen las piezas básicas descritas arriba, pero hay diferencias en cómo se templan estas piezas. Ése es porqué la misma búsqueda en diversos motores de búsqueda produce a menudo diversos resultados.
Article Source: http://www.articleset.com

You are welcome to publish or reprint this article free of charge, provided:
- you include the entire article, unchanged, including the "About The Author" box
- all hyperlinks remain active, including the bottom ArticleSet.com link (does not apply to print publications)
- you agree not to hold the authors nor ArticleSet.com liable for any loss profits, expenses, or any other damages resulting from the use or misuse of articles published on this website