Fondations de moteurs de recherche
| by John Colascione | November 23, 2005
Juste au sujet de chaque Search Engine principal a fondamentalement 3 parts. Le premier est l'araignée, autrement appelé un robot. L'araignée visite une page Web, la lit, et puis suit des liens à d'autres pages dans l'emplacement. Est ce ce qui il signifie quand quelqu'un se rapporte à un emplacement étant « spidered » ou « a rampé. » L'araignée revient à l'emplacement de façon régulière, comme chaque mois ou deux, pour rechercher des changements et des mises à jour. (Si un emplacement est mis à jour souvent et est bien commercialisé, ceci se produira beaucoup plus souvent, égalisent parfois journalier)
Tout les trouvailles d'araignée entre dans la deuxième partie d'un Search Engine, l'index. L'index, parfois appelé la base de données, est comme une bibliothèque géante contenant une copie de chaque page Web que l'araignée trouve. Si une page Web est différente ou semble avoir des changements, alors l'emplacement sera réindexé et ce « livre » est mis à jour avec la nouvelle information.
Parfois cela peut prendre un moment pour de nouveaux pages ou changements que l'araignée trouve pour être ajouté à l'index. Ainsi, une page Web peut avoir été « spidered » mais pas encore « a classé. » Jusqu'à ce que la nouvelle information soit classée, elle n'est pas disponible à ceux qui recherchent avec le Search Engine.
Le tiers, et la plupart de partie sophistiquée d'un Search Engine est le logiciel de rang (parfois désigné sous le nom de l'algo ou de l'algorithme). C'est le programme qui tamise par les millions de pages enregistrées dans l'index il est le plus approprié de pour trouver des matchs à une recherche et les ranger par ordre de ce qu'il croit. Tous les moteurs de recherche ont les pièces de base décrites ci-dessus, mais il y a des différences dans la façon dont ces pièces sont accordées. C'est pourquoi la même recherche sur différents moteurs de recherche produit souvent différents résultats.
Tout les trouvailles d'araignée entre dans la deuxième partie d'un Search Engine, l'index. L'index, parfois appelé la base de données, est comme une bibliothèque géante contenant une copie de chaque page Web que l'araignée trouve. Si une page Web est différente ou semble avoir des changements, alors l'emplacement sera réindexé et ce « livre » est mis à jour avec la nouvelle information.
Parfois cela peut prendre un moment pour de nouveaux pages ou changements que l'araignée trouve pour être ajouté à l'index. Ainsi, une page Web peut avoir été « spidered » mais pas encore « a classé. » Jusqu'à ce que la nouvelle information soit classée, elle n'est pas disponible à ceux qui recherchent avec le Search Engine.
Le tiers, et la plupart de partie sophistiquée d'un Search Engine est le logiciel de rang (parfois désigné sous le nom de l'algo ou de l'algorithme). C'est le programme qui tamise par les millions de pages enregistrées dans l'index il est le plus approprié de pour trouver des matchs à une recherche et les ranger par ordre de ce qu'il croit. Tous les moteurs de recherche ont les pièces de base décrites ci-dessus, mais il y a des différences dans la façon dont ces pièces sont accordées. C'est pourquoi la même recherche sur différents moteurs de recherche produit souvent différents résultats.
Article Source: http://www.articleset.com

You are welcome to publish or reprint this article free of charge, provided:
- you include the entire article, unchanged, including the "About The Author" box
- all hyperlinks remain active, including the bottom ArticleSet.com link (does not apply to print publications)
- you agree not to hold the authors nor ArticleSet.com liable for any loss profits, expenses, or any other damages resulting from the use or misuse of articles published on this website