Wie Search Engines Dokumente finden

| by Kamlesh Patel | February 23, 2006
Jedes Dokument auf dem Netz ist mit einem URL verbunden (konstantes Hilfsmittel-Verzeichnis). Inthis Kontext, verwenden wir die Bezeichnungen „Dokument“ und „URL“ austauschbar. Dieses ist eine übervereinfachung, als einige URLs unterschiedliche Rückholdokumente zum Benutzer abhängig von solchen Faktoren wie ihre Position, Datenbanksuchroutineart, Formeingang etc., aber Klagen dieser Terminologie unsere Zwecke für jetzt.

Jedes Dokument auf dem Netz zu finden würde mehr als bedeuten jedes URL auf dem Netz finden. Aus diesem Grund versuchen Search Engines nicht z.Z., jedes mögliche einzigartige Dokument zu lokalisieren, obgleich Forschung immer unterwegs in diesem Bereich ist. Stattdessen richten kriechende Search Engines ihre Aufmerksamkeit auf einzigartiges URLs; obgleich einige dynamische Aufstellungsorte unterschiedlichen Inhalt am gleichen URL anzeigen können (über Formeingänge oder andere dynamische Variablen), sehen Search Engines dieses URL als einzelne Seite.

Das typische kriechende Search Engine benutzt drei Hauptbetriebsmittel, um eine Liste von URLs zu errichten, um zu kriechen. Nicht alle Search Engines verwenden alle diese:

Hypertext-Links auf vorhandenen Webseiten

Der Hauptteil des URLs, das in den Datenbanken der meisten kriechenden Search Engines gefunden wird, besteht aus den Verbindungen, die auf Webseiten gefunden werden, daß die Spinne bereits gekrochen hat. Das Finden einer Verbindung zu einem Dokument auf einer Seite deutet an, daß jemand diese Verbindung wichtig genug, sie ihrer Seite hinzuzufügen fand.

Eingereichtes URLs

Alle kriechenden Search Engines haben irgendeine Art des Prozesses, der Benutzer oder Web site Inhabern erlaubt, gekrochen zu werden URLs einzureichen. In der Vergangenheit boten alle Search Engines einen freien manuellen Unterordnungprozeß an, aber jetzt, nehmen viele nur zahlende Unterordnungen an. Google ist eine bemerkenswerte Ausnahme, ohne die offensichtlichen Pläne, zum freie, Unterordnungen anzunehmen zu stoppen, obgleich es großen Zweifel gibt, ob das Einreichen wirklich alles tut.

XML Datenzufuhren

Zahlende Einbeziehung Programme, wie Yahoo! Gleichsystem stationieren, verläßliche Zufuhrprogramme einschließen, die Aufstellungsorte XML-gegründete zufriedene Zusammenfassungen für das Kriechen und Einbeziehung einreichen lassen. Während das semantische Netz anfängt aufzutauchen und mehr Aufstellungsorte anfangen, RSS (RDF Aufstellungsort-Zusammenfassung) Nachrichten Zufuhrakten anzubieten, haben einige Search Engines angefangen, diese Akten zu lesen, um frischen Inhalt zu finden.

Search Engines lassen mehrfache Gleiskette Programme laufen, und jedes Gleiskette Programm (oder Spinne) empfängt Anweisungen über den vom Scheduler URL (oder Satz von URLs) zunächst zu holen. Wir sehen, wie Search Engines den festlegenprozeß kurz handhaben, aber zuerst, lassen Sie uns nehmen einen Blick an, wie das Programm Gleiskette des Search Engine arbeitet.

Quelle: http://www.elitedatasolution.com

Article Source: http://www.articleset.com



About the Author

Kamlesh Patel

I'm freelancer Search engine optimization expert from India. We provide Search engine optimization services including link building, meta tags etc.

info@elitedatasolution.com » Read more articles by Kamlesh Patel
You are welcome to publish or reprint this article free of charge, provided: