Wie man doppelten Inhalt verhindert

| by Harvey Kane | March 22, 2006
Doppelter Inhalt ist ein Problem mit vielen Web site, und die meisten webmasters nicht verwirklichen, daß sie alles falsch tun.

Die meisten Search Engines möchten relevante Resultate für ihre Benutzer zur Verfügung stellen, es ist, wie Google erfolgreich erhielt. Wenn das Search Engine, 5 identische Seiten auf der gleichen Seite der Suchresultate zurückzubringen war, ist- es nicht wahrscheinlich, den Forscher nützlich zu sein.

Viele Search Engines haben die Filter, an der richtigen Stelle, zum der doppelten Auflistungen zu entfernen - diese hält ihre Suchresultate sauber, und ist eine gute Eigenschaft gesamt. Von einem Gesichtspunkt der webmasters jedoch, weißt du nicht, welche Kopie des Inhalts das Search Engine versteckt, und es kann einen realen Dämpfer auf deine Marketing-Bemühungen setzen, wenn die Search Engines nicht die Kopie zeigen, die du versuchst zu fördern.

Du kannst denken, daß du keine doppelten Seiten auf deinem Aufstellungsort… wieder denken läßt…

Doppelter Inhalt tritt auf, wenn das Search Engine identischen Inhalt bei unterschiedlichem URLs findet. Die folgenden Drehbücher betrachten…

WWW gegen NichtwWW

http://www.domain.com und http://domain.com

in den meisten Fällen bringen diese die gleiche Seite, das heißt, ein Duplikat deines gesamten Aufstellungsortes zurück.

Wurzel gegen Index

http://www.domain.com (Wurzel) und http://www.domain.com/index.htm

Homepage der meisten Leute sind vorhanden, indem sie jedes URL - doppelten Inhalt schreiben.

Lernabschnitt Identifikation - die Wurzel alles übels

http://www.domain.com/page.php?PHPSESSID=24FD6437ACE578FEA5745

Dieses Problem bewirkt viele dynamische Aufstellungsorte, einschließlich PHP, Asp und kalte Schmelzverfahren Aufstellungsorte. Viele Foren werden schlecht wegen dieses außerdem registriert. Lernabschnitt Identifikation ändern, jedesmal wenn ein Besucher zu deinem Aufstellungsort kommt. Das heißt, jedesmal wenn das Search Engine deinen Aufstellungsort registriert, erhält er den gleichen Inhalt mit einem anderen URL. Erstaunlich sind die meisten Search Engines nicht genug gescheit, dieses zu ermitteln und es zu regeln, also ist es bis zu dir als webmaster.

Eine Seite, mehrfaches URLs

http://www.domain.com/product.php?category=furniture&product=chair

und

http://www.domain.com/product.php?category=outdoor&product=chair

Ein Produkt kann mehr als einer Kategorie zugeteilt werden - in diesem Fall ist die „Produktdetail“ Seite identisch, aber sie ist über 2 URLs vorhanden.

Entfernen des doppelten Inhalts

Haben des doppelten Inhalts auf deinem Aufstellungsort kann Marketing deutlich mehr schwieriges bilden, besonders wenn du Marketing die NichtwWW Version bist und Google nur die WWW Version zeigt. Weil du nicht den Search Engines erklären kannst, welches die „ursprüngliche“ Kopie ist, mußt du jeden doppelten Inhalt am Auftreten auf deinem Aufstellungsort verhindern.

Sind hier einige Spitzen, zum dieses Prozesses einfacher zu bilden.

1. NichtwWW gegen WWW

Ich ziehe es vor, die WWW Version meines Gebietes (kein bestimmter Grund, scheint sie zu verwenden, auf Papier besser zu schauen). Wenn du Apache als dein web server benutzt, kannst du die folgenden Linien in deiner .htaccess Akte einschließen (die Werte zu deinen Selbst selbstverständlich ändern).

RewriteCond % {HTTP_HOST} ^domain.com

RewriteRule (. *) http://www.domain.com/$1 [R=301, L]

Wenn dein webhost dich nicht die .htaccess Akte redigieren läßt, würde ich erwägen, einen neuen Wirt zu finden. Wenn es zum Entfernen des doppelten Inhalts und zum Produzieren von Search Engine freundliches URLs kommt, ist .htaccess Apaches zu gut zu ignorieren. Wenn deine Web site auf Microsoft IIS bewirtet wird, empfehle ich ISAPI Neufassung anstatt.

2. Allen Hinweis auf „index.htm“ entfernen.

Dein homepage sollte nie als index.htm, index.php, index.asp etc. gekennzeichnet. Wenn du ankommende Verbindungen errichtest, gelangst du immer Verbindungen an www.domain.com - deine internen Verbindungen sollten die selben immer sein. Einer meiner Aufstellungsorte hatte ein anderes pagerank auf „/“ (Wurzel) und „index.php“, weil die internen Verbindungen auf index.php zeigten und dem Verursachen des doppelten Inhalts. Warum zur Mühe der Förderung zwei „gehen unterschiedliche“ Seiten an der halben Stärke, wenn du ein einzelnes URL an der vollen Stärke fördern kannst?

Nachdem du alle Hinweise auf index.htm entfernt hast, solltest du 301 aufstellen umadressierst (unten) um index.htm zu/(Wurzel) umzuadressieren.

3. Lernabschnitt Identifikation entfernen.

Ich kann Rat für PHP Benutzer, Asp geben und CF-Benutzer sollten ihre eigene Forschung auf genau tun, wie man diese entfernt. Mit PHP wenn der Benutzer nicht Plätzchen stützt, wird der Lernabschnitt Identifikation automatisch in das URL, als Weise des Beibehaltens des Zustandes zwischen Seiten eingesetzt. Die meisten Search Engines stützen nicht Plätzchen, die Mittel sie einem anderen PHPSESSID im URL erhalten, jedesmal, das sie besuchen - diese führt zu sehr häßliche Index-Bewegung.

Es gibt keine ideale Lösung zu diesem, also muß ich mich vergleichen. Wenn Lernabschnitte eine Anforderung für die Web site sind, würde ich eher eine geringe Anzahl Besucher, die nicht Plätzchen haben, als geduldetes PHPSESSID in meinen Search Engineauflistungen verlieren (und Besucher möglicherweise viel mehr verlieren).

Um PHPSESSID im URL zu sperren, solltest du den folgenden Code in .htaccess einsetzen

php_value session.use_only_cookies 1

php_value session.use_trans_sid 0

Dieses bedeutet, daß Besucher mit den Plätzchen, die abgestellt werden, benutzen keine Funktionen deines Aufstellungsortes werden, die Lernabschnitte verwenden, z.B. anmelden, oder an Formdaten etc. erinnern.

4. Alle datenbankgesteuerten Seiten sicherstellen haben einzigartiges URLs.

Dieses ist ein wenig schwieriger und abhängt, wie dein Aufstellungsort gegründet wird. Wenn ich Seiten entwerfe, bin ich immer von der „eine Seite, ein URL“ Richtlinie vorsichtig, und ich entwerfe meine Seite Struktur dementsprechend. Wenn ein Produkt 2 Kategorien gehört, stelle ich sicher, daß beide Kategorien mit dem gleichen URL verbinden, oder ändere den Inhalt erheblich auf beiden Versionen der Seite, also ist sie nicht in den Augen des Search Engine „identisch“.

301 Umlenkungen

301 adressieren ist die korrekte Weise um, die der Search Engines erklärt, daß eine Seite dauerhaft bewogen hat. Wenn du noch das NichtwWW Domain Name arbeiten wünschst, solltest du 301 den Besucher zum WWW Gebiet umadressieren. Der Besucher sieht, daß die Adresse änderung und die Search Engines wissen, um das NichtwWW zu ignorieren und das WWW anstatt zu verwenden.

Dein .htaccess bis 301 verwenden umadressieren Besucher index.htm von zu/und von allen möglichen anderen Seiten, die umbenannt erhalten. z.B.

301 /index.htm http://www.domain.com/ umadressieren

Zusammenfassung

Während dein Aufstellungsort mit doppeltem Inhalt ist, verbreitet er definitiv deine Bemühungen und kann dich in den Weisen kosten, die du nicht verstehst. Um pagerank und die Wirksamkeit der Verbindung Kampagnen zu maximieren, solltest du dort sicherstellen bist kein doppelter Inhalt auf deinem Aufstellungsort. Frei fühlen, mit mir in Verbindung zu treten, wenn du deinen Aufstellungsort überprüft auf irgendeinen doppelten Inhalt möchtest.

Article Source: http://www.articleset.com



About the Author

Harvey Kane is a PHP Web Developer based in Auckland New Zealand. You are free to distribute this article so long as this credit and all links remain intact. Harvey maintains several web sites, including http://www.harveykane.com http://www.ragepank.com and http://www.gardyneholt.co.nz » Read more articles by Harvey Kane
You are welcome to publish or reprint this article free of charge, provided: