La nouvelle araignée de Google a-t-elle pu causer des questions avec des sites Web ?

| by Rob Sullivan | March 20, 2006
Autour du temps Google « grand papa annoncé, » il y avait un nouveau Googlebot errant le Web. Depuis lors j'ai entendu des histoires des clients des sites Web et des serveurs allant le contenu vers le bas et précédemment non indexé obtenant classé.

J'ai commencé à creuser dans ceci et vous seriez étonnés à ce que j'ai découvert.

D'abord, laisse le regard à la chronologie des événements :

En septembre quelques observateurs astucieux d'araignée plus de chez Webmasterworld ont repèré l'activité unique de Googlebot. En fait, c'était en ce fil que le BOT était a signalé la première fois. Il est concerné quelques affiches qui ont pensé que peut-être ceci pourrait être les utilisateurs réguliers masquerading comme BOT célèbre.

Dès l'abord il s'est également avéré que le nouveau BOT n'obéissait pas le dossier de Robots.txt. C'est le protocole qui laisse ou nie ramper aux parties d'un site Web.

La spéculation s'est développée sur ce qu'était la nouvelle chenille jusqu'à ce que Cutts mat ait mentionné un nouveau centre d'essais de Google. Pour ceux qui ne savent pas, Cutts mat est un ingénieur principal avec Google et un des quelques employés de Google nous parlant « les gens réguliers. » Cette mention s'est produite en novembre.

Il n'y avait pas beaucoup de mention du grand papa jusqu'à début janvier de cette année si mat blogged encore à son sujet demandant la rétroaction.

Beaucoup de rétroaction a été donnée sur l'exactitude des résultats. Il y avait également ceux qui a demandé si le Mozilla Googlebot (connu sous le nom de « Mozilla/5.0 (compatible ; Googlebot/2.1 ; + http://www.google.com/bot.html) » dans vos notations de visiteur) et le grand papa étaient connexes, mais aucune réponse n'a été faite.

Maintenant je vais commencer une partie de ma propre spéculation :

Je crois en fait que les deux sont connexes. En fait, je pense que cette nouvelle chenille remplacera par la suite les chenilles anciennes juste comme le grand papa remplacera l'infrastructure courante de données.

Pourquoi est-ce que c'est important ?

Basé sur mes observations, cette chenille peut pouvoir faire tellement plus que la vieille chenille.

Pour un, elle émule un plus nouveau navigateur. Le vieux BOT a été basé sur le navigateur basé par texte de Lynx. Tandis que je suis sûr que Google a ajouté des dispositifs pendant que le temps continuait, le navigateur de base de Lynx est juste que - de base.

Ce qui explique pourquoi Google ne pourrait pas traiter des choses comme le Javascript, le CSS et le flash.

Cependant, avec la nouvelle araignée, construite sur le moteur de Mozilla, il y a tant de possibilités.

Le regard juste à ce que votre navigateur de Mozilla ou de Firefox peut se faire - rendre le CSS, lire et exécuter le Javascript et d'autres langues scripting, émulent même d'autres navigateurs.

Mais ce n'est pas tout.

J'ai parlé à quelques uns de mes clients et leurs emplacements obtiennent ont martelé par cette nouvelle araignée. Elle a ainsi le mauvais que certains de leurs serveurs sont descendus en raison du volume du trafic de cette une araignée !

Du côté positif, j'ai des clients qui sont allés de quelques cent mille pages classées à plus de 10 millions en juste quelques semaines ! Littéralement depuis décembre 2005 il y a eu une augmentation de 3500% en pages classées sur une période de 8 semaines ! Juste ainsi vous savez, c'est également l'emplacement du client qui est descendu en raison du volume énorme de rampement se produisant.

Mais ce n'est toujours pas tout.

J'ai un autre client qui emploie l'identification d'IP pour servir le contenu basé sur l'endroit géographique d'une personne. Si vous de phase aux USA vous obtenez le contenu et l'évaluation américains ; si vous de phase au R-U vous obtenez le contenu et l'évaluation BRITANNIQUES. Comme vous pouvez imaginer, tout le contenu du R-U, des USA, canadien et australien est très semblable. En fait au sujet de la seule chose sensiblement différente est l'aspect l'évaluation.

C'est mon souci - si le contenu double obtient classé par Google ce que la volonté elles ? Il y a de fortes chances que l'emplacement serait pénalisé ou même interdit pour la violation des directives de qualité de webmaster déterminées par Google.

C'est pourquoi nous avons mis en application l'identification d'IP - de sorte que Googlebot, qui rampe des adresses d'IP des USA voie seulement une version de l'emplacement.

Cependant, un examen des notations de serveur prouve que ce nouveau Googlebot avait visité non seulement le contenu des USA mais également la teneur des autres sections de l'emplacement. Naturellement, j'ai voulu vérifier que l'identification d'IP fonctionnait. Elle est. Ceci me mène à me demander alors ; ce navigateur peut-il charrier son endroit et/ou employer une procuration ?

Imaginer que - le navigateur est assez futé pour faire une partie de son propre essai en regardant l'emplacement des adresses multiples d'IP. Si c'est le cas puis ceux qui masquent des emplacements vont avoir des problèmes.

De toute façon, des observations limitées que j'ai faites, ce nouveau Google - le centre de calculs et l'araignée - vais changer la manière nous faisons des choses.

Si vous avez éprouvé n'importe quoi semblable en derniers mois pour faire avec Google, être sûr de l'ajouter à notre section commentaires ci-dessous.

Article Source: http://www.articleset.com



About the Author

Rob Sullivan - SEO Specialist and Internet Marketing Consultant. Any reproduction of this article needs to have an html link pointing to http://www.textlinkbrokers.com. » Read more articles by Rob Sullivan
You are welcome to publish or reprint this article free of charge, provided: