Motore di ricerca e web crawler
| by Alex Desouza | February 06, 2008
Web crawler sono collegati con ottimizzazione dei motori di ricerca. Il motore di ricerca più amichevole il tuo sito sia il più probabilità di web crawler visita il tuo sito. Se il tentativo di ottimizzare il sito si sono più invitante spider dei motori di ricerca o crawler per il tuo sito.
I termini crawler, la automatico indexers, bot, worm, web spider, robot e web sono programmi o script automatizzati con sfogliare il World Wide Web in un metodico, modo automatizzato. Il termine crawler è il termine più comunemente utilizzato.
Web crawler sono uno strumento utilizzato per l'ottimizzazione dei motori di ricerca.
I motori di ricerca utilizzano i crawler Web per fornire i dati aggiornati e le informazioni. Web crawler di fornire le informazioni richieste mediante la creazione di copie di pagine web che il motore di ricerca più tardi processi. Una volta che i dati sono stati elaborati i motori di ricerca indicizza le pagine e sono in grado di scaricare rapidamente le pagine durante la ricerca. Il processo di scansione del Web è un fattore chiave per l'ottimizzazione dei motori di ricerca. Ottimizzazione dei motori di ricerca è l'arte e la scienza di rendere attraenti le pagine web per i motori di ricerca. Computer persone chiamare il processo di utilizzo di un crawler per determinare il posizionamento di un sito web scansione.
Alcuni motori di ricerca utilizzano i crawler Web per operazioni di manutenzione. Web crawler può anche essere utilizzato per la raccolta indirizzi e-mail. Internet è un oceano di informazioni bocca aperta. Nel 2000, Lawrence e Giles fabbricati uno studio che indicava il motori di ricerca Internet sono indicizzate solo circa sedici per cento del Web. Web crawler sono progettati per essere scaricato solo una piccola quantità di pagine disponibili. Un minuscolo campione di ciò che Internet ha da offrire.
I motori di ricerca utilizzano i crawler Web perché si può scaricare e ordinare i dati più velocemente di un essere umano potrebbe mai la speranza. In uno sforzo per massimizzare la velocità di download riducendo la quantità di volte che una pagina web viene ripetuto utilizzare i motori di ricerca parallela web crawler. Web crawler parallelo richiedono una politica per la riassegnazione nuovo URL. Ci sono due modi per assegnare gli URL. Un assegnazione dinamica è ciò che accade quando un web crawler assegna dinamicamente un nuovo URL. Se c'è una regola fissa affermato fin dall'inizio della scansione che definisce come assegnare al nuovo URL esegue la scansione viene chiamato assegnazione statica.
Al fine di operare a picco efficienza crawler web devono avere una architettura altamente ottimizzata.
URL nominalization è il processo di normalizzazione e di modificare un URL in maniera coerente. URL nomalization è talvolta chiamato URL canonicalzation. Web crawler di solito uso nomilization URL per evitare la scansione di più di una fonte.
In un tentativo di attirare l'attenzione dei crawler web, e, successivamente, altamente classificati, i webmaster sono costantemente a ridisegnare i loro siti web. Molti webmaster contare su ricerche per parola chiave. Web crawler look per la posizione di parole chiave, la quantità di parole chiave, e link.
Se siete in procinto di creare un sito web tenta di evitare i frames. Alcuni motori di ricerca hanno web crawler che non è in grado di seguire i frames. Un'altra cosa che alcuni motori di ricerca non sono in grado di leggere sono le pagine di database tramite CGI o consegna, se possibile, cercare di creare pagine statiche e salvare il database per gli aggiornamenti. Simboli e l'URL possono anche confondere i crawler Web. Puoi avere il miglior sito web nel mondo, e se un web crawler non è in grado di leggere e probabilmente non otterrà il riconoscimento e la classifica che merita.
Web crawler sono collegati con ottimizzazione dei motori di ricerca. Il motore di ricerca più amichevole il tuo sito sia il più probabilità di web crawler visita il tuo sito. Se il tentativo di ottimizzare il sito si sono più invitante spider dei motori di ricerca o crawler per il tuo sito.
Article Source: http://www.articleset.com

You are welcome to publish or reprint this article free of charge, provided:
- you include the entire article, unchanged, including the "About The Author" box
- all hyperlinks remain active, including the bottom ArticleSet.com link (does not apply to print publications)
- you agree not to hold the authors nor ArticleSet.com liable for any loss profits, expenses, or any other damages resulting from the use or misuse of articles published on this website