Back to Question Center
0

Semalt: come fa Google a sapere quando (e perché) smettere di scansionare il tuo sito web?

1 answers:

Gli spider di Google sono importanti quanto la stessa campagna SEO quando pubblicizzano un sito web. Eseguono la scansione dei siti Web e indicizzano il contenuto di tutte le pagine che può trovare. Esegue anche reindicizzazione su pagine aggiornate del sito. Lo fa su base regolare, in base a diversi fattori. Includono, a titolo esemplificativo, il PageRank, i vincoli di scansione e i collegamenti trovati nella pagina. Il numero di volte in cui gli spider di Google eseguono la scansione di un sito dipenderà da uno o più di questi fattori.

Un sito web dovrebbe essere facilmente navigabile dai visitatori e dagli spider di scansione di Google. È il motivo per cui avere un sito web facile da esplorare è un ulteriore vantaggio della propria campagna SEO. In caso contrario, Google non sarà in grado di accedere al contenuto, riducendo di conseguenza il posizionamento del sito nella posizione del motore di ricerca .

Ross Barber, il Customer Success Manager di Semalt , definisce che due dei più importanti fattori di indicizzazione su cui Google si basa per influenzare la decisione di rallentare o interrompere la scansione del sito sono il tempo di connessione e HTTP codice di stato. Altri includono il comando disconnessione, i tag "no-follow" e il file robots.txt.

Connect Time e HTTP Status Codes

Il fattore tempo di connessione si riferisce al tempo che il crawler bot di Google impiega per raggiungere il server del sito e le pagine web. La velocità è molto apprezzata da Google poiché è altamente indicativa di una buona esperienza utente. Se la pagina web non è ottimizzata per la velocità, il sito sarà quindi di scarsa qualità. Gli spider di Google tentano di raggiungere il sito Web e, se il tempo necessario per creare una connessione è più lungo, si ritirano e eseguono la scansione meno frequentemente. Inoltre, se Google spinge ad indicizzare il sito web con la velocità corrente, potrebbe interrompere l'esperienza dell'utente in quanto potrebbe rallentare significativamente il suo server.

Il secondo fattore di indicizzazione sono i codici di stato HTTP che si riferiscono al modo in cui il server risponde a una richiesta di scansione del sito. Se i codici di stato rientrano nell'intervallo 5xx, Google si impegna a interrompere o ritardare la velocità con cui esegue la scansione del sito corrente. Qualsiasi cosa all'interno dell'intervallo 5xx è un indicatore di possibili problemi con il server e la risposta alla richiesta potrebbe essere problematica. A causa del rischio di ulteriori problemi, i robot di Google si fanno da parte e conducono l'indicizzazione quando il server è più raggiungibile.

Quando Google riprende a eseguire la scansione del sito?

Google crede nel fornire agli utenti la migliore esperienza e classificherà i siti che ottimizzano i loro elementi SEO verso questi obiettivi elevati. Tuttavia, se il sito Web attualmente presenta i problemi sopra menzionati, comanda al suo Googlebot di provare a eseguirne la scansione in un secondo momento. Se i problemi persistono, il proprietario perderà una grande opportunità per far passare a Google il suo contenuto e assegnargli una classifica meritata nei risultati di ricerca. Oltre a questi problemi, qualsiasi segno di spam impedirà al sito di comparire nei risultati di ricerca .

Come tutti gli altri algoritmi utilizzati da Google, anche i suoi spider sono automatici. Sono sviluppati per trovare, eseguire la scansione e indicizzare il contenuto in base a determinati parametri. Se il sito non è conforme a determinate best practice, l'indicizzazione non avverrà. Ci sono molti altri fattori coinvolti, ma ricorda sempre di prestare molta attenzione al tempo di connessione e ai codici di stato HTTP del tuo sito.

November 24, 2017
Semalt: come fa Google a sapere quando (e perché) smettere di scansionare il tuo sito web?
Reply