Hey, slow down Google!

Che Google abbia qualche problema è oramai noto, lo confessano anche loro.
Oggi ho scoperto un dato un po' "fastidioso" legato al crawling delle pagine e l'uso della banda.

Traffic

In questo mese, su questo blog, sono state visitate ad oggi 77308 pagine da parte di utenti e 77977 da parte di spider.
Il consumo di banda, come riportato dal grafico, propende leggermente verso gli spider per valori di 1.03 GB da parte di utenti e ben 1.43 GB da parte di spider. E qui la prima domanda: ma gli spider non dovrebbero richiamare "solo testo"? Cioè, banalizzando, uno spider quando scansiona non carica (di norma) immagini, CSS, javascript... e allora come è possibile questo consumo?

Ma non è tutto. Ho analizzato quali fossero gli spider più attivi e sono rimasto sconcertato!

Google, slow down baby!

Crawlers traffic

Gli utenti hanno richiamato 77308 pagine per un consumo di 1.43 GB, Google da solo ha succhiato 23112+26 pagine per un consumo di 1.04 GB!
Non ho mai amato la matematica, ma questa proporzione mi sembra assurdo considerato che Google si appoggia ad uno spider! Cioè, di 1.43 GB di traffico di spider ben 1.04 GB è causato da Google.

Mmm, mi sa che qualcosa non funziona...