Il traffico dei documentiIn questa sezione del brevetto di Google sui dati storici si illustrano alcune applicazioni dell’analisi del traffico verso i documenti, un parametro difficile da monitorare ma anche per questo i motori si stanno attrezzando.Traduzione della sezione del brevetto di google sui dati storici riguardante il traffico. (scaricabile in formato PDF) Come si è visto a proposito del calcolo del PageRank, un parametro importante negli algoritmi di ordinamento dei motori di ricerca è l’importanza che i documenti hanno, o si reputa che abbiano, rispetto alla struttura del web nel suo complesso. Nel caso specifico del PageRank questa valutazione viene fatta in base alla qualità ed alla quantità dei link che puntano al documento da valutare, ma specialmente adesso che molti webmaster procurano ai loro siti una grande quantità di link, che non avrebbero mai cercato o inserito se nessuno gli avesse suggerito di farlo per migliorare il posizionamento, questo parametro rischia di perdere parte della sua importanza. Nella misura in cui un motore di ricerca ha accesso ad informazioni riguardanti il traffico generato dai documenti, queste sono senz’altro un metodo molto diretto per capire l’importanza effettivamente attribuita dagli utenti ai documenti in questione. Ma come può un motore di ricerca ottenere questo tipo di informazioni, che tipicamente sono accessibili soltanto al webmaster del sito? I metodi esistono, ma sono ovviamente indiretti e non esaustivi, nel senso che si riferiscono sempre ad uno specifico sottoinsieme di utenti o ad uno specifico sottoinsieme di siti web. Per cominciare esistono le statistiche di Alexa. Alexa fornisce una toolbar che permette di visualizzare per ogni sito web visitato un parametro indicativo del traffico generato da quel sito. In realtà il parametro non è relativo al traffico generato dalle visite di tutti gli utenti del web, ma soltanto da quelli che hanno installato la toolbar di Alexa. Non ho dati precisi che riportino il numero di utenti che hanno attualmente scaricato o installato questa toolbar, ma credo proprio che siano una piccola percentuale rispetto al totale dei navigatori, per cui i dati mostrati dalla toolbar possono essere indicativi, ma vanno presi con le molle, in quanto potrebbero facilmente riferirsi ad un target di utenti non abbastanza generico da permettere estrapolazioni valide. Se pensate che le toolbar dei vari motori di ricerca, come per esempio quelle di Google Yahoo e MSN servano anche a raccogliere questo tipo di dati, probabilmente avete ragione. Per esempio la Toolbar di Google vi mostra il valore di PageRank di ogni pagina visitata e per fare questo deve comunicare ad un server di Google l’indirizzo della pagina. Pensare che questo indirizzo non venga memorizzato per fini statistici sarebbe una grossa ingenuità. Un altro sistema che Google può usare per stimare il traffico generato dai documenti è il suo servizio di Adsense attraverso il quale ormai numerosissimi webmaster pubblicano annunci degli inserzionisti del servizio Adwords. Per tutti i documenti sui quali vengano pubblicati tali annunci Google non solo può, ma deve verificare il traffico generato, perché questo è indicativo delle impressioni generate dagli annunci, che poi vengono confrontate con i clic effettivi sugli stessi per calcolarne il rendimento. Anche Yahoo si sta allineando a Google nella fornitura di questo tipo (assai redditizio) di servizio. Google afferma anche di essere in grado di ottenere informazioni utili anche dal monitoraggio del tipo di inserzioni presenti in un documento e dalla percentuale di clic che queste ricevono. Cosa abbastanza semplice nel caso delle inserzioni da lui fornite, ma probabilmente impossibile altrimenti. Un altro tool di Google, che probabilmente da questo punto di vista avrebbe rappresentato una killer-application, era il web accelerator, ovvero una applicazione che permetteva, una volta installata, di navigare nel web ricevendo invece delle pagine originali la loro copia cache memorizzata da Google su un suo server proxy, velocizzando così la navigazione. Attualmente il link per il download dell’applicazione è stato rimosso, sebbene l’indirizzo con la descrizione del servizio sia ancora attivo, perché fu quasi subito verificato che navigando con il Google accelerator (Beta) alcuni utenti potevano accedere a documenti che normalmente avrebbero richiesto un’autorizzazione per essere visualizzati. Un progetto per certi versi simile, che ha appena viso la luce è invece Google Secure Access, un software che permette di collegarsi ad internet tramite una VPN con alcuni access-point di Google, superando così alcune debolezze dello standard WI-fi. Gli access point di Google sono per adesso molto pochi, ma sono sicuramente destinati ad aumentare, forse fino a formare una vera e propria "Googlenet", ed è ovvio che i dati registrati da questi server, che praticamente fungono da router per gli utenti, saranno utilizzati per fini statistici, pur nel rispetto della privacy dei navigatori, cioè non associando i dati agli utenti. Ultima modifica: 16/09/2005 - 16:11 |
Posizionamento Web
|