Analisi delle ricerche

Analizzare le ricerche effettuate dagli utenti e le loro scelte nelle pagine dei risultati può fornire utili indicazioni per stabilire quali documenti siano più rilevanti.

Traduzione della sezione del brevetto di google sui dati storici riguardante l'analisi delle ricerche. (scaricabile in formato PDF)

Come ogni altro servizio “al pubblico” i motori di ricerca devono tentare di fornire ai propri clienti, vale a dire agli utenti, quello che essi desiderano. A differenza di altre tipologie di attività però, i motori di ricerca non devono eseguire dispendiosi sondaggi per verificare i desideri dei propri clienti, in quanto sono proprio questi ultimi, tramite milioni di ricerche effettuate ogni giorno, a fornire un’enorme mole di materiale statistico pronta per essere analizzata. La memorizzazione e l’analisi di delle variazioni nel tempo di queste ricerche e dei comportamenti dell’utente rispetto alle pagine dei risultati forniti, sono dati molto importanti per i motori di ricerca, e permettono di rendere il comportamento del motore più flessibile e più pronto ad adattarsi, a particolari condizioni esterne.

Relativamente alla sezione specifica del brevetto di Google sui dati storici, viene affermato che il motore può rilevare quando determinate ricerche o tipologie di ricerche subiscono un incremento nel tempo al fine di dare una “spinta”, o meglio assegnare un punteggio maggiore, ai documenti che vengono ritenuti tematicamente correlati all’argomento relativo. Questo contribuisce a migliorare i risultati forniti dal motore di ricerca, ottenendo il risultato di relegare in posizioni più arretrate i documenti considerati meno a tema con le richieste degli utenti.

Per esempio, durante il periodo natalizio, a fronte della ricerca “regali” il motore, avendo rilevato che molti più utenti del solito cercano la parola “natale”, potrebbe decidere di usare questa informazione per spingere maggiormente i documenti che trattano di “regali” ma sono correlati anche alla ricerca “natale”, ottenendo l’effetto di spostare verso le prime posizioni un certo numero di documenti che probabilmente sono proprio quelli che interessano gli utenti in quel periodo.

Le stesse pagine dei risultati del motore possono essere monitorate e se ne possono ricavare dati molto interessanti, per esempio, relativamente all’esempio precedente, Google può dedurre che “natale” è un argomento “caldo”, cioè attuale ed importante, anche dal fatto che probabilmente nel periodo natalizio cresce il numero di documenti indicizzati riguardanti il natale. Ovviamente per Google è molto semplice rilevare quando esiste un picco nel numero dei documenti da lui restituiti per una ricerca.

Un altro fattore che può aiutare ad individuare un argomento “caldo” può essere la variabilità dei documenti restituiti da una ricerca, anche se il numero degli stessi non varia in modo sostanziale. Supponiamo per esempio che in un certo momento i risultati della ricerca “vincitore scudetto” cambino improvvisamente e la maggior parte di essi contenga il nome di una particolare squadra: questo significa che probabilmente questa squadra ha vinto lo scudetto, oppure è passata inaspettatamente alla guida della classifica, in ogni caso siamo di fronte ad un argomento “caldo” e Google trarrà le sue conclusioni.

Ma addirittura il comportamento degli utenti rispetto alle pagine dei risultati delle ricerche può venire “monitorato”. Ovviamente non stiamo parlando di violazione della privacy, in quanto questi dati non sono collegati ad utenti specifici.

Per i motori di ricerca è abbastanza facile verificare quale dei documenti restituiti in una “SERP” (la pagina dei risultati di una ricerca) viene selezionato dagli utenti. Questo può essere fatto, per esempio, attraverso un sistema di redirect o tramite javascript. Google ogni tanto ha l’abitudine di sostituire i link “diretti” verso i siti presenti nelle sue “SERP” con link che puntano ad uno script che poi dirotta l’utente in modo trasparente verso il sito finale. Per l’utente non cambia niente ma la sua scelta può essere adeguatamente registrata, analizzata ed utilizzata. Più in particolare se un documento presente all’interno di una pagina dei risultati viene selezionato più spesso di altri Google può dedurre che meriti un punteggio maggiore in quanto l’utenza finale lo trova più interessante degli altri.

Nella sezione del brevetto di Google sui dati storici relativa all’aggiornamento dei contenuti abbiamo spiegato che il motore di ricerca può assegnare un punteggio maggiore ai documenti più recenti e/o più spesso aggiornati, ma questo non è tutto: attraverso l’analisi del comportamento degli utenti nel tempo il motore può capire per quali ricerche gli utenti ritengono importante che i risultati siano particolarmente aggiornati.

In pratica se in una pagina dei risultati coesistono documenti più aggiornati/recenti e meno aggiornati/recenti il motore analizzando nel tempo le scelte degli utenti può capire se questi scelgono tendenzialmente i documenti recenti o meno e decidere così se per quella ricerca dovranno essere premiati o meno gli aggiornamenti frequenti e/o i documenti più recenti. Per esempio per ricerche del tipo “arte rinascimentale” non è affatto scontato che gli utenti preferiscano i documenti più aggiornati a meno che non sia in corso un evento “caldo” legato a tale ricerca, come una grande mostra o simili.

Infine viene fatto un accenno al fatto che se un documento risulta molto ben posizionato per una serie di ricerche discordanti, cioè riguardanti argomenti estremamente diversi questo può essere, “ma non necessariamente”, considerato un segnale di SPAM, cioè un tentativo di influenzare gli algoritmi del motore. Probabilmente una volta rilevata una situazione di questo genere Google effettua altri controlli sui dati relativi a quel documento, allo scopo di determinarne la natura ed il vero valore.

Quasi certamente il termine “documento” in questa accezione si riferisce più al sito che al singolo documento e il pensiero vola verso certe tipologie di siti che imitano dei “portali orizzontali” o delle directory al solo scopo di costruire una serie di pagine ottimizzate per gli argomenti più svariati, anche con contenuti reali praticamente inesistenti, più che altro per incassare i proventi di affiliazioni pubblicitarie.





Ultima modifica: 07/09/2005 - 14:42

Posizionamento Web
Guida al posizionamento nei motori di ricerca



Home Motori di ricercaOttimizzazione dei sitiFattori esterniRisorse

La ragnatela dei giochi di ruolo
Cardiofrequenzimetri

© 2004 www.posizionamento-web.com - Tutti i diritti riservati - Vietata la riproduzione anche parziale -