Aggiornamento dei contenuti

La frequenza e l'entità degli aggiornamenti nei contenuti di pagine e siti web possono essere valutate dai motori ed influire sul loro posizionamento.

Traduzione della sezione del brevetto di google sui dati storici riguardante l'aggiornamento dei contenuti (scaricabile in formato PDF)

Gli spider dei motori di ricerca scandagliano il web memorizzando il contenuto delle pagine, e più in generale dei documenti, che vi trovano. Questo è verificabile anche semplicemente osservando le versioni cache messe a disposizione nelle serp (pagine dei risultati) di Google ed MSN per ogni documento presente nel loro database. Sotto Ad ogni risultato è presente un link testuale “Versione cache” che, seguito, visualizza una copia esatta del documento specificando la data e l’ora a cui la copia si riferisce, che corrisponde in generale al momento dell’ultimo passaggio dello spider.
Queste copie del documento originale vengono memorizzate da qualche parte su dei server di proprietà del motore di ricerca ed è su queste copie che il motore applica i suoi algoritmi quando deve ordinare i documenti da restituire all’utente.

Fino a qui niente di nuovo, ma facciamo un ulteriore passo in avanti: perché i motori di ricerca dovrebbero cancellare le vecchie versioni dei documenti che hanno memorizzato? Per mere questioni di risorse hardware?
Può darsi, ma ricordiamoci che per come si è evoluta l’informatica negli ultimi dieci anni le risorse hardware sono in genere considerate l’ultimo dei problemi ed è ragionevole pensare che nella misura in cui i motori di ricerca individuino la necessità di risorse del genere riescano a farvi fronte, anche se il numero di documenti in gioco in questo caso è davvero rilevante.

Nel documento relativo al brevetto di Google sui dati storici, e più precisamente nei paragrafi che vanno dallo 0045 allo 0056 viene chiaramente spiegato che gli aggiornamenti dei documenti possono venire monitorati allo scopo di assegnare agli stessi un punteggio che poi avrà il suo peso nel posizionamento degli stessi.

Viene specificato inoltre che, ove manchino adeguate risorse hardware per la memorizzazione dei documenti possono venire comunque memorizzati dei vettori di termini rappresentativi dei documenti, oppure altre loro rappresentazioni matematiche, o ancora dei sommari, o degli estratti delle parti considerate più rilevanti che permettano di monitorare e valutare gli aggiornamenti dei documenti anche senza memorizzarli in modo integrale.

Passando invece ad analizzare le valutazioni che Google può effettuare riguardo agli aggiornamenti dei documenti, viene subito specificato che sia la frequenza che la quantità di tali aggiornamenti sono fattori presi in considerazione.

Viene suggerito che la frequenza degli aggiornamenti possa essere considerata in vari modi, per esempio considerando il numero di aggiornamenti effettuati in un periodo di riferimento ( che ovviamente non viene specificato ) oppure calcolando la media del tempo trascorso fra gli aggiornamenti in un periodo di tempo.

Il concetto di “ritmo” con il quale un dato evento si verifica viene considerato importante anche a questo riguardo. Infatti il ritmo con il quale vengono aggiornati i documenti in un determinato periodo di tempo può essere confrontato con il ritmo registrato in un periodo precedente allo scopo di valutare se ci sia una tendenza alla crescita o al rallentamento degli aggiornamenti ed assegnare al documento un punteggio rispettivamente maggiore o minore.

Il concetto di “documento” per come viene inteso in questa contesto non è necessariamente sinonimo di “pagina web” in quanto viene specificato chiaramente che, a seconda dei casi, può essere inteso sia un singolo file che un insieme di molti file o anche un intero sito web, una email, un post di un newsgroup, di un blog o altro ancora. Infatti dove si fa riferimento al monitoraggio della entità degli aggiornamenti viene detto che un sistema per determinarla può essere quello di conteggiare il numero di pagine nuove aggiunte in un periodo di tempo, oppure di calcolare il rapporto fra le pagine totali che formano il documento e le pagine nuove aggiunte in un periodo di tempo.

Quando invece per documento viene intesa la singola pagina web viene detto senza mezzi termini che il motore di ricerca è in grado di distinguere varie parti all’interno di essa ed assegnare a ciascuna un peso differente.

Nella fattispecie viene suggerito a titolo di esempio che aggiornamenti nei javascript, nei commenti, nella pubblicità, negli elementi di navigazione o nei tag data/giorno sono per lo più ignorati, mentre al contrario aggiornamenti nel titolo o nel testo dei link uscenti sono considerati molto importanti.

Inoltre, ai documenti per i quali viene registrato un incremento nel ritmo degli aggiornamenti e contemporaneamente l’entità dei cambiamenti supera una certa soglia, può venire assegnato un punteggio maggiore di quello dato a documenti con lo stesso ritmo di aggiornamenti ma nei quali l’entità dei cambiamenti rimane al di sotto della soglia.

Infine, per capire se e quanto per determinate ricerche sia importante premiare o meno i documenti aggiornati più recentemente, Google può verificare quali siano le date di aggiornamento di tutti i documenti restituiti da una ricerca e calcolare una data media specifica della ricerca. Questo serve ad assegnare successivamente a ciascun documento un punteggio in base allo scostamento dalla data media per quella ricerca.





Ultima modifica: 07/09/2005 - 14:42

Posizionamento Web
Guida al posizionamento nei motori di ricerca



Home Motori di ricercaOttimizzazione dei sitiFattori esterniRisorse

La ragnatela dei giochi di ruolo
Cardiofrequenzimetri

© 2004 www.posizionamento-web.com - Tutti i diritti riservati - Vietata la riproduzione anche parziale -