Il brevetto di Google sui dati storiciUna fonte importante per recuperare dati che permettano di assegnare un valore ai documenti nel web è l'evoluzione nel tempo di alcuni fattori legati ai documenti stessi, ovverosia i dati storici.Finora abbiamo accennato a fattori interni ed esterni al sito che influiscono sul posizionamento nei motori di ricerca, ma abbiamo parlato di questi fattori come immobili nel tempo, come delle fotografie, per così dire. Eppure esiste un’altra importantissima fonte che permette di ricavare dati assai utili a capire quanto un sito sia importante e soprattutto aggiornato, basta fare un piccolo salto mentale e pensare che il web, come tutte le entità di questo mondo esiste sì nello spazio ( anche se in questo caso si tratta di spazio-cibernetico, o cyberspazio per gli amanti di William Gibson ) ma anche nel tempo. Se voi possedeste un motore di ricerca e i vostri spider registrassero continuamente ( come fanno davvero gli spider di tutti i motori di ricerca ) i contenuti delle pagine di tutti i siti e tutti i link che puntano ad esse, sostituireste semplicemente i dati “vecchi” con i “nuovi” oppure li terreste tutti da parte per poter capire come certe caratteristiche dei siti si evolvano col passare dei mesi e degli anni? Quelli fatti precedentemente sono solo due esempi, ma sono estremamente significativi. Se un motore di ricerca confrontando i dati storici relativi ad un sito capisce che i suoi contenuti aumentano regolarmente è legittimato a supporre che le notizie inserite non siano obsolete e che quindi a parità di altri fattori siano da preferire a quelle riportate da un sito simile ma che non viene modificato da anni. Allo stesso modo se un motore di ricerca capisce che il numero di link che puntano ad un documento sta crescendo regolarmente e continuativamente può supporre che il documento in questione sia apprezzato da molte persone e che magari sia molto attuale e da preferire ad un documento per altri versi equivalente ma a cui magari alcuni o molti webmaster abbiano tolto link negli ultimi mesi. Quelle di cui stiamo parlano non sono solo mere ipotesi, perché il 31 marzo 2005 Google ha registrato un brevetto intitolato Information retrieval based on historical data ( Reperimento di informazioni basato su dati storici ) dove in 131 paragrafi vengono esaminati molti tipi di approcci relativi a numerosi algoritmi che permettono di assegnare punteggi ai documenti del web facendo ipotesi basate sulla variazione nel tempo di numerosi fattori. Dal momento che il documento in questione, come si legge nella sua prima pagina, risulta essere stato archiviato nel 2003 è molto probabile che questi fattori facciano parte integrante già da tempo degli algoritmi di Google, e a dirla tutta questo documento da solo basta a spiegare quello che nell’ambiente SEO viene chiamato “effetto sandbox” che in breve consiste nell’invisibilità quasi totale dei nuovi siti per ricerche importanti per un periodo che va dai 6 ai 10 mesi o più. In questa sezione verranno analizzate e spiegate le parti che ritengo più importanti di questi brevetti e inoltre, fra breve, sarà disponibile una traduzione completa del documento stesso che sto realizzando in collaborazione con Motori e Ricerca. Il lavoro di traduzione è iniziato in un thread dell’ottimo forum sul posizionamento di Giorgio Taverniti e adesso sta per vedere la sua conclusione nel documento che presto pubblicheremo. Ultima modifica: 07/09/2005 - 14:45 |
Posizionamento Web
|
| Link-popularity | |
| PageRank | |
| I dati storici | |
| |
| Trovare i backlink | |
| Hilltop | |
| Trustrank |