Ho cominciato a lavorare con Internet nel 1994.
Quando portavi Internet ai clienti, configuravi il modem e il PPP e alla fine, se tutto andava bene, eri connesso a Internet. La prima domanda che la persona che avevi davanti ti faceva era “e adesso?”
Bella domanda.
Ricordo di aver creato anche una pagina in cui elencavo (e per un po’ di tempo tenevo aggiornati) i siti più interessanti da visitare, per dare ai clienti una sorta di “menu principale” da cui partire (anni dopo si sarebbero chiamati portali).
In quegli anni la Digital stava esalando i suoi ultimi respiri e, in una sorta di canto del cigno, aveva creato AltaVista, che sarebbe diventato il primo motore di ricerca famoso; non il primo in assoluto, primato che spetta a Lycos. Lo scopo di Digital era di dimostrare la capacità di storage e di calcolo dei suoi computer, il risultato per tutti è che finalmente c’era un posto in cui cercare le informazioni. Il sistema era molto grezzo e si basava inizialmente sulla pura indicizzazione dei testi delle pagine HTML. Ben presto il metodo dimostrò i propri limiti, tra i quali il livello di attaccabilità da parte di spammer di nomi (poi si sarebbero chiamati esperti di SEO, ma è un’altra storia).
AltaVista non era certo l’unico: nei primi tempi Yahoo! utilizzava un metodo tassonomico gerarchico validato da umani per classificare i siti, ma era destinato a fallire per la mole soverchiante di lavoro, la difficoltà e la poca scientificità del lavoro.
Un altra famiglia di algoritmi che stava prendendo piede in quel periodo erano quelli basati su HITS (o hub/authority). Sul finire del secolo scorso Larry Page e Sergey Brin hanno preso come base questo concetto per sviluppare il loro PageRank.
Anziché valutare il numero di occorrenze di una parola in una pagina veniva valutata la popolarità della pagina. In altre parole veniva presa in notevole considerazione una delle caratteristiche fondamentali di un sistema ipertestuale: il collegamento tramite hot text (o link). Questo avveniva contando tutti i link verso quella pagina, chiedendo, di fatto, al web di eleggere l’autorità in materia.
Quindici anni fa Google è nato proprio in questo modo.
L’efficienza e, in seguito, l’adattabilità e la complessità di PageRank hanno fatto sì che Google diventasse subito relativamente famoso. In sostanza, funzionava meglio degli altri perché permetteva di trovare quello che si stava cercando e non quello che gli spammer volevano propinarti.
La partenza è stata lenta anche per Google perché dai primi passi del 1998 abbiamo dovuto attendere fino al 2001 perché venissero incluse le immagini e il correttore ortografico e l’autocompletamento non è arrivato prima del 2005.
Dopo 15 anni è un prodotto maturo e pervasivo. Magari in qualche laboratorio già adesso si stanno sperimentando gli algoritmi di un metodo che tra una decina d’anni renderà Google un prodotto vecchio, nel frattempo buon compleanno! (via Inside Search)
Lascia un commento