In principio era AltaVista…

Ho cominciato a lavorare con Internet nel 1994.

Quando portavi Internet ai clienti, configuravi il modem e il PPP e alla fine, se tutto andava bene, eri connesso a Internet. La prima domanda che la persona che avevi davanti ti faceva era “e adesso?”

Bella domanda.

Ricordo di aver creato anche una pagina in cui elencavo (e per un po’ di tempo tenevo aggiornati) i siti più interessanti da visitare, per dare ai clienti una sorta di “menu principale” da cui partire (anni dopo si sarebbero chiamati portali).

In quegli anni la Digital stava esalando i suoi ultimi respiri e, in una sorta di canto del cigno, aveva creato AltaVista, che sarebbe diventato il primo motore di ricerca famoso;  non il primo in assoluto, primato che spetta a Lycos. Lo scopo di Digital era di dimostrare la capacità di storage e di calcolo dei suoi computer, il risultato per tutti è che finalmente c’era un posto in cui cercare le informazioni. Il sistema era molto grezzo e si basava inizialmente sulla pura indicizzazione dei testi delle pagine HTML. Ben presto il metodo dimostrò i propri limiti, tra i quali il livello di attaccabilità da parte di spammer di nomi (poi si sarebbero chiamati esperti di SEO, ma è un’altra storia).

AltaVista non era certo l’unico: nei primi tempi Yahoo! utilizzava un metodo tassonomico gerarchico validato da umani per classificare i siti, ma era destinato a fallire per la mole soverchiante di lavoro, la difficoltà e la poca scientificità del lavoro.

Un altra famiglia di algoritmi che stava prendendo piede in quel periodo erano quelli basati su HITS (o hub/authority). Sul finire del secolo scorso Larry Page e Sergey Brin hanno preso come base questo concetto per sviluppare il loro PageRank.

Anziché valutare il numero di occorrenze di una parola in una pagina veniva valutata la popolarità della pagina. In altre parole veniva presa in notevole considerazione una delle caratteristiche fondamentali di un sistema ipertestuale: il collegamento tramite hot text (o link). Questo avveniva contando tutti i link verso quella pagina, chiedendo, di fatto, al web di eleggere l’autorità in materia.

Quindici anni fa Google è nato proprio in questo modo.

L’efficienza e, in seguito, l’adattabilità e la complessità di PageRank hanno fatto sì che Google diventasse subito relativamente famoso. In sostanza, funzionava meglio degli altri perché permetteva di trovare quello che si stava cercando e non quello che gli spammer volevano propinarti.

La partenza è stata lenta anche per Google perché dai primi passi del 1998 abbiamo dovuto attendere fino al 2001 perché venissero incluse le immagini e il correttore ortografico e l’autocompletamento non è arrivato prima del 2005.

Dopo 15 anni è un prodotto maturo e pervasivo. Magari in qualche laboratorio già adesso si stanno sperimentando gli algoritmi di un metodo che tra una decina d’anni renderà Google un prodotto vecchio, nel frattempo buon compleanno! (via Inside Search)

Autore: Luigi Rosa

Consulente IT, sviluppatore, SysAdmin, cazzaro, e, ovviamente, geek.

4 pensieri riguardo “In principio era AltaVista…”

  1. Beh, penso di essere un po’ più vecchio: i miei primi collegamenti avvenivano con il protocollo SLIP ed un modem a 1200 baud (allora il Comune di Bologna con Iperbole era avanti…), browser Mosaic e .. altavista per cercare!

    Buon compleanno, Big G!
    Andrea

  2. Il pagerank per anni era spammabile tranquillamente… chi si ricorda le varie email a catena che giravano dicendo “scrivi questo su google e clicca su Mi sento fortunato”?

    La differenza era che con Altavista ottenevo quello che chiedevo, con Google ottenevo quello che Google pensava che io volessi.

    Ed ha mantenuto il vizio… qualche mese fa ero con una persona che usava il navigatore di Google sul cellulare, ha chiesto via X a Montecatini e Google giustamente ha deciso che noi non sapevamo dove volevamo andare, e ci ha indirizzato a via X nel comune di Massa e Cozzile, confinante con Montecatini.

    Tutte le aziende che pensano di sapere meglio dell’utente cosa l’utente vuole dovrebbero chiudere. Loro non lo sanno, ma e`meglio cosi`. Lo so io.

      1. Una macchina con Trumpet Winsock e Netscape 2.0 ce l’ho ancora, e` Altavista che non c’e` piu` 🙂

Spazio per un commento