Google è il motore di ricerca più usato al mondo. I dati sono sotto gli occhi di tutti. E’ preferito dal 95% dei cittadini europei e dal 75% degli americani. In Italia nove persone su dieci preferiscono Google, e solo una persona su dieci cerca informazioni su altri motori di ricerca.

 

Ma a cosa è dovuto il grande successo di questo motore nato nel 1997?

 

Due studenti di Stanford, applicando la Teoria delle Reti, intuirono che le pagine che riportavano un maggior numero di link erano più importanti delle altre. Questo criterio elementare sta alla base del successo di quella che è diventata un’azienda che fattura ogni anni miliardi di dollari.

Come funziona Google.it?

Una risposta che potrebbe essere utile a quanti fanno del posizionamento delle loro aziende sul web il proprio lavoro. E’ quanto hanno a cuore quelli che lavorano con SEO e SEM.

 

Posizionarsi nella prima pagina di Google significa essere trovati da un gran numero di persone, e quindi da potenziali clienti. Tradotto in parole più prosaiche, potrebbe voler dire guadagnare più soldi rispetto agli altri competitors. In qualche modo proprio questa questione ha toccato le corde dei primi ingegneri che a metà anni ’90 dovevano decidere in quale ordine elencare le pagine internet all’interno di una pagina di Google. Ossia rispondere alla domanda: quale sito merita di stare in cima rispetto ad altri? E perché?

 

Per spiegare come funziona Google bisogna introdurre il concetto di “query“. La query è un’interrogazione che un utente di internet pone al database. Se un utente digita sulla stringa del suo motore di ricerca preferito “come funziona google”, sta ponendo una domanda al database, e il motore di ricerca è un vero e proprio database, per ottenere informazioni, le più precise che sia possibile rintracciare.
Quindi cosa fa Google? Setaccia tutto il web.

 

Google, la scansione del web

 

La scansione avviene con dei software, il più importante è un crawler web chiamato Googlebot, che rileva continuamente pagine nuove per essere sempre aggiornato.

 

La ricerca viene operata da un gran numero di computer, perché le pagine da controllare sono miliardi. La logica che sta dietro questa ricerca ovviamente è algoritmica.

 

Googlebot non fa altro che visitare ciascuno dei siti internet, estrapola il link alla pagina e lo aggiunge al suo elenco che poi verrà analizzato ai fini della query originaria. Mentre esegue questa operazione, ogni volta che avviene una query, dunque Google si aggiorna. Ovviamente è un’operazione che non prevede nessun compenso per l’azienda californiana. Se la mia pagina internet viene scansionata da Googlebot, non c’è passaggio di denaro tra me e Google.

 

Attraverso robots.txt i proprietari di domini possono anche decidere di non essere scansionati da Google. In ogni caso uno strumento come robots.txt, che Google mette a disposizione degli utenti, permette ai webmaster di affinare le armi per rendere più rintracciabile la loro pagina web. Robots.txt è solo uno dei tanti strumenti utili ad agevolare l’indicizzazione. Le possibilità offerte ai webmaster sono differenti.

 

Per esempio, se sono titolare di un sito posso decidere che la mia pagina venga visualizzata senza lo snippet. Lo snippet è una sorta di riassunto della pagina web, e compare sotto i titoli all’interno dei risultati della ricerca. Google permette ai webmaster di utilizzare una funzione molto utile, ossia usufruire della ricerca personalizzata all’interno del sito. In questo modo permette all’utente di avere un piccolo Google all’interno della propria pagina, per la ricerca di contenuti specifici che non siano immediatamente rintracciabili dal visitatore ad una prima escursione all’interno del sito.

 

Googlebot dunque estrapola dei link effettuando un rendering dei contenuti trovati; i dati ottenuti vengono analizzati, si evidenziano i termini più usati, escludendo tutte le parole che fanno solo rumore di fondo.

 

Google e l’indicizzazione

google e l'indicizzazione

 

Viene costruito dunque un indice, per ogni parola evidenziata si crea una lista di pagine web in cui quella parola viene usata. Queste pagine associate ad ogni singola parola sono chiamate “shards“, ossia frammenti. In questo modo tutto il web viene indicizzato e poi si effettua un’ulteriore operazione: si aggiungono i metadati, sono etichette che descrivono in pochi termini il contenuto di ciascuna pagina, in modo che le pagine che contengono questi metadati siano ritrovabili facilmente in caso di ricerca.

 

Ogni volta che un utente compie una ricerca, ossia ogni volta che Google riceve una query, il sistema la analizza, cerca di comprenderla espandendola, prendendo in esame i sinonimi delle parole utilizzate. In sostanza quello che fa è cercare di comprendere il contesto.

 

La domanda che il sistema si pone è la seguente: di che cosa stiamo parlando? La query, quindi l’insieme di parole inserite dall’utente nella stringa del motore di ricerca, per sapere “come funziona google” vengono inviate a tutte i “frammenti”, i miliardi di pagine che il database annovera al suo interno.

 

Le pagine che rispondono positivamente vengono recuperate dal database e viene loro assegnato un punteggio. Ovviamente più il punteggio è alto maggiore sarà l’attinenza della pagina ritrovata alla query dell’utente.

 

PageRank e spam

 

Circa duecento fattori entrano in gioco per l’assegnazione di un punteggio. Il PageRank è uno di questi fattori. Per esempio, se il link al mio sito è riportato su altri siti, il PageRank alla mia pagina sarà più elevato di altre pagine che abbiano i miei stessi contenuti ma siano prive di segnalazioni da parte di altre pagine web.

 

A proposito di link, Google esercita una selezione costante che risponde ad un criterio molto selettivo, per quanto riguarda i collegamenti ad altri siti. I link ai siti spam vengono considerati negativamente e, come scritto in precedenza, sono controproducenti ai fini del punteggio che Google assegna alle singole pagine. Anche tag appropriati e coerenti con i contenuti hanno un effetto benefico ai fini della classificazione all’interno della SERP.

 

La lotta allo spam viene effettuata combinando gli algoritmi ai controlli manuali. Google fa sapere che nonostante il web sia uno spazio vastissimo comprendente miliardi di domini, lo 0.22% dei siti contrassegnati da spam da parte dell’azienda californiana sono stati rintracciati con il controllo manuale. Altre volte Google invece è costretta a rimuovere dai risultati della ricerca alcuni domini per motivi prettamente legali.

 

Tag

 

Ovviamente non bisogna dimenticare che Google si è evoluto negli ultimi vent’anni. Il successo planetario ha attirato anche l’attenzione degli inserzionisti. Gli ads (advertisements) sono entrati prepotentemente nella vita degli utilizzatori di internet. Questo fattore entra in gioco anche nel processo di selezione delle pagine del sistema, che dunque terrà conto di altri fattori, gli ads appunto ma anche un fattore strategico, l’attinenza del contesto.

 

Googlebot è in grado di analizzare molti tipi di contenuti, le informazioni relative ai Tag, per esempio. Solitamente chi possiede un blog o un sito internet sa che se desidera che un contenuto sia trovato più facilmente dai motori di ricerca, dovrà inserire alcuni tag.

 

Se si tratta di un blog, gli articoli dovranno avere dei tag. I tag sono parole che fungono da richiamo, perché sono molto ricercate sul web. Ovviamente devono avere un’attinenza con il contesto del contenuto. Sarebbe controproducente indicizzare il proprio contenuto con tag del tutto inappropriati ma molto ricercati, con il fine unico di attirare visitatori.

 

Googlebot analizza allo stesso modo i tag title, che non sono i titoli di un articolo all’interno del corpo della pagina web bensì il titolo che compare in alto, ossia il titolo della pagina nella scheda del browser; allo stesso modo Googlebot analizza gli attributi Alt, detti anche tag alt, che sono i contenuti che descrivono le immagini di un sito.

 

Googlebot però non è in grado di analizzare qualunque tipo di elemento. Le pagine dinamiche, per esempio, oppure certi file multimediali particolarmente complessi sfuggono al controllo e all’analisi di Google.

 

La SERP

 

come funziona google serp

 

A questo punto entra in gioco la SERP. La SERP è il posizionamento sulle pagine di google, ossia quello di cui si parlava all’inizio. La prima pagina di google, la lista dei siti, il risultato della ricerca “come funziona google”, è la SERP. Che letteralmente significa “Search Engine Report Page“.

 

Google utilizza un sistema che ha l’obiettivo di soddisfare la ricerca dell’utente. L’obiettivo non è fornire il maggior numero di informazioni ma trovare e mettere a disposizione dell’utente le informazioni che si aspettava di trovare. A partire da questo principio la SERP tiene conto della query ma anche dell’intenzione che c’è dietro la query.

 

Per fare un esempio. Se sono un appassionato di auto d’epoca ma non ricordo il nome del modello di una Alfa Romeo che ho visto passare davanti ai miei occhi stamattina, inserirò nel motore di ricerca probabilmente tutte le parole che possono aiutare Googlebot a restituirmi l’informazione che cercavo. Google comprende che quello che sto cercando sono delle immagini abbinate all’informazione che cerco. Dunque selezionerà i siti che rispondono alla mia necessità.

 

Quindi mi fornirà link a siti che forniscono sia immagini che notizie, magari sull’anno di costruzione dell’auto, sui modelli che sono stati progettati, ogni particolare che può aiutarmi a risalire all’informazione che cerco, fornendomi articoli e immagini. Se invece sto cercando esclusivamente informazioni scritte e non ho alcun bisogno che Google mi fornisca video o immagini, Googlebot escluderà dalla SERP tutti i link a siti con immagini e video, ai contenuti multimediali, per intenderci. Almeno per quanto riguarda le primissime pagine, che sono poi quelle più rilevanti e consultate dagli utenti.

 

Knowledge Graph, intelligenza artificiale?

 

Gli algoritmi usati da Google, in sostanza, sono davvero i primi rudimentali tentativi di intelligenza artificiale, in quanto ricreano il contesto, quello che l’utente ha nella mente, anche se non è in grado di esprimerlo praticamente. E’ il principio sviluppato da Google con Knowledge Graph, che è stato applicato a milioni di oggetti che possono rientrare nell’ambito di una ricerca.

 

Questo principio si applica soprattutto in caso di query ambigue. La virtù di questo algoritmo sta nella sua flessibilità. Una query poco chiara è un grande problema se la rapportiamo ai miliardi di pagine disponibili nel web. Complicherebbe il lavoro di Googlebot o lo manderebbe completamente fuori strada. L’obiettivo di Knowledge Graph è proporre all’utente più contenuti, attraverso un bouquet di informazioni, in modo da fornire la traccia che lui stava cercando all’interno di un ventaglio di possibilità; ma non solo, Knowledge Graph, mettendo in relazione elementi affini all’interno del grafico, offre la possibilità di collegamenti che poi verranno utilizzati dall’utente per ampliare la sua ricerca.

 

In sostanza, semplificando il concetto, Google non si limita a cercare ma suggerisce anche possibilità a cui l’utente non aveva pensato, anche basandosi sulle informazioni cercate e trovate da milioni o soltanto decine di utenti prima di lui. Questo è uno dei principi dell’intelligenza.

 

Altre funzioni, mi sento fortunato…

 

Google ha tra le sue funzioni anche alcuni servizi che aiutano l’utente a cercare in maniera più immediata i contenuti di cui ha bisogno.

 

Una di queste funzioni è il tasto “Mi sento fortunato“. E’ la seconda voce in home page su Google ed è costata negli anni molti milioni di dollari e ha anche visto cambiare la propria funzione nel corso del tempo.

 

Oggi funziona così: in seguito ad una ricerca da parte dell’utente, il risultato che si ottiene cliccando sul tasto “mi sento fortunato” non riporta l’elenco delle pagine web più attinenti alla ricerca, ma direttamente la pagina web più coerente con la query, ossia il primo risultato dell’elenco.

 

Spero che la guida ti sia stata d’aiuto per capire meglio come funziona Google. Ti aspetto nei commenti 🙂 

 

 

Francesca Galasso
Mi occupo prevalentemente di realizzazioni siti web e SEO. Aiuto aziende e liberi professionisti ad avviare il loro business online. Gestisco anche l’aspetto social e grafico dei clienti. Sviluppo inoltre E-commerce con la relativa consulenza

 

Potrebbe interessarti  Case Study: come ho aumentato la visibilità di un giornale online