Abbiamo guardato dentro Google e non ci è piaciuto
L'enorme quantità di documenti trafugati ha dimostrato come Google non ci avesse detto tutta la verità sul funzionamento del suo motore. Scopriamo cosa c'era in quelle 2500 pagine.
Tempo stimato per la lettura: 12 minuti
Una premessa importante: questa newsletter settimanale nasce, cresce e si concretizza nel giro di qualche ora, rubata al mio tempo libero e alla mia famiglia. A volte capita che abbia il tempo di rileggere tutto a distanza di giorni, altre volte non ho nemmeno il tempo di riguardarla. Se trovi degli errori, piccoli o grandi che siano, porta pazienza. Magari segnalameli, te ne sarò grato.
» HO BISOGNO DI TE!
Insalata mista è arrivata alla puntata n.72 e forse è il caso di ripensare un po’ il formato in generale. Se ti piace questa newsletter, per favore, ti chiedo di impegnare 2 minuti del tuo tempo per rispondere a queste domande. Mi sarà molto utile.
Grazie! 🫶🏻
» PENSIERI FRANCHI: Il segreto per vincere le elezioni è non prendere posizioni
→ “Pensieri Franchi” è il mio editoriale, i miei pensieri in libertà. Se stai cercando l’approfondimento che dà il titolo a questa Insalata, prosegui un po’ più in giù.
Tra pochi giorni si voterà per un sacco di cose, ma certamente l’appuntamento più importante, piaccia o meno, sono le elezioni per il Parlamento Europeo. Votare è semplice, ogni paese fa delle elezioni interne e quindi si tratta di votare il partito con cui ci identifichiamo di più. Poi questo farà parte di un gruppo di partiti europei, con posizioni più o meno compatibili con quelle del partito che abbiamo votato.
Di base, però, nessuno di noi (tranne i più impallinati) conosce le sigle dei partiti europei e la loro composizione, figuriamoci il programma politico. Se vi parlassi di sigle come ID o ECR, vi direbbero qualcosa? Immagino di no. Già facciamo fatica a imparare le sigle e le posizioni dei partiti italiani, figuriamoci se dobbiamo conoscere pure quelli europei.
A venirci in aiuto però c’è il Sole 24 Ore, che ha fatto un lavoro immenso nel costruire una sorta di questionario che ci aiuta a scegliere chi votare. Attraverso 30 domande sui temi caldi della politica europea (immigrazione, difesa, diritti, Green Deal, etc.) e con un sofisticato sistema di pesi, ci viene restituita la percentuale di affinità tra le nostre posizioni e quelle dei partiti politici italiani.
Io l’ho usato, ovviamente, e il risultato è stato che sono certamente schierato da una parte, ma non sono nemmeno così distante da quella opposta. Per capirci - parliamo a carte scoperte, tanto questo è il mio editoriale e posso dire quello che voglio - le mie posizioni sarebbero sovrapponibili per il 50% a quelle di Fratelli d’Italia, il partito che piuttosto che votare mi farei fare una ceretta inguinale a secco.
Sono entrato nel merito, perché ho cercato di capire come mai ci fosse questa affinità con un partito che giudico così distante dalle mie posizioni. Il motivo sta nel fatto che i partiti, praticamente tutti, non prendono mai realmente posizione. Sono tutti un grosso elenco di “tendenzialmente d’accordo, ma anche no”, “valuteremo”, “vedremo”.
Già, perché i risultati di questo questionario, oltre che analizzabili risposta per risposta e partito per partito, includono anche le dichiarazioni e le fonti da cui è stata sintetizzata la posizione sui vari temi. Davvero un lavoro encomiabile.
Da qua però si capisce una cosa che in fondo sapevamo già: ai partiti non frega niente di avere delle posizioni, gli interessa soltanto intercettare del consenso. Prendere posizione significherebbe intercettare una fetta di elettorato e invece allontanarsi da un’altra. Se invece rimani sul vago, le prendi tutte e due no?
Sentite questa: la domanda è “Le quote di genere (ad esempio una percentuale minima di posti che deve essere garantita a donne) sono una cosa positiva”. Forza Italia sarebbe “tendenzialmente d’accordo” perché in un’intervista a uno degli esponenti di spicco, avrebbe detto “Le azioni positive come le quote rosa, che in astratto sono contro i nostri principi, in concreto però sono uno strumento indispensabile”. Come dire: non siamo d’accordo, ma anche si.
Alla domanda se gli immigrati extracomunitari dovrebbero adeguarsi alla nostra cultura e ai nostri valori (quali?), il Partito Democratico è etichettato con una posizione “neutrale”, cioè non pervenuto. Sul programma politico scrive “Attuare di concerto con i sindaci e le amministrazioni comunicali un grande piano per l’accoglienza diffusa, al fine di evitare grandi concentrazioni di persone accolte in poche singole struttura e in poche città e con l’obiettivo di riaffermare, anche attraverso il pieno coinvolgimento del del Terzo Settore, un sistema di accoglienza di qualità, supporto alla persona, consulenza legare e psicologica, insegnamento d’italiano, corsi di formazione”. Ovvero il nulla.
Provate a fare il test, può essere molto utile per confondevi le idee, che poi è un modo sano per capire come tutti i partiti cerchino di rimanere lì, nel mezzo, per cercare di non scontentare nessuno. Noi invece vorremmo il contrario: posizioni nette, chiare, senza ambiguità. Forse poi è questo il segreto della forza inarrestabile delle destre nel mondo: su temi popolari come l’immigrazione prendono posizioni molto chiare. Dall’altra parte invece c’è tutto un miscuglio di parole incomprensibili e di bei desideri, senza mai schierarsi nettamente da una parte o dall’altra. “Immigrazione si, però…”.
E allora io ti voterò, sì, però…
Buona lettura.
Franco A.
» GOOGLE CI HA MENTITO?
La notizia sull’enorme quantità di documenti che descrivono il funzionamento dell’algoritmo di Google è rimasta, per ora, limitata all’interno della stampa di settore. Ne stanno parlando tantissimo nei gruppi di esperti di posizionamento e di siti web; ne sta parlando anche la stampa generalista ma orientata alla tecnologia. Non ne sta invece parlando il grande pubblico e i media a diffusione più ampia e questo, concedetemelo, è una grossa anomalia.
Google non è un motore di ricerca, ma è IL motore di ricerca, quantomeno in occidente. Tramite Google ci informiamo, prendiamo decisioni, orientiamo le nostre preferenze di acquisto, le nostre idee politiche. Dall’altro lato, grazie al traffico che proviene da Google, si può decidere il successo o l’insuccesso di un’attività commerciale, di un’azienda o di un partito politico.
Quando Google decide di penalizzare un sito e di farlo scendere nelle posizioni sui risultati di ricerca, quel sito perderà gran parte del suo traffico e quindi una gran parte della sua fonte di sostentamento, sia che questa provenga dalla pubblicità che dagli acquisti.
Il motore di ricerca di Google è dunque la linfa vitale di internet per come la conosciamo. Decreta i siti che semplicemente “esistono” da quelli che vengono frequentati per altri motivi, come la diffusione social o tramite sistemi offline. In ogni caso si può dire chiaramente che se non sei su Google, semplicemente non ci sei.
Cosa sappiamo del posizionamento su Google
Visto che una parte di quello che faccio per vivere riguarda proprio questa attività specifica, mi sento di dovervi dare qualche spiegazione tecnica, prima di raccontarvi il perché è così importante il fatto capitato questa settimana.
Quando chiedete qualcosa a Google, vi escono fuori una serie di risultati. Una volta questi risultati erano divisi in pagine da 10 siti ognuna, ma oggi questa cosa non è più vera, perché lo scroll infinito ha tolto questa limitazione. Non cambia però il risultato: i primi 10 siti saranno sempre quelli più rilevanti e che portano più traffico in assoluto. Poi, in mezzo a questi 10 risultati, ci sono pure tante altre cose: annunci a pagamento, mappe, risposte dirette di Google, prodotti in vendita, etc. etc.
Ottimizzare il proprio sito perché compaia ai propri posti nei risultati di ricerca in funzione di ricerche specifiche (che si chiamano query di ricerca e che contengono le famose keyword di cui avrete sicuramente sentito parlare) e mestiere dei cosiddetti “SEO”, che è un acronimo che sta per Search Engine Optimization. È un mestiere nato dallo studio dei casi di successo, o di ingegneria al contrario, se volete. Già perché Google non ha mai dato indicazioni precise su quali sono i parametri e che peso hanno per ottenere un miglior posizionamento. Ha dato delle indicazioni, sulle quali poi i tecnici hanno lavorato.
All’alba dei tempi, si sapeva che Google premiava i siti che ricevevano tanti backlink (cioè tanti link al proprio sito). Il principio era: più siti linkano il nostro, più il nostro sarà autorevole. Ed è questo meccanismo che ha fatto nascere siti directory, in pratica paginate e paginate piene di link. Poi questo meccanismo è stato pian piano rivisto e arricchito con tantissimi altri parametri. Centinaia, anzi migliaia, oggi decine di migliaia. Ma su cosa potesse influenzare il posizionamento e quanta rilevanza avesse, abbiamo soltanto fatto delle grandissime supposizioni e esperimenti.
Tutto questo fino ad oggi, o meglio fino a questa fuga di documenti, che ha scoperchiato un pezzo del cuore dell’algoritmo che sta dietro il posizionamento sul motore di ricerca.
2500 pagine su come funziona Google
Se, come abbiamo detto, Google influenza non solo le nostre decisioni ma anche il modo in cui ci informiamo e quello che acquistiamo, beh, sarebbe il caso di dire che questa poderosa fuga di documenti, che Google stessa ha riconosciuto come autentici, ha una rilevanza notevolissima, soprattutto per due aspetti.
Il primo è tecnico: da oggi in poi i tecnici (i SEO di cui sopra) ne sapranno di più e potranno ottenere più facilmente un buon posizionamento per i propri siti? No, e tra poco vi spiego perché.
Il secondo invece è quello realmente importante, perché quello che di succoso c’è in questi documenti, è che Google utilizzava dei parametri che aveva in più occasioni affermato di non utilizzare. Un esempio su tutti? La quantità di clic che riceve un sito. Pensateci: più clic riceve un sito, più diventa popolare e più Google lo privilegia nel posizionamento (portando ancora più traffico). Però i clic possono essere ottenuti anche in modi che nulla hanno a che fare con la qualità della pagina, che dovrebbe essere il principio determinante per premiare un sito (il motore di ricerca diventa tanto più gradito quanto più trova risposte pertinenti alle nostre domande, no?).
I clic possono arrivare anche da campagne a pagamento, o peggio ancora da reti di persone o bot pagati allo scopo di cliccare sulle pagine. Di nuovo: non sappiamo quanto questo parametro possa pesare nell’insieme delle decine di migliaia di variabili che contribuiscono al posizionamento, ma intanto c’è e Google ci aveva sempre detto di no.
I documenti trapelati includono gli argomenti e il tipo di dati che Google raccoglie e utilizza, quali siti Google etichetta come contenenti argomenti sensibili per le elezioni, per esempio, come Google gestisce i piccoli siti web e altro ancora. Molte di queste informazioni sembrano essere in conflitto con le dichiarazioni pubbliche dei rappresentanti di Google, secondo quando riportato da Rand Fishkin, che è un esperto di SEO e colui che ha reso pubblici questi documenti (ma non colui il quale li ha diffusi, che dopo un primo periodo di anonimato ha deciso di rivelarsi pubblicamente con il video che trovate più in alto).
Un altro grande esperto di SEO, Mike King, ha analizzato tutti i documenti e ha dichiarato:«Menzogna è un termine duro, ma è l'unica parola accurata da usare qui», scrive King su The Verge. «Anche se non biasimo necessariamente i rappresentanti pubblici di Google per aver protetto le loro informazioni proprietarie, ho difficoltà con i loro sforzi per screditare attivamente le persone nel mondo del marketing, della tecnologia e del giornalismo che hanno presentato scoperte riproducibili».
Quello che vuole dire è semplice: ok tenere un segreto intellettuale sull’algoritmo, però quando i tecnici del settore, a forza di studio e test scoprono qualcosa, almeno non tentare in tutti i modi di screditarli.
Un esempio molto rilevante riguarda il fatto che Google e i suoi rappresentanti, hanno ripetutamente affermato che non vengono utilizzati i dati del browser Chrome per classificare le pagine, quando invece Chrome è specificamente menzionato nelle sezioni dei documenti su come i siti web appaiono nella ricerca. Un esempio concreto lo fa The Verge, da cui ho preso parte di queste informazioni, che hanno pubblicato lo screenshot di seguito, affermando che i link sotto il principale (detti “sitelink”), possono essere creati in base alle informazioni prelevate dall’uso di Chrome, secondo i documenti trafugati.
Per anni Google ci ha detto che le strategie basate sull’acquisto di link non funzionavano più e che anzi rischiavano di penalizzare duramente la reputazione di un sito. Infine ci ha detto che invece la strategia giusta era quella dell’E-E-A-T, ovvero il miglioramento dell’esperienza, competenza, autorevolezza e affidabilità. Rand Fishkin afferma però di non aver trovato molto riguardo questo E-E-A-T nei documenti.
I documenti sono veri, Google rassicura, ma chi gli crede più?
Google ha chiaramente ammesso la veridicità di questi documenti: «Vorremmo mettere in guardia dal fare ipotesi imprecise sulla ricerca basate su informazioni fuori contesto, obsolete o incomplete», ha detto il portavoce di Google Davis Thompson a The Verge in una e-mail. «Abbiamo condiviso ampie informazioni su come funziona la ricerca e sui tipi di fattori che i nostri sistemi pesano, lavorando anche per proteggere l'integrità dei nostri risultati dalla manipolazione».
Certo, pur essendo questa documentazione una sorta di archivio per i dipendenti di Google, non è comunque chiaro quali dati vengano effettivamente utilizzati per classificare le pagine e con quale peso. Non si sa nemmeno quanto siano attuali questi dati. Per questo prima ho detto che questa scoperta non sarà granché utile per i tecnici del settore.
Ciononostante, rimane il fatto che è ormai chiaro come Google raccolga (e potenzialmente utilizzi) dati che i rappresentanti dell’azienda hanno sempre detto di non raccogliere e non utilizzare, come i clic, i dati degli utenti di Chrome e altro.
Rimane anche un’ultima cosa da mettere sul piatto: Google sta vivendo forse il suo momento peggiore. Non per via dei conti, non già per via dei concorrenti nell’ambito dei motori di ricerca, quanto proprio per la rivoluzione copernicana che ricade sotto il nome di Large Language Model, che preferiamo chiamare per semplicità intelligenza artificiale.
Ne parlai già in una precedente insalata: il giorno in cui, invece che chiedere a un motore di ricerca, chiederemo a una chat (o magari semplicemente usando una voce) è estremamente vicino. Microsoft ha già incluso abbondanti porzioni di Copilot (la sua intelligenza artificiale sviluppata insieme a OpenAI, i creatori di ChatGPT) in Windows 11 e in Bing. Lo scopo è chiaro: allontanare gli utenti da Google e permettergli di ricevere una risposta alle proprie domande direttamente all’interno delle applicazioni, senza dover aprire il browser e andare su Google.
La notizia rimane comunque rilevante: Google ha usato dati e parametri che ha sempre detto di non utilizzare per fornirci risultati che dipendevano invece proprio da questi dati. Che impatto possono aver avuto campagne di clic a pagamento in tutto questo? Pensiamo alle elezioni politiche e all’abuso di reti di siti costruiti appositamente per far crescere il consenso attorno a un candidato (anche di questo ne abbiamo parlato). Eravamo convinti, fino ad oggi, che Google non avesse nessun ruolo in tutto questo e invece, se fosse vero che il parametro dei clic su un sito ha un suo peso, rientrerebbe anche Google nel circo delle aziende che hanno favorito questo genere di disinformazione.
Detto tutto questo, rimane solo un modo per tenersi al sicuro da tutto ciò, ed è rappresentato dalla cara e vecchia stampa. Andare sui siti delle testate preferite, bypassando social e motori di ricerca, che ci piaccia o meno, non è la soluzione perfetta, ma è la migliore possibile. Ancora oggi.
» COSE MOLTO UTILINK 🔗
Gli articoli più interessanti che ho letto in settimana, insieme ai link utili o semplicemente curiosi che ho trovato in giro per internet.
» L’epidemia di miopia in corso e come bloccarla
A quanto pare, c’è un epidemia di miopia nel mondo. Lo riporta Nature e la cosa ha chiaramente a che fare con l’uso (o abuso) degli schermi, incrementato a dismisura a partire dalla pandemia.
Vi consiglio la lettura di questo articolo, che è ricco di dati e non prevede nemmeno un paywall.
» CONSIGLI PER L’ASCOLTO 🎧
Non sono sempre serio come cerco di far credere qui su Insalata Mista, anzi, per maggior parte del tempo cazzeggio senza remore. Lo faccio praticamente sempre quando registriamo Le Chiacchiere di Insert Coin, con l’amico e compare Massimiliano Di Marco.
IMPORTANTE!
Insert Coin, tra l’altro, è candidato al Pod, che è un premio per i migliori podcast in circolazione. Oltre alla sua categoria (indie - informazione) ce n'è una generale: il premio del pubblico. È già un grandissimo risultato così, ma può diventarlo ancora di più se ci/lo aiutate:
Ci vogliono pochi secondi e non serve registrarsi. Basta andare a questo link e dalla lista (è in ordine alfabetico) dovete scegliere Insert Coin:
https://www.ilpod.it/premio-amazonmusic
» SFAMA LA FOMO!
Cos’è la F.O.M.O.?1
» YouTube lancia i nuovi giochi Playables per tutti gli utenti
YouTube introduce il programma Playables su mobile e desktop, permettendo agli utenti di accedere a oltre 75 giochi direttamente dal sito o dall'app. I giochi includono titoli popolari come Angry Birds Showdown! e Trivia Crack. Inizialmente offerti solo agli abbonati Premium, ora sono disponibili per tutti. Questa mossa segue una tendenza comune tra le aziende tecnologiche, come LinkedIn e Netflix, che aggiungono giochi per attirare e mantenere attivi gli utenti.
» I piani di Apple per l'IA includono una "scatola nera" per i dati nel cloud
Apple punta a introdurre importanti novità in ambito IA durante l’imminente WWDC, ovvero l’evento dove illustrerà le novità in ambito software. Ci sono molti miglioramenti attesi in iOS 18 e altre piattaforme. Per proteggere la privacy degli utenti, Apple prevede di processare i dati delle applicazioni IA all'interno di una "scatola nera" virtuale, utilizzando esclusivamente hardware proprio nei suoi data center. Questo approccio, chiamato internamente "Apple Chips in Data Centers" (ACDC), mira a rendere sicuro il cloud processing, evitando il rischio di esposizione dei dati a hacker. La Secure Enclave isolerà i dati processati sui server, impedendo l'accesso anche ad Apple stessa.
» L'Europa approva 2 miliardi di euro per lo stabilimento di STMicroelectronics a Catania
La Commissione Europea ha approvato un finanziamento di circa 2 miliardi di euro dal Governo Italiano per la costruzione di un nuovo stabilimento di STMicroelectronics a Catania, dedicato alla produzione di chip di potenza in carburo di silicio. Questo impianto, il primo in Europa a coprire tutti i passaggi della lavorazione del carburo di silicio, è fondamentale per la filiera europea dei semiconduttori e la transizione energetica. L'investimento complessivo sarà di 5 miliardi di euro, con l'entrata in funzione prevista entro il 2026 e piena capacità produttiva entro il 2033.
Se sei arrivato fino a qui, innanzitutto ti ringrazio.
Non ci siamo presentati: mi chiamo Franco Aquini e da anni scrivo di tecnologia e lavoro nel marketing e nella comunicazione.
Se hai apprezzato la newsletter Insalata Mista ti chiedo un favore: lascia un commento, una recensione, condividi la newsletter e più in generale parlane. Per me sarà la più grande ricompensa, oltre al fatto di sapere che hai gradito quello che ho scritto.
Franco Aquini
La F.O.M.O., un acronimo che sta per Fear Of Missing Out, è la deriva moderna del tam tam dei social network unita all’enorme disponibilità di strumenti di informazione e di intrattenimento. In pratica, è la paura di perdersi qualcosa e di non essere sempre al passo con i tempi. Con questa rubrica rispondiamo a queste paure, riassumendo in breve le notizie più significative della settimana, pescate dal mondo della tecnologia, dell’entertainment e del lifestyle.
Le IA/Chatbox che effettueranno per noi la ricerca saranno il vaso in cui si formerà il pensiero critico delle persone, SE, come dici tu quando parli del mezzo stampa, non troveranno un canale alternativo. L’azione stessa del “trovarlo” sarà una forma di resistenza.
Ottimo ma... non mentire sui tempi di lettura! 😎