Latent Semantic Indexing: è rilevante per la SEO?

L’Indicizzazione Semantica Latente (LSI) è un metodo per analizzare un insieme di documenti al fine di scoprire co-occorrenze statistiche di parole che appaiono insieme che poi forniscono informazioni sugli argomenti trattati da tali parole e documenti.

Questo tema ha occupato e occupa un posto nelle discussioni online tra gli esperti della SEO, ma non sembra seguire l’evoluzione intrapresa da Google nell’analisi semantica applicata all’organizzazione dei contenuti online.

L’LSI deriva dall’Analisi Semantica Latente (LSA), una tecnica nell’elaborazione del linguaggio naturale che include i computer di programmazione (NLP), ed è l’applicazione di questo approccio al recupero delle informazioni semantiche. 

Le origini: la Latent Semantic Analysis

La Latent Semantic Indexing è stata studiata e brevettata nel lontano 1988 (prima della nascita del WWW) per risolvere il problema dell’ambiguità nei dati testuali:

“Poiché l’uso delle parole umane include un’ampia sinonimia e polisemia, i semplici schemi di corrispondenza dei termini presentano gravi carenze: il materiale pertinente viene perso perché persone diverse descrivono lo stesso argomento utilizzando parole diverse e, poiché la stessa parola può avere significati diversi, il materiale irrilevante verrà recuperato.”

Per avere uno spaccato del problema è sufficiente pensare alle difficoltà più comuni nel far comprendere all’IA l’uso umano della lingua, come i casi di sinonimia (parole con significato simile) e la polisemia (una pluralità di significati all’interno di una parola o di un termine).

L’analisi semantica, ossia il processo di trarre significato da un testo, si complica ulteriormente quando nei contenuti sono coinvolte espressioni che vanno interpretate al di fuori di grammatica e semantica, come nel caso dell’ironia (es. “che bello…”) o di espressioni convenzionali molto diffuse ma con significati non composizionali, cioè non prevedibili (es. “bruciare le tappe”).

Indicizzazione Semantica Latente: pro e contro

Nel mondo della SEO, l’LSI fa ancora parlare di sé come possibile risposta alla sempiterna contrapposizione tra “scrivere per Google” e “scrivere per le persone”.

Uno dei principali svantaggi dell’utilizzo dell’Indicizzazione Semantica Latente per l’intero Web è che i calcoli eseguiti per creare l’analisi statistica devono essere rifatti ogni volta che una nuova pagina Web viene pubblicata e indicizzata. Il brevetto specifica che un’analisi dei termini deve avvenire “ogni volta che c’è un aggiornamento significativo nei file di archiviazione”. Questo fattore entra in conflitto con l’ampiezza e la continua evoluzione del Web.

Per quanto riguarda l’inserimento della Latent Semantic Indexing negli algoritmi di Google, nel 2019 John Mueller ha fugato ogni dubbio con Tweet:

There’s no such thing as LSI keywords — anyone who’s telling you otherwise is mistaken, sorry.

Non c’è alcun danno nell’uso di sinonimi in tutto il contenuto a scopo di arricchimento, ma suggerire che l’uso di LSI è responsabile del modo in cui Google utilizza parole e sinonimi semanticamente correlati non sembra essere corretto, anche se l’utilizzo di parole chiave presenti nella stessa nuvola semantica aiuta l’indicizzazione.

I vantaggi dell’LSI, inoltre, si estendono oltre quelli direttamente correlati alla SEO. La categorizzazione aggiuntiva e più accurata aiuta gli utenti, gli editori e gli esperti di marketing allo stesso modo. Gli editori, ad esempio, possono aumentare il coinvolgimento perché i contenuti basati su LSI sono più mirati e assicurano che arrivino di fronte al pubblico giusto. Gli utenti che inseriscono query traggono vantaggio anche dal fatto che possono trovare facilmente (e più rapidamente) il contenuto che risponde alle loro domande.

Oltre all’Indicizzazione Semantica Latente…

L’ottimizzazione dei contenuti per la visibilità della ricerca organica si è evoluta a suon di algoritmi, in linea con i progressi di Google, da Penguin a Bert.

I motori di ricerca hanno ancora difficoltà quando cercano di analizzare il linguaggio naturale, ma ci sono metodi più condivisi per farlo, oltre ad “aggiungere parole chiave LSI”, come:

  • Dati strutturati
  • Contenuti correlati
  • Co-occorrenze e indicizzazione per frasi
  • Vettori di contesto
  • [Extra] SEO tecnica (mobile first, canonical, noindex, robot.txt,…)

Agire sulla Search Engine Optimization significa sempre più applicare un approccio semantico corretto, in linea con l’evoluzione dell’IA e degli algoritmi.

LEGGI ANCHE: Analisi keyword e awareness

Ti è piaciuto l'articolo ?

Iscriviti alla nostra Newsletter per ricevere altri contenuti interessanti