Studiando le tecniche dell’information retrieval applicate ai motori di ricerca, mi ha molto colpito questa del Latent Semantic Indexing, che è piuttosto conosciuta anche in ambito SEO. Il Latent Semantic Indexing infatti è una tecnica derivata dal modello a spazio vettoriale, che reperisce i termini all’interno dei testi creando delle mappe concettuali, delle “aree di significato” attraverso un’operazione di approssimazione matriciale, che permette di semplificare il retrieval sia dal punto di vista efficacia, sia dal punto di vista risorse.
Sul Web, LSI si rivela particolarmente utile per l’abilità dei motori di ricerca di dare un senso al contenuto di una pagina, non guardando solamente alla densità delle keyword utilizzate, ma in maniera più specifica alle associazioni tra keywords e keyphrases presenti per determinare il contesto della pagina web.
Il suo utilizzo è stato dunque un espediente fondamentale per svincolare la ricerca sul Web da un paradigma puramente testuale e legato alle keyword ed ai metatag, dandole un indirizzo semantico.
Una dimostrazione del suo funzionamento si può vedere in un interessante video (in inglese), disponibile su questa pagina.

