Latent Semantic Indexing
Studiando le tecniche dell’information retrieval applicate ai motori di ricerca, mi ha molto colpito questa del Latent Semantic Indexing, che è piuttosto conosciuta anche in ambito SEO. Il Latent Semantic Indexing infatti è una tecnica derivata dal modello a spazio vettoriale, che reperisce i termini all’interno dei testi creando delle mappe concettuali, delle “aree di significato” attraverso un’operazione di approssimazione matriciale, che permette di semplificare il retrieval sia dal punto di vista efficacia, sia dal punto di vista risorse.
Sul Web, LSI si rivela particolarmente utile per l’abilità dei motori di ricerca di dare un senso al contenuto di una pagina, non guardando solamente alla densità delle keyword utilizzate, ma in maniera più specifica alle associazioni tra keywords e keyphrases presenti per determinare il contesto della pagina web.
Il suo utilizzo è stato dunque un espediente fondamentale per svincolare la ricerca sul Web da un paradigma puramente testuale e legato alle keyword ed ai metatag, dandole un indirizzo semantico.
Una dimostrazione del suo funzionamento si può vedere in un interessante video (in inglese), disponibile su questa pagina.
Marzo 13, 2008 a 3:24 pm
Caro Andrea,
ti ringrazio di aver fatto riferimento al nostro articolo sul Latent Semantic Indexing.
In bocca al lupo per il tuo blog!
Alla prossima!
Giulio Gaudiano
- Master New Media Italia -
Marzo 14, 2008 a 12:37 am
Ti ringrazio!
Il video è veramente ben fatto, è una lezioncina anche semplice da seguire.
Ho visto che sarebbe la parte di un video più lungo, ma seguendo il link su masternewmedia si giunge su una landing strana. Tu per caso hai trovato la versione lunga da qualche parte? In caso affermativo, puoi inviarmi il link via mail (andreabros@gmail.com).
grazie e a presto
Andrea
Aprile 21, 2008 a 8:07 pm
[...] elementi per meglio monitorare la bontà e la naturalezza dei contenuti (vedi topic distillation e latent semantic indexing). Ora mi chiedo, dal momento che le speranze di sviluppo del web semantico e di agenti intelligenti [...]