Uno spunto di riflessione sui rapporti tra SEO ed evoluzione dei motori di ricerca.
Volendo analizzare in macro-tappe la storia dei motori di ricerca, nella strategia utilizzata per la costruizione gli indici, possiamo definire una prima fase basata sulle tecniche di analisi testuale ereditate dall’information retrieval; tali tecniche, rivelatesi inadeguate a offire risultati contraddistinti da una rilevanza accettabile, sono state in seguito affiancate dal paradigma basato sulla link analysis, di cui PageRank è l’esempio universalmente più conosciuto. Anche questa stategia, inizialmente impostata su un approccio quantitativo nel conteggio dei backlinks, si è rivelata debole, offrendo il fianco alle numerose tecniche di spamdexing e costringendo gli ingegneri di Google a rilasciare numerosi aggiornamenti per coprirne di volta in volta le lacune. Tali aggiornamenti hanno voluto porre un freno allo spam e nel contempo mutare l’approccio della link analysis in senso qualitativo, introducendo altresì elementi per meglio monitorare la bontà e la naturalezza dei contenuti (vedi topic distillation e latent semantic indexing). Ora mi chiedo, dal momento che le speranze di sviluppo del web semantico e di agenti intelligenti per i motori di ricerca sono tuttora vive – ne sono la dimostrazione le ricerche nel campo attualmente in corso (come ad esempio WebFountain dell’IBM)- il SEO ha qualche possibilità di battersi in un’opera di rivoluzione culturale, in primis presso i proprio clienti, per ottimizzare i siti degli stessi non solo in prospettiva ROI, ma anche spingendoli verso un atteggiamento costruttivo nei confronti di un’evoluzione dei motori di ricerca in tal senso,a partire da un’impegno semantico sul codice, alla cura delle etichette e all’idea che nel futuro “tutto debba farsi trovare in maniera più immediata e naturale”? Tale approccio, la cui applicabilità è naturalmente complessa nelle pratiche professionali di tutti i giorni, accelererebbe tuttavia la svolta semantica del Web, favorendo inoltre la percezione del SEO come un’attività che può dare buoni risultati a sito già fatto, ma ancora migliori se coinvolta nella progettazione e costruzione del sito. I vantaggi di un tale scenario sarebbero evidenti per tuute le parti in causa: il SEO, che amplierebbe la sua area operativa; i clienti, che di fronte a un progetto di comunicazione coerente in tutte le sue parti potrebbero integrare il discorso ROI in una strategia pianificata a priori, senza essere costretti a chiedere la luna (o scorciatoie…) all’ultimo momento alle agenzie; infine il Web, per il quale un tale ordine rappresenterebbe la struttura portante di quel tanto atteso Web semantico, spinto dal basso dalla Forza dei Molti (Battelle) e dall’alto dalla ricerca tecnologica. Sarà solo utopia? Spero l’ardua sentenza non tocchi ai posteri, ma magari un po’ prima…
Archivio per Information retrieval
Il ruolo del SEO nel web semantico
Posted in SEO, motori di ricerca con i tag evoluzione motori di ricerca, Information retrieval, SEO, Web Fountain, web semantico on Aprile 21, 2008 by andreasardoLatent Semantic Indexing
Posted in SEO, motori di ricerca con i tag Information retrieval, latent semantic indexing, LSI, motori di ricerca, SEO on Marzo 13, 2008 by andreasardoStudiando le tecniche dell’information retrieval applicate ai motori di ricerca, mi ha molto colpito questa del Latent Semantic Indexing, che è piuttosto conosciuta anche in ambito SEO. Il Latent Semantic Indexing infatti è una tecnica derivata dal modello a spazio vettoriale, che reperisce i termini all’interno dei testi creando delle mappe concettuali, delle “aree di significato” attraverso un’operazione di approssimazione matriciale, che permette di semplificare il retrieval sia dal punto di vista efficacia, sia dal punto di vista risorse.
Sul Web, LSI si rivela particolarmente utile per l’abilità dei motori di ricerca di dare un senso al contenuto di una pagina, non guardando solamente alla densità delle keyword utilizzate, ma in maniera più specifica alle associazioni tra keywords e keyphrases presenti per determinare il contesto della pagina web.
Il suo utilizzo è stato dunque un espediente fondamentale per svincolare la ricerca sul Web da un paradigma puramente testuale e legato alle keyword ed ai metatag, dandole un indirizzo semantico.
Una dimostrazione del suo funzionamento si può vedere in un interessante video (in inglese), disponibile su questa pagina.
Information Retrieval
Posted in motori di ricerca con i tag dark side of Google, Information retrieval, motori di ricerca on Febbraio 1, 2008 by andreasardoEcco qui una serie di risorse interessanti sull’IR. L’argomento, pur trattando questioni tecniche, non richiede una preparazione informatica mostruosa, ma può essere certamente utile per chi si occupa di motori di ricerca. Da qui infatti derivano le strutture alla base degli algoritmi. Interessante per chiunque, ma essenziale per chi vuole comprendere il funzionamento di un motore.
Il link di seguito conduce invece alla homepage di un recente libro, scritto dagli autorevoli Baez-Yates e Ribeiro-Neto, sull’argomento. Un paio di capitoli, indice e abstract sono scaricabili
Modern Information Retrieval – Addison Wesley Longman
Infine, da sottolineare il bel lavoro del gruppo Ippolita: un interessante saggio su Google, dal titolo “The dark side of Google”, in cui vengono criticate, con approccio scientifico, le verità assolute sul motore di Mountain View: è un punto di vista interessante, che parte da osservazioni dimostrabili. Scaricabile sul sito di Ippolita, oppure qui
A presto!
Andrea

