cuil

Posted in motori di ricerca con i tag , , , on Luglio 29, 2008 by andreasardo

Come molti già sapranno, è da qualche giorno online un nuovo motore di ricerca, CUIL, nato dall’iniziativa di alcuni ex dipendenti di Google (tra cui Tom Costello). Tra le novità più interessanti proposte, una SERP dall’impostazione logica diversa dai motori di ricerca più comuni, con funzionalità di clustering integrate e soprattutto un sistema di ranking non più basato sui link ma sul contenuto delle pagine.

Un approccio che dà grande importanza ai concetti, lavorando probabilmente su VSM e LSA opportunamente raffinati. Importante anche il fattore privacy: Cuil non traccia né gli IP né la navigazione dei propri utenti. Tale approccio, sicuramente “politically correct” potrebbe tuttavia incorrere in problemi nel momento in cui Cuil volesse effettuare una profilazione dell’utenza.

Comprensibilmente, i primi giorni hanno visto la proliferazione di illazioni a proposito, come la presunta dimensione dell’indice di CUIL (120 miliardi di pagine contro i 40 di Google).

Staremo a vedere

modifiche alla SERP di Google

Posted in SEO, motori di ricerca con i tag , , , , on Luglio 16, 2008 by andreasardo

E’ partita la fase di test di Google, preannunciata da mesi, che sperimenterà la possibilità di intervento da parte degli utenti nelle SERP. A livello pratico, gli utenti potranno escludere alcuni risultati di ricerca, suggerire risultati più pertinenti o migliori, confrontando il proprio giudizio con quello degli altri. La fase di test è circoscritta a un numero limitato di utenti selezionati dal motore i ricerca, durerà alcune settimane e non inficierà le SERP attuali, dunque gli utenti normali continueranno a effettuare le loro ricerche senza accorgersi di nulla.

memesphere

Posted in SEO, blog con i tag , on Luglio 10, 2008 by andreasardo

Riprendo dopo un lungo silenzio, dovuto all’incombente laurea, al nuovo lavoro ma soprattutto alla pigrizia strisciante, per sottoporre all’attenzione un neonato strumento per il monitoraggio delle conversazioni online. Si chiama MEMESPHERE, è online da pochi giorni e il suo scopo è misurare il polso della blogosfera.

E’ già stato sottolineato da molti blogger che scrivono di SEO, come il potere del passaparola sia di fondamentale importanza non solo in ambito Web, ma anche nella vita quotidiana (ricordo ad esempio un articolo letto qualche mese fa, a proposito della potenzialità per un blogger qualsiasi di screditare, attraverso un semplice post, un locale in cui è stato a mangiare, sconsigliandolo alla sua cerchia sociale…).

Ebbene, è forse giunto il momento di dare ascolto alle molteplici e influenti voci della Rete: anche per chi si occupa di SEO  potrebbero essere uno strumento interessante, partendo dal presupposto che prima di agire occorre comprendere…Seguiranno aggiornamenti.

Il ruolo del SEO nel web semantico

Posted in SEO, motori di ricerca con i tag , , , , on Aprile 21, 2008 by andreasardo

Uno spunto di riflessione sui rapporti tra SEO ed evoluzione dei motori di ricerca.
Volendo analizzare in macro-tappe la storia dei motori di ricerca, nella strategia utilizzata per la costruizione gli indici, possiamo definire una prima fase basata sulle tecniche di analisi testuale ereditate dall’information retrieval; tali tecniche, rivelatesi inadeguate a offire risultati contraddistinti da una rilevanza accettabile, sono state in seguito affiancate dal paradigma basato sulla link analysis, di cui PageRank è l’esempio universalmente più conosciuto. Anche questa stategia, inizialmente impostata su un approccio quantitativo nel conteggio dei backlinks, si è rivelata debole, offrendo il fianco alle numerose tecniche di spamdexing e costringendo gli ingegneri di Google a rilasciare numerosi aggiornamenti per coprirne di volta in volta le lacune. Tali aggiornamenti hanno voluto porre un freno allo spam e nel contempo mutare l’approccio della link analysis in senso qualitativo, introducendo altresì elementi per meglio monitorare la bontà e la naturalezza dei contenuti (vedi topic distillation e latent semantic indexing). Ora mi chiedo, dal momento che le speranze di sviluppo del web semantico e di agenti intelligenti per i motori di ricerca sono tuttora vive – ne sono la dimostrazione le ricerche nel campo attualmente in corso (come ad esempio WebFountain dell’IBM)- il SEO ha qualche possibilità di battersi in un’opera di rivoluzione culturale, in primis presso i proprio clienti, per ottimizzare i siti degli stessi non solo in prospettiva ROI, ma anche spingendoli verso un atteggiamento costruttivo nei confronti di un’evoluzione dei motori di ricerca in tal senso,a partire da un’impegno semantico sul codice, alla cura delle etichette e all’idea che nel futuro “tutto debba farsi trovare in maniera più immediata e naturale”? Tale approccio, la cui applicabilità è naturalmente complessa nelle pratiche professionali di tutti i giorni, accelererebbe tuttavia la svolta semantica del Web, favorendo inoltre la percezione del SEO come un’attività che può dare buoni risultati a sito già fatto, ma ancora migliori se coinvolta nella progettazione e costruzione del sito. I vantaggi di un tale scenario sarebbero evidenti per tuute le parti in causa: il SEO, che amplierebbe la sua area operativa; i clienti, che di fronte a un progetto di comunicazione coerente in tutte le sue parti potrebbero integrare il discorso ROI in una strategia pianificata a priori, senza essere costretti a chiedere la luna (o scorciatoie…) all’ultimo momento alle agenzie; infine il Web, per il quale un tale ordine rappresenterebbe la struttura portante di quel tanto atteso Web semantico, spinto dal basso dalla Forza dei Molti (Battelle) e dall’alto dalla ricerca tecnologica. Sarà solo utopia? Spero l’ardua sentenza non tocchi ai posteri, ma magari un po’ prima…

auguri

Posted in comunicazioni on Marzo 23, 2008 by andreasardo

buona festa a tutti i lettori.

Andrea

la professione di SEO

Posted in SEO con i tag , on Marzo 14, 2008 by andreasardo

Un link a questo bell’articolo di Cristina Cardone, che fa chiarezza su un ambito troppo spesso confuso o bistrattato: il campo di azione di un professionista SEO, le sue prerogative di base e le sue occupazioni principali. Mi pare lucida l’intuizione in base alla quale nel Web attuale, il SEO non può limitarsi ad attività di miglioramento del codice o monitoraggio statistico: inevitabile dunque un estensione delle sue responsabilità alla funzione di copywriting.

Latent Semantic Indexing

Posted in SEO, motori di ricerca con i tag , , , , on Marzo 13, 2008 by andreasardo

Studiando le tecniche dell’information retrieval applicate ai motori di ricerca, mi ha molto colpito questa del Latent Semantic Indexing, che è piuttosto conosciuta anche in ambito SEO. Il Latent Semantic Indexing infatti è una tecnica derivata dal modello a spazio vettoriale, che reperisce i termini all’interno dei testi creando delle mappe concettuali, delle “aree di significato” attraverso un’operazione di approssimazione matriciale, che permette di semplificare il retrieval sia dal punto di vista efficacia, sia dal punto di vista risorse.
Sul Web, LSI si rivela particolarmente utile per l’abilità dei motori di ricerca di dare un senso al contenuto di una pagina, non guardando solamente alla densità delle keyword utilizzate, ma in maniera più specifica alle associazioni tra keywords e keyphrases presenti per determinare il contesto della pagina web.
Il suo utilizzo è stato dunque un espediente fondamentale per svincolare la ricerca sul Web da un paradigma puramente testuale e legato alle keyword ed ai metatag, dandole un indirizzo semantico.

Una dimostrazione del suo funzionamento si può vedere in un interessante video (in inglese), disponibile su questa pagina.

Information Retrieval

Posted in motori di ricerca con i tag , , on Febbraio 1, 2008 by andreasardo

Ecco qui una serie di risorse interessanti sull’IR. L’argomento, pur trattando questioni tecniche, non richiede una preparazione informatica mostruosa, ma può essere certamente utile per chi si occupa di motori di ricerca. Da qui infatti derivano le strutture alla base degli algoritmi. Interessante per chiunque, ma essenziale per chi vuole comprendere il funzionamento di un motore.

IRS

introduzione all’IR

Il link di seguito conduce invece alla homepage di un recente libro, scritto dagli autorevoli Baez-Yates e Ribeiro-Neto, sull’argomento. Un paio di capitoli, indice e abstract sono scaricabili

Modern Information Retrieval – Addison Wesley Longman

Infine, da sottolineare il bel lavoro del gruppo Ippolita: un interessante saggio su Google, dal titolo “The dark side of Google”, in cui vengono criticate, con approccio scientifico, le verità assolute sul motore di Mountain View: è un punto di vista interessante, che parte da osservazioni dimostrabili. Scaricabile sul sito di Ippolita, oppure qui

A presto!

Andrea

quesito sul web semantico

Posted in motori di ricerca con i tag , , , , on Gennaio 21, 2008 by andreasardo

L’xml è un’importante risorsa in direzione del web semantico immaginato di Berners-Lee. Leggendo articoli sull’argomento, mi è capitato un commento di Daniel Read, direttore dello sviluppo prodotto della AskJeeves, oggi semplicemente Ask, che afferma “Gli utenti si aspettano che il motore di ricerca legga nella loro mente”.

Oltre ad esempio al completamento automatico, o agli Adsense in ambito commerciale, quali altri strumenti (esistenti o non ancora introdotti) potrebbero essere secondo voi utili ai fini di una migliore interazione tra utente e information retrieval?

giorgio tave: risorse SEO

Posted in links on Gennaio 11, 2008 by andreasardo