 |
Spam nelle directory e
nei motori di ricerca
In questi ultimi anni i motori di ricerca
hanno avuto un vero e proprio "boom" dovuto al fatto che sempre più gli
utenti utilizzano internet quale strumento privilegiato per le loro
richieste ed esigenze di ricerca di informazione. Da qui la necessità o la
volontà di molte aziende e webmaster di siti web di arrivare ai primi posti
a seguito di ricerche su parole chiave specifiche, spesso senza troppi
scrupoli.
L'uso però di tecniche e trucchi di vario genere per ottenere tali
risultati ha costretto i motori di ricerca a cambiare continuamente le
logiche di indicizzazione per riuscire ad offrire agli utenti risultati
attinenti e attendibili. Per tali motivi sono così state scritte delle
regole, delle linee guida che tutti dovrebbero seguire al momento
di creare il sito web.
Regole che devono lasciare un giusto spazio di compromesso alle tecnologie
utilizzate per la realizzazione di siti web, spesso non tanto amichevoli
alle "modeste" capacità di "lettura" di un po tutti i motori. Ciò che è
ammesso, tollerato e bandito dagli indici sono quindi una serie di concetti
in continua evoluzione. In termini generici, viene comunque considerata
illecita ogni pagina che presenti caratteristiche al solo scopo di favorirne
una migliore posizione nel ranking dei motori di ricerca, e che offra
contenuto inappropriato, ridondante o comunque di bassa qualità.
Motori di ricerca
Ogni motore ha così fissato una serie di regole e consigli utili (le linee
guida appunto) da seguire per non correre il rischio di fare spamming ed
essere "bannati" (linee guida:
Google,
Arianna,
Altavista.it, DMOZ,
FAST,
Inktomi).
Arianna, ad esempio,
non ammette con inclusione a pagamento una pagina che contenga un
ridirezionamento automatico (redirect) ad una altra pagina o che contenga
scritte dal colore uguale allo sfondo, un eccessivo numero di parole chiave
(keyword stuffing) o qualsiasi altro meccanismo che prova deliberatamente a
interferire con il funzionamento degli algoritmi di Arianna.
Altavista non
gradisce pagine dal testo non facilmente leggibile, con caratteri troppo
piccoli o fondo della pagina troppo scuro; pagine dall'off-topic con un
numero eccessivo di parole chiave; pagine generate automaticamente senza
contenuto o con un contenuto minimo, il cui unico scopo è quello di passare
ad un'altra pagina.
Inktomi, Google
e Fast Search specificano anche che ritengono spam le pagine con un
grande numero di link ma senza contenuto. Queste pagine vengono chiamate
anche FFA (Free-For-All) perchè permettono (o meglio permettevano) di
generare falsa Link Popularity. Google in particolare combatte contro tutte
quelle tecniche che cercano di influenzare
il PageRank.
Ultimamente Google sta testando nuovi filtri (attivi ora su parole
chiave inglesi ad alta competitività, es "hotel bologne") che penalizzano
pesantemente i siti ottimizzati e posizionati in rete con le tradizionali
tecniche di ottimizzazione utilizzate dalle web agency. Utile al riguardo:
www.scroogle.org
Cloaking (si veda
FAQ).
Google, Inktomi e Fast Search lo considerano la metodologia più dannnosa
perchè consiste nel mostrare ai motori pagine che non corrispondono a quelle
che poi effettivamente vedranno gli utenti finali. AltaVista, al contrario,
vede nel cloaking un aiuto per quei siti che per scelte di piattaforma
tecnologica o impostazione grafica hanno seri problemi anche solo di
indicizzazione.
Cosa si richia facendo spamming nei
motori
- Penalizzazione del posizionamento delle
pagine del sito
- Esclusione della pagina dal database del
motore, dell'intero dominio, dell'IP
- Segnalazione nelle "liste nere" dei
motori di ricerca
Directory
Per i responsabili di
Open Directory Project (DMOZ), la più importante directory open
source della rete, si definisce spam la continua proposta di siti identici
ad una o più categorie inappropriate e di siti che violano evidentemente le
regole indicate dalla directory.
Le directory prestano particolare attenzione alla distinzione fra siti e
siti "mirror", copia cioè di altri siti. Da quando, infatti, si sono diffusi
i programmi di affiliazione sul Web (es Erbalife), sono aumentati di
tentativi di indicizzare siti che però riportano solamente le offerte
commerciali di altri siti, non aggiungendo nulla di nuovo e diverso alla
Rete.
|