Se utilizzate Google Analytics, come ci auguriamo facciate, vi sarete probabilmente accorti che negli ultimi tempi c’è stato un vero e proprio boom di referral spam, ovvero visite fittizie generate in maniera del tutto automatica dai bot e, dunque, poco utili per la vostra analisi. Chiariamolo subito: i bot di questo tipo sono praticamente innocui, ma è bene adottare delle contromisure per rendere più efficace l’analisi del vostro traffico.
Facciamo un esempio pratico. Analizzare una frequenza di rimbalzo del 3.70% è del tutto fuorviante, perché si tratta evidentemente di dati non veritieri. Una frequenza di rimbalzo troppo bassa o un tempo di permanenza sul sito estremamente ridotto può quindi segnalare la presenza di referral spam che visitano il nostro sito.
Sempre nella scheda “Panoramica del pubblico” è utile controllare i dati relativi alla lingua. La presenza di dati palesemente errati è senz’altro indice di referral spam. Ma come fare a liberarsi una volta per tutte di loro? Vediamo, in tre step, come fare.
1. Analizzare lo spam
Prima di tutto, occorre verificare esattamente di che tipo di spam si tratta. La tabella di Google Analytics relativa ai canali di acquisizione di traffico (Acquisizione – Tutto il traffico – Canali) ci permette di capire, come da immagine di esempio, quale dei canali è interessato dal traffico spam da parte dei bot. In questo caso, il canale “Organic Search” presenta un tempo medio di visite di 0 secondi ed è certamente uno degli obiettivi dei referral spam.
Vediamo ora il traffico suddiviso per pagine del sito (Comportamento – Contenuti del sito – Tutte le pagine). In alcuni casi, come nell’immagine che segue possono essere presenti pagine inesistenti del nostro sito.
Torniamo ora nella tab Acquisizione e verifichiamo cosa accade relativamente al canale di “Organic Search”. Normalmente, una delle situazioni più comuni prevede di trovare un gran numero di ricerche “(not provided)”, ma nel caso che segue è evidente che i termini di ricerca sono del tutto fittizi e improbabili.
Lo stesso per quanto riguarda la sorgente Referral.
Abbiamo, quindi, analizzato il traffico spam del nostro sito, appurando quali sono le sorgenti interessate (Ricerca organica e Referral). Ora il passo successivo è filtrare questi dati e far sì che non interferiscano nell’analisi del nostro traffico reale e pertinente.
2. Creare un segmento
Prima di agire sui filtri e creare una vista personalizzata che escluda tutti i referral bot, il mio consiglio è quello di testare la bontà dei filtri che applicherete. Ciò inoltre vi permetterà di eliminare lo spam anche dallo storico e, non soltanto, dai dati raccolti da quel momento in poi.
Per creare un segmento, a partire da un report, è sufficiente cliccare su Nuovo segmento, successivamente cliccare su Avanzato – Condizioni, e riportando infine le espressioni regolari corrispondenti a ciò che vogliamo filtrare. Vedremo successivamente quali espressioni regolari creare.
3. Creare un filtro
Uno dei filtri più utilizzati fa riferimento al nome host utilizzato per navigare all’interno del sito. Le visite reali, e che vogliamo continuare a tracciare, hanno come destinazione il nome host, ovvero il server, indipendentemente dalla provenienza del traffico (organico, a pagamento, referral). Le visite effettuate da spam bot non conoscono il nome del server, per cui escludendo nomi host palesemente falsi sarà possibile eliminare del tutto, o quasi, queste visite fantasma.
Per creare il primo filtro, dunque, partiamo dalla sezione di Amministrazione e poi clicchiamo su Tutti i filtri. In questo caso il filtro dovrà includere tutti i nomi host validi, nel nostro caso alessiamartalo.it|www.alessiamartalo.it.
Altri filtri che può essere utile applicare interessano la lingua e i crawler spam.
Nel caso in questione ho utilizzato l’espressione regolare .*((darodar|priceg|buttons-for-website|makemoneyonline|blackhatworth|hulfingtonpost|bestwebsitesawards|o-o-6-o-o|(social|simple-share)-buttons).com)|((ilovevitaly|econom)(.co(m)?|.ru))|((humanorightswatch|4webmasters).org).*
Nel caso specifico, filtrare in modo opportuno per nome host è stato sufficiente a bloccare del tutto la spam. Se così non fosse, occorre agire, come abbiamo visto, a livello di Sorgente Campagna, Referral, Lingua o Percorso Campagna Referral.
Per evitare di bloccare, invece, visite legittime, vale la pena come abbiamo visto al punto 2 creare un segmento – da applicare allo storico – prima di agire con i filtri. Può essere un’ottima idea, per concludere, duplicare la vista corrente così da applicare ad essa i filtri necessari ed effettuare tutti gli esperimenti del caso.