Le visite fantasma (il “Ghost spam”) sono causate da spammer che colpiscono direttamente GA, causando un incremento totalmente fasullo nei dati.
Se siamo colpiti dalle visite fantasma, o da altri tipi di referral spam, noteremo un aumento delle sessioni di durata 0 e che hanno una frequenza di rimbalzo praticamente del 100%.
Il ghost spam non è effettuato da bot che visitano effettivamente le pagine, ma falsa direttamente le nostre statistiche contattando il nostro account Analytics tramite il protocollo che invia ai server GA i dati sull’interazione tra utenti e sito (il Measurement Protocol).
Individuare i ghost spammer in GA
Un utente reale lascia un vero nelle statistiche, un falso utente ne lascia uno sconosciuto oppure un “(not set)”. Tutti i dati generati da queste visite sono ovviamente falsi.
Potremo, comunque, impostare un filtro per tenere pulite le nostre statistiche.
Generalmente, il coincide col dominio del sito e con qualsiasi altro posto dove abbiamo messo il codice GA in questione.
Per prima cosa, cerchiamo la lista dei Nomi host:
- In GA, andiamo nella pagina dei rapporti, poi in Pubblico » Rete;
- Selezioniamo “Nome host” dalla riga delle dimensioni principali;
- In questo caso vediamo che, oltre ai due nomi host validi, cioè quelli che ho oscurato al primo e secondo posto della lista (sono i domini dove è impostato il codice di monitoraggio che fornisce le statistiche), ce ne sono diversi che col sito in questione non c’entrano nulla e che, di sicuro, non hanno installato il nostro codice nelle loro pagine!
Potremmo trovare anche nomi relativi a servizi o sottodomini che abbiamo configurato sul sito e che, quindi, vengono monitorati tramite il medesimo tracking ID, tipo Paypal, Cloudflare, Google Translate, blog.nomedominio.it…
All’atto pratico, se un nome host si riferisce a un dominio che non conosciamo, che non controlliamo o a qualcosa che non ha nulla a che vedere col nostro sito, allora non è valido. A volte gli spammer utilizzano anche nomi di siti molto noti (tipo microsoft.com).
Creare un filtro antispam in Google Analytics
Creeremo un filtro che permetta agli validi di comparire nelle statistiche: se ne configurassimo uno che escludesse quelli non validi, dovremmo aggiornarlo spesso; in questo modo, invece, lo modificheremo solo nel caso in cui aggiungessimo il codice di monitoraggio a nuovi servizi/domini/sottodomini.
Questo tipo di spam, poiché non passa dal sito, non viene fermato da modifiche in .htaccess, uso di plugin e quant’altro possiamo fare sull’hosting che ci ospita, sul CMS o, comunque, sul sito. Agire su questi aspetti può essere utile per arginare il referral spam, ovvero quello attuato dai crawler, che visitano effettivamente le pagine.
Per prima cosa, facciamo una lista dei nomi host validi che abbiamo trovato; per esempio, potrebbero essere un elenco tipo:
- dominio.it
- sub.dominio.it
- translate.googleusercontent.com
Utilizziamo le espressioni regolari (Regular Expression) per costruire il pattern del filtro: separiamo i nomi con una barra verticale, utilizziamo la barra rovesciata prima di punti e trattini, niente spazi tra i caratteri; la nostra lista diventerà composta solo da:
dominio\.it|googleusercontent\.com
perché, grazie alla sintassi delle espressioni regolari, sub.dominio.it e translate.googleusercontent.com sono già “inclusi”, così come altri eventuali (www.dominio.it, eng.dominio.it, shop.dominio.it e così via). Possiamo testare la nostra espressione regolare con questo strumento e/o applicarla su una Vista di prova.
C’è un limite di 255 caratteri per le Regular Expression in Analytics, è quindi buona regola cercare di essere il più brevi possibile.
Sempre secondo la sintassi REGEX, il pattern che abbiamo individuato può essere ulteriormente abbreviato in:
dominio|googleusercontent
Applicare il filtro alla Vista:
- In GA, andiamo in Amministrazione, scegliamo la Vista alla quale vogliamo applicare il filtro e selezioniamo Filtri, poi clicchiamo su “Aggiungi filtro”.
- Diamo un nome al filtro che stiamo per creare;
- Scegliamo il tipo di filtro “Personalizzato”;
- Importante: scegliere “Includi”!
- Nel menù a tendina “Seleziona campo”, scegliere “Nome Host” e poi fare copiaincolla della nostra espressione regolare nel campo “Pattern filtro”;
- Salvare!
Da ora in poi (i filtri di Analytics non sono retroattivi), vedremo le nostre statistiche ripulite dalle visite fantasma: basta ricordarsi di aggiornare il filtro se aggiungeremo l’ID di monitoraggio a qualche nuovo servizio/dominio/sottodominio che andremo a configurare.