Qualquer administrador de alguma conta do Google Analytics já enfrentou problemas com dados irrelevantes sendo contabilizados em suas métricas. A lista de referências “sujas” é extensa, e talvez você já tenha visto fontes como: darodar, ilovevitaly, semalt, lumb.co, makemoneyonline e cenoval aparecendo em suas métricas.

spam-analytics

Os dados fornecidos por essas referências sujam as métricas do Analytics porque provém de fontes não-humanas, ou seja, são bots/spiders acessando seu site (ou simplesmente injetando informações no seu Analytics) por várias razões. Estas referências podem ser:

  • Crawlers vasculhando seu site.
  • Serviços que você tenha contratado para verificar a saúde do seu servidor, se há atualizações em seu blog, etc.
  • Programas maliciosos querendo que você acesse uma determinada página infectada.

O resultado desses acessos são dados “sujos” que atrapalham a análise, aumentando as taxas de rejeição e reduzindo as taxas de conversão.

Então vamos por a mão na massa e aprender, através de alguns simples passos, como aplicar filtros e remover spam e outros dados indesejáveis de nossas métricas.

Antes de tudo, previna-se! Mantenha seus dados seguros

Para não remover possíveis dados relevantes do seu site, crie uma visualização sem filtros. É simples e pode evitar que você perca dados relevantes no caso de acontecer algum problema com os filtros. Para isso, acesse a aba de Administrador do site que você está analisando.

Na seção de Visualizar acesse o link de Criar nova visualização presente na caixa de seleção.

adicionando-nova-visualização-ao-google-analytics

Adicione um nome ao campo Nome da vista da propriedade de relatórios. Recomenda-se algo como “Todos os dados do website” ou “Dados sem filtros”.

adicionando-nova-visualização-ao-google-analytics-2

Pronto! A partir de agora se houver algum problema com os filtros aplicados e algum dado relevante acabar sendo removido você poderá compará-los com esta nova visualização.

Dica: Se você for uma pessoa realmente organizada, tente manter sempre uma visualização principal, uma sem filtro (como a que acabamos de criar) e outras como teste, para você experimentar antes de aplicar os filtros à visualização principal.

Adicionando filtros

Bom, vamos entender como o Google explica os filtros de vista da propriedade:

Os filtros permitem que você limite e modifique os dados de tráfego incluídos em uma visualização. Por exemplo, é possível usar filtros para excluir o tráfego de endereços IP específicos, concentrar-se em determinado subdomínio ou diretórios…

Como você pode ver, a ideia é simples, precisamos limitar o acesso desses dados indesejáveis e excluí-los do tráfego de nosso site, mas antes precisamos entender como se classificam essas referências.

Referências fantasmas (ilovevitaly, cenokos, etc.)

Estas referências são consideradas “fantasmas” porque não chegam a visitar seu site. Os dados são injetados em sua conta através de um host externo e é justamente essa a fragilidade da técnica utilizada pelos spammers.

Para excluí-los vamos acessar nossa página de Relatórios > Público-alvo > Tecnologia > Rede.

Na Dimensão principal vamos selecionar Nome do host para listar todos os hosts que geraram dados para nossos relatórios.

host-names-de-spam-google-analytics

Na imagem acima temos um exemplo do nosso próprio blog, em que há 4 hosts gerando dados às nossas estatísticas, entre eles estão 2 referências fantasmas: cenokos.ru e ilovevitaly.com.

Há também uma terceira referência chamada preview.hs-sites.com que é gerada pelo acesso aos rascunhos do blog no Hubspost (ferramenta de automação de marketing que utilizamos) e que também não é um tráfego interessante para contabilizarmos.

Portanto, sobrou apenas o nosso próprio host blog.publicodigital.com.br para incluirmos em nosso filtro.

ATENÇÃO! Muitas vezes, podem aparecer outros hosts pelos quais você forneceu seu ID do Google Analytics e que devem ser contabilizados, como por exemplo, Youtube. Fique sempre atento às referências para não excluir dados relevantes.

Agora que sabemos quais são os hosts (no nosso caso é apenas um), vamos aplicar o filtro para que em nossos relatórios apareçam somente dados provenientes destes hosts.

Acesse Administrator > Visualizar > Filtros, crie um nome para o filtro, selecione o tipo como Personalizado e a opção Incluir.

O Campo de filtro que selecionaremos será o de Nome do Host e o Padrão de Filtro que iremos aplicar será:

blog\.publicodigital\.com\.br

exclusao-de-referencias-fantasmas

Você deve ter notado que há barras invertidas antes dos pontos. Acrescentamos as barras porque o padrão de filtro é estipulado como expressão regular, e para as expressões regulares o “ponto” significa “qualquer caracter que não seja uma nova linha”. A função da “\” é retirar este significado, identificando que este ponto é simplesmente um ponto.

Caso você tenha mais de um host proveniente do seu domínio, por exemplo:

  • publicodigital.com.br
  • blog.publicodigital.com.br
  • images.publicodigital.com.br

Você poderá utilizar a expressão:

([a-z0-9-]+\.)?publicodigital\.com\.br

De uma forma geral, esta expressão diz que caso o host seja “publicodigital.com.br” ou que tenha quaisquer letras minúsculas, quaisquer números ou hífens e um ponto ao final antes deste domínio, será considerado válido, como é o caso de blog.publicodigital.com.br e images.publicodigital.com.br.

Além disso, se você tiver outros hosts válidos, como por exemplo: translate.googleusercontent.com. Você poderá utilizar o valor “|” para separá-los. Nas expressões regulares, o “|” é basicamente um “ou”. Nossa expressão então ficaria:

([a-z0-9-]+\.)?publicodigital\.com\.br|translate\.googleusercontent\.com

Não se esqueça, teste e crie novas vistas de propriedade como explicamos no tópico Antes de tudo, previna-se! Mantenha seus dados seguros antes de aplicar filtros à vista principal.

Referências não-fantasmas (semalt, buttons-for-website, etc.)

No tópico anterior incluímos apenas os hosts válidos para evitar que dados provenientes de fontes externas sejam adicionados aos nossos relatórios. No entanto, em alguns casos, os bots de spam realmente visitam o seu site, utilizando o seu próprio host, e portanto, continuarão aparecendo mesmo que você tenha aplicado a técnica anterior.

Para exibir estas referências acesse Relatórios > Aquisição > Referências. Na dimensão secundária selecione Nome do host para visualizar se dado da referência veio do seu próprio host.

adicionando-filtros-as-referencias
Neste caso, temos semalt.com e buttons-for-website.com como referências indesejadas e para que elas não sejam mais contabilizadas precisamos aplicar um filtro de exclusão.Acesse Administrator > Visualizar > Filtros, crie um nome para o filtro, selecione o tipo como Personalizado e a opção como Excluir.

O Campo de filtro que selecionaremos será o de Referência e o Padrão de Filtro que iremos aplicar será:

 

semalt\.com|buttons-for-website\.com

removendo-referencias-nao-fantasmas-do-analytics

Solução mágica para filtro de bots

Em julho de 2014, o Google Analytics introduziu um novo recurso para excluir bots conhecidos de seus relatórios. Esta solução utiliza a lista internacional de bots e spiders da IAB como base para excluí-los. Por padrão a opção não está selecionada, portanto, para começar a usar esta técnica é necessário marcar o checkbox encontrado no final das Configurações da visualização de relatórios:

excluindo-todos-os-bots-e-indexadores-conhecidos

No entanto, isso não quer dizer que as duas outras técnicas apresentadas anteriormente devam ser deixadas de lado. O melhor a se fazer é testar antes de aplicá-la à visualização de relatórios principal.

Conclusão

Dados irrelevantes em relatórios do Google Analytics são comuns no dia-a-dia de analistas de métricas, podendo dificultar, e muito, o processo de análise. No entanto, as 3 técnicas apresentadas, quando combinadas, se tornam uma poderosa solução para o problema de bots em seus relatórios.

Lembre-se sempre de testar novos filtros e seja feliz com seus relatórios livres de spam!


Publico Digital

Publico Digital

Uma agência de Marketing Digital com foco em Inbound Marketing, especializada em atrair visitantes e convertê-los em leads e consumidores.


Deixe um comentário