Aqui está algo que você pode encontrar com frequência no Google Analytics 4. Você abre um relatório e vê um ponto de exclamação laranja na parte superior do relatório. Você clica nele e vê este aviso dizendo “Limiarização aplicada” (mesmo que também diga que o relatório não tem amostra):
Como pode ser?
O relatório não é amostrado, mas esse “limiar” soa como amostragem, onde você obtém apenas uma parte dos dados capturados.
Nesta postagem do blog, explicarei o que é limiarização, o que acontece quando ela é aplicada e como evitá-la.
O quê está causando isto?
Os limites no Google Analytics 4 são causados por um recurso chamado Google Signals. Ele está desativado por padrão, mas se você ativá-lo, as coisas podem ficar estranhas.
Por que você precisa ativar os Sinais do Google em primeiro lugar? Há pelo menos duas razões, mas primeiro, vamos aprender rapidamente o que é o Google Signals em geral.
Google Signals
O Google Signals permite o rastreamento de usuários em vários dispositivos e plataformas. Quando ativado, o Google Signals coleta dados de usuários que fizeram login em uma conta do Google e ativaram o recurso nas configurações de sua conta do Google. Esses dados são usados para fornecer informações sobre os dados demográficos, interesses e outras características do seu público.
Se o Google Signals estiver ativo, sua propriedade do GA4 coletará mais dados e desbloqueará determinados recursos. É aí que chegamos a pelo menos dois motivos pelos quais as pessoas podem querer ativar os Sinais do Google:
- Ele começará a preencher dados demográficos no GA4;
- Ele permite que você reutilize os públicos do Google Analytics como públicos de retargeting no Google Ads (assim, você pode exibir anúncios mais direcionados para eles).
Mas junto com isso, temos uma ressalva: limiarização.
Qual é o impacto do Limiar no Google Analytics 4?
Se você estiver olhando para o relatório e ele contiver dados do Google Signals, o Google Analytics ocultará linhas nos relatórios com pequenos números de usuários). Não sei o número exato, mas parece algo abaixo de 50 usuários por linha.
Portanto, se você estiver analisando um relatório de aquisição de tráfego e algumas fontes de tráfego geraram menos de 50 usuários nesse período, a interface do GA4 ocultará esses dados. Ele ainda está armazenado no banco de dados, mas não é exibido.
Aqui está um exemplo. Sei que existem centenas de fontes de tráfego exclusivas que direcionam os visitantes para um site (verifiquei o Universal Analytics). Mas se o limite de dados entrar em ação, você verá apenas aqueles que direcionaram mais de 50 (ou mais) usuários.
Por que o Google está fazendo isso?
Oficialmente, eles dizem que isso é para impedir que nós (usuários do GA) identifiquemos usuários individuais com base nos dados que o Google Signals adiciona aos nossos relatórios (por exemplo, idade, sexo, etc.).
Honestamente, não tenho ideia de como poderia identificar um usuário com base nisso (porque, por exemplo, os dados do Google Signals não são exportados para o Bigquery), mas essa é a posição do Google. E não há muito que nós, como usuários do GA, possamos fazer aqui. Os limites são definidos pelo sistema e não podemos ajustá-los.
Como evitar o limite no GA4?
Primeiro, vejamos o que você pode fazer de antemão para evitar o limite de dados no Google Analytics 4. A resposta é bastante simples: não habilite os Sinais do Google.
Se você não planeja usar relatórios demográficos e públicos-alvo do GA4 para remarketing no Google Ads, não ative os sinais.
Se, por outro lado, você realmente precisa de um desses dois recursos, receio que não haja uma maneira natural de evitar completamente esse problema (há uma solução alternativa, mas tem suas ressalvas.
E se você ativou o Google Signals no passado e o desativou agora? Isso vai ajudar?
Isso ajudará com dados futuros. Se o intervalo de tempo analisado não incluir mais dados de Sinais, o limite não deve ser aplicado. Mas se você analisar períodos mais extensos com dados mais antigos com Sinais, o limite será ativado novamente.
O que fazer se você vir um aviso de Limiar?
Se você está nesta página, isso significa que você já ativou os Sinais do Google no passado e está enfrentando esse problema desagradável. O que fazer agora?
Uma solução alternativa ajudará você a desativar o limite – alterando a identidade de relatório padrão. Mas também há uma ressalva. Primeiro, deixe-me explicar onde mudar isso e depois explicarei as implicações.
A identidade de relatório padrão é um recurso que afeta a forma como o Google Analytics calcula os usuários do seu site/aplicativo. Ele deve usar apenas dados de cookies? Ele também deve usar dados de User ID (que você já pode estar enviando para o GA)? Os dados dos sinais do Google também devem ser incluídos?
Você pode alterá-lo acessando Admin > Reporting Identity.
Aqui você verá duas opções (mas, na verdade, são três). Clique em Mostrar tudo.
- A identidade de relatório Device-based é a mais básica. Ele usará apenas o ID do dispositivo (também conhecido como cookie primário). Se o mesmo usuário usar vários navegadores/dispositivos, o GA tratará isso como usuários separados.
- Observed é um pouco mais avançado. Ele usa dados de cookies, dados do Google Signals (se você o ativou) e ID do usuário (se você também estiver rastreando). Coisas como ID do usuário ou dados do Google Signals podem ajudar o GA a desduplicar certos usuários e entender que uma pessoa que usa vários dispositivos ainda pode ser a mesma pessoa.
- Blended é o mais avançado. Ele inclui todos os métodos de identidade anteriores, além de usar aprendizado de máquina para preencher as lacunas e modelar dados. Você precisa implementar o modo de consentimento do Google para desbloquear esse recurso.
Se você usar a identidade de relatórios Observados ou Combinados (e tiver coletado dados dos Sinais do Google), o limite provavelmente será aplicado.
MAS, se você mudar para baseado em dispositivo, os sinais do Google não serão usados e o limite desaparecerá.
O bom de relatar a identidade é que você pode alternar/alterar isso quantas vezes quiser e quando quiser. Os dados armazenados no banco de dados do GA não serão afetados. E a identidade de relatório também é aplicada retroativamente.
Portanto, na maioria dos casos, você pode continuar usando a identidade observada e, se estiver curioso sobre linhas com números pequenos, poderá alternar rapidamente para a identidade baseada em dispositivo.
Lembre-se de que, quando você usa dispositivos baseados em dispositivos, itens como ID do usuário não são considerados no cálculo de seus relatórios, portanto, as contagens de usuários serão menos precisas. Então essa é a principal ressalva.
Não se preocupe. A identidade do relatório não afeta a coleta de dados. Portanto, se você mudar para baseado em dispositivo (enquanto seu GA4 estiver coletando IDs de usuário), todos os dados serão coletados. Mas não será usado nos cálculos do usuário até que você volte para a identidade observada ou combinada.
Às vezes, um bug acontece
Ocasionalmente, notei que às vezes o aviso de limite permanece mesmo se eu alterar a identidade do relatório para somente dispositivo. Nesses casos, fazer uma atualização forçada (CTRL + F5 no Windows) às vezes ajuda. Caso contrário, ignoro o aviso porque os relatórios começam a mostrar as linhas com números pequenos também.
Talvez quando você estiver lendo isso, o problema já esteja resolvido. Mas tenha isso em mente.
Não é o fim do mundo (ou é?)
Às vezes sim, às vezes não.
Com base no que vi, linhas com números pequenos (pelo menos no relatório de aquisição de tráfego) geralmente representam menos de 5% de todo o tráfego. Portanto, isso não é um grande problema para a precisão dos dados, porque o GA4 tenta preencher algumas lacunas com dados modelados ou ID do usuário/sinais do Google.
Mas também pode haver situações em que o impacto é muito maior. Por exemplo, sites pequenos (que recebem apenas centenas de visitantes por dia/semana) podem enfrentar um desafio mais significativo. Imagine que você não pode ver metade dos seus eventos nos relatórios porque simplesmente não há muitos. Então você será forçado a manter uma identidade de relatório baseada em dispositivo.
Portanto, sugiro alternar regularmente entre as configurações de identidade de relatório para verificar novamente o impacto. Eu gostaria que houvesse uma maneira rápida de alterar a identidade do relatório diretamente nos relatórios/interface principal (em vez de ir para a seção Admin). Além disso, outro desejo seria ter uma identidade de relatório separada que nos permitisse continuar usando o ID do usuário, mas não os Indicadores do Google.
Limiar aplicado no Google Analytics 4: palavras finais
Este é um daqueles artigos em que eu gostaria que tal coisa não existisse no GA4.
Limitação de dados no Google Analytics 4 não é amostragem. Essas são coisas diferentes. O limite é aplicado quando sua propriedade do GA4 atende a todas estas condições:
- Você coletou alguns dados através do Google Signals (ativando-os em algum momento);
- Sua identidade de relatório é combinada ou observada;
- E um relatório (que você está vendo) contém linhas com números pequenos de usuário/evento/sessão (não sei o número exato, mas diria que deve ser 50 ou menos).
Nesse caso, as linhas com números pequenos ficarão ocultas e não serão exibidas no relatório (mesmo que esses dados ainda estejam disponíveis em algum lugar em segundo plano).
Para evitar a limitação de dados no futuro, não ative os Sinais do Google (se você não planeja usar recursos de remarketing ou relatórios demográficos no GA). Se você já fez isso, pode alterar a identidade de relatório para baseada em dispositivo sempre que quiser e pode alternar entre eles. Esta configuração não afeta os dados que você coletou, afeta a forma como os números são calculados.
Tradução. Texto original leia aqui.