Artigo Redis (caso de aplicação - estatísticas UV) (continuamente atualizado e iterado) - Code World

Artigo Redis (caso de aplicação - estatísticas UV) (continuamente atualizado e iterado)

Internet 2024-10-03 16:02:54 views: null

Índice

2. Teste as estatísticas de milhões de dados

1. HiperLogLog

Primeiro entendemos dois conceitos:

UV: O nome completo é Visitante Único, também chamado de visitantes únicos, que se refere às pessoas físicas que acessam e navegam nesta página pela Internet.

Se o mesmo usuário visitar o site várias vezes em um dia, isso será registrado apenas uma vez.

PV: O nome completo é Page View, também chamado de page views ou cliques. Cada vez que um usuário visita uma página do site, um PV é registrado e o usuário abre a página várias vezes.

superfície, vários PVs são registrados.

Freqüentemente usado para medir o tráfego do site.

De modo geral, o UV é muito maior que o PV, portanto, ao medir o número de visitas ao mesmo site, precisamos considerar muitos fatores.

Então, apenas usamos esses dois valores como valor de referência

Será mais problemático fazer estatísticas UV no lado do servidor, porque para determinar se o usuário foi contado, as informações do usuário contadas precisam ser salvas.

Mas se cada usuário visitante for salvo no Redis, a quantidade de dados será muito assustadora, então como lidar com isso?

Hyperloglog (HLL) é um algoritmo probabilístico derivado do algoritmo Loglog e é usado para determinar a cardinalidade de conjuntos muito grandes sem a necessidade de armazenar todos eles

valor.

Você pode consultar os princípios do algoritmo relevantes: https://juejin.cn/post/6844903785744056333#heading-0

O HLL no Redis é implementado com base na estrutura de string. A memória de um único HLL é sempre menor que 16kb e o uso de memória é terrivelmente baixo!

Como compensação, suas medições são probabilísticas, com erro inferior a 0,81%.

Mas para as estatísticas UV, isso é completamente insignificante.

2. Teste as estatísticas de milhões de dados

Idéia de teste: usamos testes de unidade diretamente para adicionar 1 milhão de dados ao HyperLogLog para ver como está o uso de memória e os efeitos estatísticos.

Após o teste: nosso erro está dentro da faixa permitida e o uso de memória é mínimo

Acho que você gosta

Origin blog.csdn.net/qq_51226710/article/details/142655875

Artigo Redis (caso de aplicação - estatísticas UV) (continuamente atualizado e iterado)

Artículo de Redis (caso de aplicación: estadísticas UV) (actualizado e iterado continuamente)

Resumo do artigo FCENet e explicação do código com base no PaddleOCR (atualizado continuamente)

estatísticas de flink PV e UV e filtro bloom

Django implementa plataforma de automação de interface (14) módulo de caso de teste Serializador e visualização de casos de teste [atualizado continuamente]

O aprendizado de desenvolvimento Android é continuamente atualizado

Um artigo resume a estratégia de qualidade de serviço QoS do Cyclonedds (C++) (atualizado continuamente)

Classificação de conteúdo de inteligência artificial e neurônios (atualizado continuamente)

[Ubuntu18.04] Problemas de instalação e configuração resolvidos ---- Atualizado continuamente

Registro de autoestudo do Vben Admin - introdução e uso (atualizado continuamente...)

hivesql comum e formato de data menos comum (continuamente atualizado)

Gerenciamento e agendamento de processos do Linux (atualizado continuamente)

Estrutura de dados e algoritmo - javascript (atualizado continuamente...)

Aprendizado de tecnologia de visão computacional (atualizado continuamente)

Django implementa plataforma de automação de interface (oito) relatório de teste relata serializador e view [atualizado continuamente]

Django implementa plataforma de automação de interface (11) módulo de projeto Projects serializer e view [continuamente atualizado]

[Estatísticas] Correlação e três coeficientes de correlação nas estatísticas

[Estatísticas de caracteres] Um programa python simples que conta e imprime o número de texto, números, espaços e caracteres especiais no artigo inserido

Continuamente atualizado, que incluem end móvel a aplicação OCR?

Redis comandos usados no cluster (continuamente atualizado)

ES5 e ES6 algumas aplicações integradas (continuamente atualizado)

Perguntas frequentes no ROS e gazebo [Atualizado continuamente]

[Notas estatísticas] (14) Probabilidade e distribuição de probabilidades

Programa Mapreduce em execução em modo de cluster, caso de estatísticas de palavras

2020, o mais recente e mais adequado para o pessoal de operação e manutenção para rotas de estudo (0-1 única maneira, continuamente atualizado)

O programa Mapreduce é executado localmente, caso de estatísticas de palavras

Django implementa plataforma de automação de interface (12) módulo de função personalizada DebugTalks serializador e visualização [atualizado continuamente]

Django implementa plataforma de automação de interface (treze) módulo de interface Serializador de interfaces e visualização [atualizado continuamente]

[Lista de conhecimento da Web] Tudo o que você deseja: rede, HTTP, persistência de sessão, autenticação e autorização...Atualizado continuamente

python de entrada para desistir (continuamente atualizado)

Recomendado

Clasificación

Diario

Más

2025-03-27(0)

2025-03-26(0)

2025-03-25(0)

2025-03-24(0)

2025-03-23(0)

2025-03-22(0)

2025-03-21(0)

2025-03-20(0)

2025-03-19(0)

2025-03-18(0)