Redis-Artikel (Anwendungsfall – UV-Statistiken) (kontinuierlich aktualisiert und iteriert) - Code World

Redis-Artikel (Anwendungsfall – UV-Statistiken) (kontinuierlich aktualisiert und iteriert)

Internet 2024-10-03 15:51:27 views: null

Inhaltsverzeichnis

2. Testen Sie die Statistiken von Millionen von Daten

1. HyperLogLog

Zuerst verstehen wir zwei Konzepte:

UV: Der vollständige Name lautet Unique Visitor, auch Unique Visitors genannt, und bezieht sich auf natürliche Personen, die über das Internet auf diese Webseite zugreifen und diese durchsuchen.

Besucht derselbe Nutzer die Website mehrmals am Tag, wird dies nur einmal erfasst.

PV: Der vollständige Name lautet Page View, auch Seitenaufrufe oder Klicks genannt. Jedes Mal, wenn ein Benutzer eine Seite auf der Website besucht, wird ein PV aufgezeichnet und der Benutzer öffnet die Seite mehrmals.

Oberfläche werden mehrere PVs aufgezeichnet.

Wird häufig zur Messung des Website-Verkehrs verwendet.

Im Allgemeinen ist UV viel größer als PV. Wenn wir also die Anzahl der Besuche auf derselben Website messen, müssen wir viele Faktoren berücksichtigen.

Daher verwenden wir diese beiden Werte einfach als Referenzwert

Es wird schwieriger sein, UV-Statistiken auf der Serverseite zu erstellen, da die gezählten Benutzerinformationen gespeichert werden müssen, um festzustellen, ob der Benutzer gezählt wurde.

Wenn jedoch jeder besuchende Benutzer in Redis gespeichert wird, ist die Datenmenge sehr beängstigend. Wie geht man also damit um?

Hyperloglog (HLL) ist ein probabilistischer Algorithmus, der vom Loglog-Algorithmus abgeleitet ist und zur Bestimmung der Kardinalität sehr großer Mengen verwendet wird, ohne dass diese alle gespeichert werden müssen

Wert.

Sie können sich auf die relevanten Algorithmusprinzipien beziehen: https://juejin.cn/post/6844903785744056333#heading-0

Die HLL in Redis wird basierend auf der String-Struktur implementiert. Der Speicher einer einzelnen HLL beträgt immer weniger als 16 KB und die Speichernutzung ist erschreckend gering!

Als Kompromiss sind die Messungen probabilistisch und weisen einen Fehler von weniger als 0,81 % auf.

Für die UV-Statistik ist dies jedoch völlig vernachlässigbar.

2. Testen Sie die Statistiken von Millionen von Daten

Testidee: Wir verwenden Unit-Tests direkt, um 1 Million Daten zu HyperLogLog hinzuzufügen, um zu sehen, wie die Speichernutzung und die statistischen Auswirkungen sind.

Nach dem Test: Unser Fehler liegt im zulässigen Bereich und die Speichernutzung ist minimal

Ich denke du magst

Origin blog.csdn.net/qq_51226710/article/details/142655875

Redis-Artikel (Anwendungsfall – UV-Statistiken) (kontinuierlich aktualisiert und iteriert)

Linux-Prozessmanagement und -planung (kontinuierlich aktualisiert)

Datenstruktur und Algorithmus – Javascript (kontinuierlich aktualisiert...)

Inländische Software-Spiegelquellen und deren Verwendung [kontinuierlich aktualisiert]

Häufig gestellte Fragen in ROS und Pavillon [Kontinuierlich aktualisiert]

Django implementiert Schnittstellenautomatisierungsplattform (acht) Testberichtberichte Serialisierer und Ansicht [kontinuierlich aktualisiert]

Pytharm nutzt Fehlerberichte und Lösungen (kontinuierlich aktualisiert)

[Ubuntu18.04] Installations- und Konfigurationsprobleme behoben ----Kontinuierlich aktualisiert

Vben Admin-Selbststudienprotokoll – Einführung und Verwendung (kontinuierlich aktualisiert ...)

Beschreiben Sie kurz die Geschichte der Entwicklung der Computersprache. Warum wird die Sprache aktualisiert und iteriert?

ubuntu Kurzbefehle kontinuierlich aktualisiert

Java Notes [Kontinuierlich aktualisiert ...]

Redis Befehle in dem Cluster verwendet wird (kontinuierlich aktualisiert)

LLM-Zusammenfassung (kontinuierlich aktualisiert)

Python-Grundlagen (kontinuierlich aktualisiert)

Deep Learning – Hyperparameter (kontinuierlich aktualisiert)

Python--matplotlib (kontinuierlich aktualisiert)

Python--numpy (kontinuierlich aktualisiert)

pygplates – Spaltenübersicht (kontinuierlich aktualisiert)

Docker-Studiennotizen (kontinuierlich aktualisiert)

Linux-Bedienbefehle (kontinuierlich aktualisiert)

ChatGPT-Zusammenfassung (kontinuierlich aktualisiert)

go-Fehlersatz (kontinuierlich aktualisiert)

Die Interviewfragen für 2020 werden frisch veröffentlicht und kontinuierlich aktualisiert

2023 Front-End-Entwicklungsinterview schriftliche Testfragen (1) selbstorganisierte Sammlung und Ermutigung der Fragenbank (kontinuierlich aktualisiert)

Android Reverse Learning Frida Reverse und Packet Capture praktische Studiennotizen (kontinuierlich aktualisiert)

Django implementiert Schnittstellenautomatisierungsplattform (dreizehn) Schnittstellenmodul Schnittstellen-Serialisierer und -Ansicht [kontinuierlich aktualisiert]

Django implementiert das benutzerdefinierte Funktionsmodul DebugTalks Serializer und View der Schnittstellenautomatisierungsplattform (12) [kontinuierlich aktualisiert]

Django implementiert die Schnittstellenautomatisierungsplattform (14) Testfallmodul Testfälle Serialisierer und Ansicht [kontinuierlich aktualisiert]

Django implementiert das Projektmodul „Interface Automation Platform (11)“ für Projekte, Serialisierung und Ansicht [kontinuierlich aktualisiert]

Empfohlen

Rangfolge

Täglich

Mehr

2025-04-29(0)

2025-04-28(0)

2025-04-27(0)

2025-04-26(0)

2025-04-25(0)

2025-04-24(0)

2025-04-23(0)

2025-04-22(0)

2025-04-21(0)

2025-04-20(0)