ZhongAn Insurance x StarRocks | De nouvelles capacités d'analyse en temps réel ouvrent une nouvelle situation dans les opérations numériques

En tant que première compagnie d'assurance Internet en Chine, ZhongAn Insurance est une société de technologie financière qui stimule le développement financier grâce à l'innovation technologique. Différent du mode de fonctionnement des compagnies d'assurance traditionnelles, ZhongAn Insurance utilise un processus commercial en ligne tout au long du processus. Il n'y a pas de succursales dans tout le pays et les services de souscription et de réclamation sont entièrement assurés par Internet. À l'heure actuelle, il a servi plus de 500 millions d'utilisateurs et la prime totale en 2021 dépassera 20 milliards de yuans, soit une augmentation de 21,9 % en glissement annuel.

Poussé par le double moteur "assurance + technologie", ZhongAn Insurance se concentre sur l'application des nouvelles technologies pour remodeler la chaîne de valeur de l'assurance. Se concentrant sur les quatre grands écosystèmes de la santé, de la vie numérique, du crédit à la consommation et de l'automobile, il utilise la technologie pour servir le nouveau génération et leur fournir une nouvelle assurance personnalisée, personnalisée et intelligente.

Alors que la technologie renforce l'assurance, ZhongAn Insurance exporte sa technologie éprouvée vers le monde extérieur.Ses partenaires à l'étranger incluent la plus ancienne compagnie d'assurance de biens du Japon, SOMPO, la principale plateforme O2O d'Asie du Sud-Est, Grab, la plus grande agence d'assurance multirisque de Singapour, Income et d'autres sociétés bien connues. .

Ces dernières années, ZhongAn Insurance s'est engagée à accélérer la transformation de la valeur des données en valeur commerciale et à promouvoir les éléments de données pour améliorer la qualité et l'efficacité de l'entreprise. Cela nécessite non seulement une équipe technique professionnelle + un système numérique mature, mais également des outils techniques pour fournir des solutions intelligentes.

Cet article utilisera la pratique d'application de la plate-forme Zhongan Jizhi basée sur le système de base de données analytique MPP extrêmement rapide StarRocks, pour expliquer comment la plate-forme Jizhi résout les problèmes de données tels que les requêtes extrêmement rapides et la simultanéité élevée, et améliore la capacité globale de prise en charge des données.

fond d'affaires

Dans les scénarios de vente d'assurance traditionnels, les compagnies d'assurance réalisent principalement des bénéfices grâce aux bénéfices de souscription et aux revenus d'investissement, et la nature spécifique au secteur du financement de l'assurance rend les compagnies d'assurance très sensibles aux données, à la sécurité et au contrôle globaux de l'entreprise. surveiller strictement l'orientation commerciale et les changements de données dans chaque lien, du lancement sur le marché aux ventes, en passant par la souscription et le règlement des sinistres.

Et avec la précipitation et l'expansion des affaires du temps, de plus en plus de données pertinentes sont impliquées et accumulées par la compagnie d'assurance, y compris non seulement les données commerciales de la compagnie d'assurance elle-même, mais aussi les données des ventes de commerce électronique, médicales et de santé et autres données des canaux de coopération, ainsi que des données de tiers Notation de crédit, contrôle de souscription et autres données. Dans le contexte d'une concurrence de plus en plus féroce sur les marchés et des changements technologiques, l'innovation du modèle économique basé sur des technologies telles que le big data et l'intelligence artificielle, ainsi que la transformation et la mise à niveau numériques, sont devenues un choix incontournable pour les institutions d'assurance.

Par conséquent, dans le contexte ci-dessus, des technologies et des produits pertinents pour le secteur financier de l'assurance sont nés.Avec le soutien de technologies connexes telles que le big data et l'intelligence artificielle, les compagnies d'assurance peuvent s'assurer que le coût est contrôlable et que les données peuvent être exploitées dans chaque entreprise. lien. Scénarios courants tels que la distribution des canaux, l'accès des utilisateurs et la surveillance des activités dans les scénarios marketing ; l'octroi de crédit, le remboursement, le remboursement et le risque d'anti-sélection défavorable dans les scénarios de crédit.

Bien sûr, face à une telle quantité de données et à une telle complexité commerciale dans le secteur de l'assurance et de la finance, il existe à la fois des défis et des opportunités, mais ces données doivent être pleinement intégrées et utilisées efficacement afin de mieux les convertir en leurs propres actifs de données, transition du mode de fonctionnement traditionnel au fonctionnement numérique en ligne. Laissez les chiffres refléter les conditions d'exploitation réelles et contrôlez en temps opportun les risques des produits et les ajustements de stratégie pour réaliser des bénéfices positifs à partir des revenus de primes et réaliser des opérations raffinées.

En tant que première compagnie d'assurance Internet au monde à stimuler le développement financier grâce à l'innovation technologique, ZhongAn fournit des services de souscription et de réclamation via Internet tout au long du processus sous la double impulsion d'Internet + financement d'assurance. Dans le cadre du double contexte ci-dessus, Jizhi, un produit système dédié à la gestion et à l'analyse des données d'entreprise dans la transformation numérique, est né.

Cet article prendra comme exemple le scénario d'utilisation réelle de la mise à niveau complète des capacités commerciales numériques de Jizhi basée sur StarRocks, et décrira comment Jizhi résout les problèmes de données tels que les requêtes extrêmement rapides et la simultanéité élevée via StarRocks, et améliore la capacité globale de prise en charge des données du Plateforme Jizhi et compétitivité du marché.

Introduction à la plateforme Jizhi

Jizhi est un produit de plate-forme d'analyse d'entreprise visualisée et intelligente de ZhongAn. Il intègre l'intelligence artificielle + l'intelligence d'affaires + la technologie d'entrepôt de données visuel , intègre intelligemment les données de différents scénarios, normalise les pools de données d'entreprise et complète la gouvernance et l'intelligence des données complexes. .

Jizhi adhère à la vision "d'aider les entreprises à réaliser une gestion intelligente" et au concept de "des données à la valeur, de l'observation à la prédiction" , en s'appuyant sur des composants de graphiques visuels riches et les capacités de traitement de données volumineuses sous-jacentes pour atteindre zéro glissement de code Drag-and -l'analyse des gouttes et la réponse de second niveau aux données d'un milliard de dollars peuvent aider les planificateurs stratégiques d'entreprise, les planificateurs financiers, les directeurs commerciaux, les opérateurs commerciaux et le personnel des données à améliorer de manière globale l'efficacité de l'information, l'efficacité des ressources et l'efficacité de la prise de décision.

À l'heure actuelle, au sein de ZhongAn, plus de  3 000  personnes utilisent la plate-forme Jizhi dans divers secteurs d'activité de la vie numérique, de l'assurance maladie, de la finance, de l'exploitation directe et de l'assurance, ainsi que des départements intermédiaires et principaux tels que les RH, la gestion des opérations, et contrôle.La vie quotidienne moyenne peut atteindre  2000+ , ce qui améliore l'efficacité de l'analyse des données de  plus de 50% et réduit le coût de la main-d'œuvre de l'entreprise de 40%  .  

fond d'affaires

Un bon produit d'analyse de données est indissociable du moteur de données sous-jacent. Plusieurs scénarios d'utilisation de la plate-forme Jizhi mettent en avant différentes exigences pour l'architecture de données sous-jacente.

  • Analyse visuelle → besoin d'avoir une riche bibliothèque de fonctions pour prendre en charge le calcul des données de différents types de graphiques ;

  • Analyse interactive → une réponse rapide aux résultats d'analyse est nécessaire pour garantir des idées d'analyse fluides aux utilisateurs ;

  • L'analyse de perspective multidimensionnelle → nécessite une grande quantité de données détaillées pour prendre en charge la sélection et l'exploration des différentes dimensions ;

  • Analyse de données en temps réel → nécessité de prendre en charge l' écriture de données en temps réel et la requête en temps réel .

En réponse aux exigences ci-dessus, nous avons choisi ClickHouse comme moteur OLAP unifié sous-jacent au début de la construction de la plate-forme. La liaison de données est la suivante :

 

Les données hors ligne seront collectées uniformément dans l'entrepôt de données MaxCompute ou Hive via DataX, et le travail ETL de données sera terminé dans l'entrepôt de données hors ligne. Une fois le traitement des données terminé, il sera à nouveau envoyé à ClickHouse via DataX, et les données dans ClickHouse sera directement fourni à Kanban ou Le système tiers effectue une requête de données.

Les données en temps réel seront synchronisées avec Kafka via les outils de surveillance ou de collecte de journaux Binlog, puis complèteront l'ETL de données en temps réel via Flink, et tomberont enfin dans ClickHouse. Il convient de mentionner que, afin de répondre aux besoins de mise à jour des données en temps réel par clé primaire dans certains scénarios commerciaux , nous utilisons le  moteur ReplacingReplicatedMergeTree  de ClickHouse . Étant donné que le support de ClickHouse pour les opérations de mise à jour des données n'est pas assez mature, il rencontre de nombreux problèmes lors du processus d'utilisation du moteur de remplacement, ce qui est la principale raison pour laquelle nous recherchons une nouvelle sélection de technologie OLAP.

Statut de la plateforme

Après la mise en ligne de Jizhi, ClickHouse a été utilisé et fonctionne avec l'entreprise depuis un certain temps.Cependant, avec le nombre croissant d'utilisateurs utilisant la plate-forme, la quantité de données que l'entreprise doit interroger augmente également, et le scénario commercial est devenu Après la complexité, ClickHouse ne peut pas répondre à de nombreux scénarios spécifiques, et il rencontre également des goulots d'étranglement face aux besoins de différents rôles. Dans le même temps, nous avons constaté les problèmes suivants du point de vue des utilisateurs professionnels et du point de vue de l'exploitation et de la maintenance de la plate-forme :

Du point de vue de l'utilisateur

  • Il y a souvent 6 à 8 graphiques sur le tableau d'analyse sur une seule page, et les demandes de requête pour ces graphiques sont toutes envoyées à ClickHouse en même temps. Cependant, dans un scénario multi-concurrence , les performances des requêtes de ClickHouse se dégradent rapidement. Habituellement, une requête d'environ 1 à 2 secondes peut remplir le CPU sous 8 simultanéités, et le temps de réponse moyen se dégrade d'environ 4 fois, jusqu'à 8 à 10 secondes. , a un impact plus important sur le temps de chargement de la première page du tableau Kanban et sur l'expérience d'analyse interactive ;

  • La plate-forme prend en charge la requête associée des tables de données, mais les performances de requête associées à plusieurs tables de ClickHouse sont excellentes. La requête impliquant Join prend souvent plus de 10 secondes, et la requête avec une grande quantité de données expire même directement et ne peut pas renvoyer le résultat.

Du point de vue de l'exploitation et de la maintenance

  • ClickHouse ne prend pas en charge les opérations transactionnelles DDL et DML, et la gestion des métadonnées du mode multi-copie dépend fortement de ZooKeeper Lorsque la structure de la table est modifiée, le problème d'incohérence des métadonnées entre les différentes répliques se produit souvent, et il est souvent situé dans ZooKeeper à la fin. La raison en est que les coûts d'investigation et d'exploitation et de maintenance sont relativement élevés ; 

  • À mesure que la quantité de données augmente, lorsque le cluster doit être étendu, ClickHouse ne dispose pas d'un mécanisme de repartitionnement automatique et nécessite l'aide d'outils tiers ou un repartitionnement manuel lors de l'expansion horizontale, ce qui est relativement coûteux. 

Pour les scénarios en temps réel mentionnés ci-dessus , nous avons également rencontré des difficultés lors de l'utilisation du moteur de remplacement de ClickHouse :

  • La requête est lente . Le moteur de remplacement utilise le mode Fusion à la lecture. Lorsque les données sont écrites, plusieurs versions sont enregistrées. Lors de la requête, vous devez spécifier le mot clé FINAL pour dédoublonner et récupérer la dernière version des données. Il en résulte que les prédicats en SQL ne peuvent pas être poussés vers le bas pour la requête de la table de moteur de remplacement.En même temps, dans la version inférieure de ClickHouse, la requête avec la sémantique FINAL ne prend pas en charge le traitement multithread.Presque chaque requête nécessite un seul thread pour analyser l'intégralité de la requête. Pour les données de table, le temps de réponse de la requête impliquant le moteur de remplacement est souvent supérieur à 10 s ;

  • Le moteur de remplacement ne prend en charge que la mise à jour des données, pas la suppression des données . Pour l'opération de suppression, la pratique actuelle consiste à utiliser un champ supplémentaire pour indiquer si les données actuelles ont été supprimées et à utiliser la fonction TTL pour effacer périodiquement les données supprimées. D'une part, un traitement personnalisé supplémentaire est requis et, d'autre part, le champ de balise nouvellement ajouté ralentit davantage les performances de la requête ;

  • Le moteur de remplacement ne peut dédupliquer les données que dans la même partition sur le même shard , ce qui signifie que nous devons effectuer un traitement minutieux lors de la conception des partitions de table et lors de l'écriture des données, ce qui augmente les coûts de développement.

Certains des problèmes décrits ci-dessus impliquent les défauts sous-jacents de ClickHouse. Dans certains scénarios, certaines optimisations personnalisées peuvent être effectuées en utilisant d'autres moteurs fournis par ClickHouse ou des fonctionnalités telles que MaterializedView. Cependant, il nous est difficile d'analyser la diversité des scénarios de requête. sur la plate-forme Effectuez quelques optimisations générales. Sur la base de cette situation, nous avons décidé d'exiger une nouvelle sélection de technologie OLAP.

StarRocks vient à la rescousse

StarRocks est un moteur d'analyse OLAP de type MPP de nouvelle génération. Grâce à nos recherches, nous avons constaté que StarRocks fournit des solutions correspondantes pour de nombreux points douloureux rencontrés :

  • Prend en charge plusieurs requêtes simultanées, certains scénarios peuvent atteindre plus de 10 000 RPS ; 

  • Prend en charge la jointure aléatoire, la jointure colocalisée et d'autres méthodes de jointure distribuées, et les performances de l'association multi-tables sont meilleures ;

  • Prend en charge les opérations DDL et DML transactionnelles, compatibles avec le protocole MySQL ;

  • FE et BE ont des architectures simples et ne reposent pas sur des composants externes, ce qui facilite l'exploitation et la maintenance ;

  • Les données sont automatiquement équilibrées et le cluster est facile à étendre à mesure que l' entreprise se développe .

Pour les scénarios en temps réel, StarRocks a publié le  modèle de clé primaire  dans la version 1.19. En comparant le moteur de remplacement de ClickHouse et le modèle de clé unique de StarRocks, le modèle de clé primaire conserve l'index de clé primaire en mémoire, prend en charge les mises à jour fréquentes en temps réel et garantit qu'il n'y a qu'un seul enregistrement sous la même clé primaire, ce qui résout le problème de Merge-on- Le problème de la fusion en ligne lors de la lecture en mode lecture, et le prédicat ne peut pas être poussé vers le bas et l'index est invalide. Les performances des requêtes sont améliorées en sacrifiant les petites performances d'écriture et l'utilisation de la mémoire , ce qui convient parfaitement à notre scénario d'entrepôt de données en temps réel. 

Après l'enquête, nous avons également effectué un test de comparaison des performances correspondant pour StarRocks et ClickHouse en utilisant l'ensemble de données SSB. Au total, quatre machines 8c32g sont utilisées : hybride StarRocks 1FE/4BE, double copie en deux parties ClickHouse. La version utilisée par StarRocks est la 2.1.0 et la version utilisée par ClickHouse est la 21.9.5. Afin de protéger l'impact du cache système dans le test, pour les scénarios sans concurrence, le cache est vidé en écrivant dans le fichier drop_cache avant chaque requête.

Les résultats des tests ont vérifié les performances puissantes de StarRocks dans des scénarios d'association multi-concurrence et multi-tables, et ont également trouvé des endroits où StarRocks n'est pas bon actuellement :

  • Dans le scénario d'une table unique sans concurrence, la vitesse de requête de StarRocks est fondamentalement la même que celle de ClickHouse, à l'exception du SQL individuel, mais la charge CPU de StarRocks est faible, soit 25 % à 50 % de ClickHouse ;

  • Dans une seule table avec plusieurs scénarios de concurrence, à l'exception de SQL individuel, la vitesse de requête moyenne de StarRocks est 1,8 fois plus rapide que celle de ClickHouse   ;

  • Dans les scénarios où plusieurs tables sont associées sans concurrence, StarRocks est 1,8 fois plus rapide que ClickHouse en moyenne ;  

  • Dans le scénario d'association multi-tables et multi-concurrence, StarRocks est 8 fois plus rapide que ClickHouse en moyenne ;  

  • Les données sont écrites dans des scénarios de requête en temps réel. Dans différents scénarios de requête, la vitesse de requête du modèle de clé primaire de StarRocks est  3  à 10 fois plus rapide que le moteur de remplacement de ClickHouse, et les performances de la requête sont plus stables que celles de ClickHouse (le moteur de remplacement est dû à l'opération de fusion continue en arrière-plan. Les performances de la requête fluctueront en conséquence avec la fluctuation du volume de données de la table de base) ;

  • Dans le scénario d'importation de données par lots, nous avons comparé les performances d'écriture de différentes tailles de lots. Le taux d'écriture moyen de StarRocks est d'environ 20 % à 30 %  plus lent que celui de ClickHouse  .

Sur la base des considérations ci-dessus et des résultats des tests, nous avons décidé d'introduire StarRocks dans l'architecture OLAP de la plate-forme et de prioriser l'application dans des scénarios d'entrepôt de données en temps réel.

Dans l'entrepôt de données en temps réel de la plate-forme Jizhi, les données Binlog, les journaux et les données d'événements de la bibliothèque d'entreprise seront d'abord envoyées à Kafka via l'outil de collecte, et le nettoyage et la conversion préliminaires des données seront effectués via Flink au milieu, puis sortie vers Kafka en tant que couche DWD/DIM. Les données de cette couche sont à nouveau traitées par Flink pour compléter l'association et l'agrégation des données, et enfin, le tableau large détaillé multidimensionnel et le tableau large récapitulatif des indicateurs de différents sujets sont générés dans la couche DWS. La table large de la couche DWS sera synchronisée dans le moteur OLAP en temps réel en même temps, et sera fournie aux étudiants en commerce pour interrogation via le tableau Kanban en temps réel.

Le scénario d'entrepôt de données en temps réel pose de nombreux défis au moteur OLAP, et c'est aussi un scénario difficile majeur que nous avons rencontré auparavant sur la base de l'architecture ClickHouse

  • Les étudiants en commerce doivent ajuster la stratégie de livraison à tout moment en fonction du kanban en temps réel, et exigent que les données du kanban soient mises à jour en temps réel et répondent rapidement ;

  • La fréquence d'affichage du kanban en temps réel est généralement 3 à 5 fois supérieure à celle du kanban hors ligne et les résultats de la requête ne peuvent pas être mis en cache ;

  • Afin d'interroger conjointement les données de différents sujets , les tables larges de la couche DWS doivent souvent être associées dans la couche OLAP ;

  • Afin de répondre aux besoins d'analyse multidimensionnelle, les données détaillées relèvent de la couche OLAP et la quantité de données est importante.

  • Afin d'assurer la maintenabilité des données et la possibilité de corriger rapidement les données, ces données détaillées doivent être mises à jour par la clé primaire .

ClickHouse, qui n'est pas bon pour les requêtes multi-concurrences et multi-tables, et le Debuff du moteur de remplacement est superposé.En conséquence, de nombreux tableaux Kanban en temps réel prennent souvent dix secondes pour renvoyer les résultats de la requête, ce qui ne peut pas bien répondre les besoins de l'entreprise. Dans le même temps, cela exerce également une forte pression sur la charge CPU du cluster, entraînant parfois des fluctuations des performances globales des requêtes du cluster.

À cette fin, nous prévoyons d'utiliser le modèle de clé primaire de StarRocks pour remplacer le moteur de remplacement de ClickHouse. Pour le Kanban en temps réel en ligne, nous simulons une scène réelle, sélectionnons une requête complexe associée à quatre tables larges et effectuons deux moteurs différents. test a été effectué et les résultats sont les suivants :

Il ressort des résultats que dans le scénario sans concurrence, la vitesse de requête de StarRocks est d'environ 2 fois celle de ClickHouse, et dans le scénario multi-concurrence, la vitesse de requête de StarRocks est d'environ 3 à 3,5 fois celle de ClickHouse.

En plus d'améliorer les performances des requêtes, le modèle de clé primaire peut également prendre en charge la suppression des données et ne nécessite pas de développement de données supplémentaire pour maintenir les règles d'écriture des fragments et des partitions, ce qui réduit le coût du développement des données.

La plate-forme Jizhi intègre l'application de fonction de StarRocks

Afin d'améliorer les performances de Jizhi dans le chargement des requêtes, et en même temps de mieux habiliter les requêtes extrêmement rapides de StarRocks et les capacités liées à la simultanéité élevée pour les étudiants en commerce, Jizhi intègre profondément StarRocks du côté du produit, et les utilisateurs peuvent le compléter rapidement sur le Plate -forme de construction Kanban en temps réel à guichet unique .

Dans la plate-forme Jizhi, un modèle de données doit être créé avant de construire un tableau d'analyse Lorsque les étudiants en développement de données sont confrontés aux besoins d'analyse de parties commerciales plus complexes ou à une grande quantité de requêtes, ils peuvent choisir la méthode d'optimisation de StarRocks lors de la création des données Outre les champs d'index de base, les champs de distribution de données et les champs de partition temporelle, vous pouvez également sélectionner le moteur de modèle correspondant et renseigner la période de conservation des données.

 

Une fois le modèle en temps réel créé avec succès, les utilisateurs peuvent obtenir les  informations de connexion à la table StarRocks correspondantes et l' instruction Flink SQL Sink générée automatiquement  sur la page des détails du modèle .

Après cela, les utilisateurs peuvent créer une nouvelle tâche Flink en temps réel dans le module ETL de données de la plate-forme et écrire des données dans le modèle en temps réel correspondant.

Une fois les données écrites dans le modèle, l'utilisateur peut l'utiliser lors de la création d'un tableau Kanban et peut ajuster le format de données de certains champs du modèle, modifier des champs, ajouter des champs composés basés sur les champs d'origine et ajuster le style de graphique. L'approche commerciale et les exigences d'affichage de la partie commerciale dans différents scénarios.

Une fois le Kanban créé, vous pouvez effectuer l'opération de publication pour générer un lien fixe , qui peut être fourni aux étudiants en commerce pour utilisation.

Intégrer StarRocks pour l'amélioration de l'entreprise

En prenant le scénario de lancement de canaux en ligne de produits d'assurance comme exemple, avant et après le lancement des produits d'assurance, le personnel du marché lancera les produits sur plusieurs canaux pour la promotion et l'exposition, et calculera le coût de lancement de chaque canal en temps réel via le noyau rapport d'activité et son retour sur investissement correspondant, ajustez la stratégie de livraison en temps réel en fonction de la performance des données et contrôlez le prix unitaire d'acquisition de clients et le coût de livraison dans le processus de marketing de canal.

Par conséquent, la vitesse de retour des données déterminera également si le personnel de l'entreprise a le meilleur moment pour localiser les problèmes, ajuster les stratégies et autres événements.

Une fois que Jizhi aura utilisé le modèle StarRocks comme support de données sous-jacent pour les rapports en temps réel, à quoi ressembleront les performances des requêtes de données dans les scénarios d'entreprise ? Voici les résultats des tests dans des scénarios réels :

1) En termes de vitesse de chargement des données de rapport : dans le passé, l'entreprise devait charger plus de 10 secondes pour ouvrir le rapport . Souvent, parce que la vitesse d'ouverture était trop lente, l'entreprise ne pouvait parfois pas obtenir de retour d'information en temps opportun sur les nœuds clés, ce qui rendait il a été difficile de contrôler le coût de livraison et a sérieusement affecté la livraison ultérieure. 

Après avoir utilisé StarRocks, la vitesse de chargement ne prend  qu'environ secondes , et la super vitesse de réponse permet aux étudiants en commerce de saisir rapidement les nœuds changeants en temps réel de l'entreprise, et d'ajuster et d'optimiser la stratégie d'activité dans le temps.

2) En termes de prise en charge du volume de données de requête : Dans le passé, le modèle de mise à jour en temps réel utilisant ClickHouse ne pouvait prendre en charge que des dizaines de millions de volumes de données, et les mises à jour et requêtes en temps réel avec des volumes de données plus importants expiraient souvent, ce qui affectait sérieusement progrès de l'entreprise et passerait également à côté de certains moments critiques ;

Après avoir utilisé StarRocks, il peut prendre en charge près de 100 millions de volumes de données, ce qui peut s'adapter à davantage de scénarios commerciaux avec un volume de données important, et peut également mieux maintenir la stabilité de l'entreprise, ce qui augmente la confiance et l'adhésion des étudiants en commerce à la plate-forme. .

Résumé et planification

D'après les résultats de recherche et de test ci-dessus, les performances de requête à table unique de StarRocks sont comparables à celles de ClickHouse. Dans le scénario de requête multi-concurrence et multi-table associée, les performances sont nettement meilleures que celles de ClickHouse, en particulier pour le scénario de mise à jour à haute fréquence des entrepôts de données en temps réel. , Le modèle de clé primaire de StarRocks peut bien résoudre certains des problèmes rencontrés par le moteur de remplacement de ClickHouse. De plus, le DDL/DML et l'importation de données de StarRocks ont une garantie de transaction et sont compatibles avec le protocole MySQL.Par rapport à ClickHouse, le cluster est plus facile à exploiter et à entretenir, ce qui est plus convivial pour les étudiants en recherche et en exploitation.

Outre l'application dans des scénarios d'entrepôt en temps réel, ZhongAn prévoit également de promouvoir progressivement l'application de StarRocks dans d'autres scénarios, tels que les scénarios suivants :

  • Les données de la scène hors ligne sont également progressivement connectées à StarRocks, et le moteur OLAP unifié est utilisé pour compléter l'analyse des données de l' ensemble de la scène et du flux par lots ;

  • Explorez les capacités de StarRocks en tant qu'entrepôt léger et moteur de requête unifié ;

  • Explorez l'application de StarRocks dans d'autres scénarios commerciaux tels que l'analyse des données sur le comportement des utilisateurs et les portraits d'utilisateurs .

Plus de partage de scènes sera mis à jour en permanence. Vous pouvez suivre le compte public de "Zhongan Technology " pour vous abonner. Les étudiants intéressés par Jizhi peuvent également ajouter un chef de produit pour communiquer avec Qiwei.

Le 13 avril, ZhongAn organisera une émission en direct en ligne conjointe avec StarRocks. L'émission en direct expliquera en détail le processus et l'expérience d'atterrissage de StarRocks sur la plate-forme Jizhi.

Scannez le code QR de l'affiche ci-dessous pour verrouiller à l'avance le quota de diffusion en direct !

{{o.name}}
{{m.name}}

Je suppose que tu aimes

Origine my.oschina.net/u/5658056/blog/5511131
conseillé
Classement