Azar公司基于Flink的匹配生成服务实践 - 代码天地

Azar公司基于Flink的匹配生成服务实践

其他 2021-02-08 19:42:47 阅读次数: 0

为什么我们选择Flink作为我们的匹配生成服务？

Azar的发展非常迅速，现在该平台每天在高峰时段处理的请求量超过1.8亿次（在移动屏幕实时视频中“向左滑动”）。为了确保Azar的匹配生成服务能够支持不断增长的用户活动和参与度，我们重新设计了匹配生成服务，使Apache Flink成为其架构的核心。Flink被选为首选数据处理框架，因为它提供了必要的可伸缩性，稳定性和处理大量数据的状态计算的能力。

可扩展性

在高峰时段，我们的系统每秒处理超过5,000个匹配生成请求，每秒处理超过1200万对匹配计算，从而为用户提供最佳结果。

稳定性

匹配生成服务是我们产品系列的核心功能，因此我们需要返回结果的响应时间以毫秒为单位且服务的停机时间应该为零，因为它直接影响我们的业务和用户在我们的应用程序中的体验。

有状态的计算

为了改进我们的配对算法，必须保存有关用户的某些状态。我们在以前的无状态计算中使用了简洁的变通方案，这直接影响了我们的计算延迟和事件流水线pipeline的整体复杂性。因此，我们决定从头开始重新设计配对生成服务。

Apache Flink具有独特的优势，可以执行低延迟的迭代，从而使我们的pipeline计算的总反馈周期不到一秒钟。此外，Flink的基于算子的松散耦合体系结构可以更方便的执行多套打分逻辑，进而获取到更多潜在候选对，从而支持我们提高原始配对系统的匹配质量。另外，Flink对状态管理的内在支持使我们能够通过实施实时推理pipeline来执行有状态计算，从而为用户带来更多价值。以上特性为我们的实时配对服务提供了更好的扩展性与稳定性。

为了更好地了解我们的系统架构，让我们解释一下Hyperconnect和Azar如何进行匹配生成。传统上意义上的配对是将两个或多个实体进行匹配，为了在Azar上进行实时匹配，我们在特定的时间窗口内收集来自个人的匹配请求，并尝试以低延迟返回最佳配对。我们将基于Flink的实时匹配系统分为如下六个步骤：

1.收集源（数据和输入源）

2.特征工程

3.匹配生成

4.配对评分

5.生成匹配

6.输出到多个下游

收集源（数据和输入源）

匹配过程的第一步是通过自定义Netty HTTP 收集来自不同客户端的匹配请求，从而使我们能够将系统的响应时间缩短到接近实时。

特征工程

匹配过程的第二步是特征工程，其中包括矢量化，分割和用户标记等。

数据会在匹配环节之前做预处理，如进行标记细分（即执行A / B测试）或对用户特征进行矢量化以用于机器学习模型。

在此步骤中，我们的Flink作业的状态后端将根据用户的偏好和特征来管理用户的历史匹配记录。

匹配生成

我们架构的第三步是匹配生成服务，该服务收集配对请求并生成匹配对，然后再将它们传递给下游进行匹配计算。

在此步骤中，使用Flink的Window API和带key的翻滚窗口来收集匹配请求。

配对评分

匹配过程的第四步是评分计算。在这里，我们并行执行多个评分逻辑以获取最佳结果，多个团队可以参与评分逻辑的迭代。

在此步骤中，我们全局管理匹配矩阵，并在每个计分器中使用它来实施多臂老虎机（Multi Armed Bandit）以提高匹配质量。计分算子负责计算所有配对的得分并及时返回。为此，我们并行化每个打分分组。

与每个评分微服务的通信均基于REST API，并利用Apache Flink的AsyncDataStream。

生成匹配

HyperMatch系统中的第五步是配对生成服务，该服务根据评分算子的结果选择最佳配对。

该服务通过容错的方式汇总不同评分微服务的结果，并通过我们自定义的trigger和evitor以及分布式排序算法来更快的生成最佳配对。

在这里，成功的配对将被传递到“配对结果”服务，而剩余的配对将使用Flink的迭代流功能重定向回配对生成器（第3步）。

输出到多个下游

匹配过程的最后一步为“匹配结果”服务，该服务具有多种功能，如给下游提供最佳匹配结果。

该服务还分发结果并提供反馈以改善未来匹配表现，或将结果发送给我们的日志记录和指标汇总。

上述基于Flink的HyperMatch架构已在我们的生产环境中使用Kubernetes作为基础资源管理框架进行了部署。

利用Kubernetes可以在我们的Flink部署中实现高可用性（HA），并可以轻松的进行性能测试。为了使此类关键任务实时数据应用程序实现零停机时间，我们已基于下图中的两种体系结构配置了部署管道。

往期精选▼

Flink在新浪微博的在线机器学习和实时数据分析

Flink模型服务和实时特征生成在Razorpay的实践

3种交叉验证与参数选择方式

趣头条爬虫(以财经频道为例)

Spark Shuffle调优之调节map端内存缓冲与reduce端内存占比

Spark Shuffle调优之合并map端输出文件

Flink调优法则

5个Hadoop优化技巧

4个角度轻松理解 Flink中的Watermark

Flink中Checkpoint和Savepoint 的 3 个不同点

Flink实现固定时长或消息条数的触发器

Flink方案设计中的4大误区

使用 Broadcast State 的 4 个注意事项

3种Flink State Backend | 你该用哪个？

一文搞定 Flink 异步 I/O

Flink State 使用的4点建议

Flink在开发中的7点建议

回复 flink 获取Flink Forward 2020 PPT。

猜你喜欢

转载自blog.csdn.net/yscoder/article/details/111600637

Azar公司基于Flink的匹配生成服务实践

ID生成服务

Flink 数据集成服务在小红书的降本增效实践

分析Netflix公司产品Spinnaker的微服务实践

字节跳动基于 Flink 批流一体架构的全域数据集成服务

个推基于Docker和Kubernetes的微服务实践

使用XMLBeans生成服务端

分布式ID生成服务

bat 启动 wcf 生成服务

无法生成服务引用（添加WebService）

Flink模型服务和实时特征生成在Razorpay的实践

中小型互联网公司微服务实践-经验和教训

中小型互联网公司微服务实践

干货 | 国内互联网公司是如何做微服务实践的？（附PPT下载）

Maven 服务实践相关

微服务实践先知

.net 微服务实践

nginx相关服务实践

微服务实战（三）集成服务注册发现中心 SpringCloud Nacos

微服务实践三: 服务编排

微服务实践：服务治理

微服务实践：服务运维

微服务实践：什么是微服务

QCon技术干货：个推基于Docker和Kubernetes的微服务实践

B 站基于大仓库的 CI/CD 及微服务实践

【本人秃顶程序员】中小型互联网公司微服务实践-经验和教训

公司业务转型，IT基础架构也要转型，京东云Docker容器集群微服务实践

openssl 生成服务端证书所遇到的问题

C#实现短链接生成服务

SEQSVR：Go + MySQL 实现的高性能 ID 生成服务

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)