用户画像-ID_MAPPING 利用并查集——求无向图的所有连通子图来实现所有用户合并

一 项目背景

本项目是基于https://blog.csdn.net/weixin_41734687/article/details/99174064 此项目的改进。
去年利用jacaard相似度对多用户进行了合并。由于受到计算资源的制约,在对多用户进行合并时,只选取了有限量元素进行合并,导致一些用户没有合并为一个用户,在实际数据运用中,会出现部分数据one_id会发生变化,对用户画像分析造成了困扰。经过项目经验总结后,决定对id_mapping项目进行改进,主要改进思路为:利用图计算来对多用户进行id_mapping,最终利用求无向图的所有连通子图来实现id_mapping。

猜你喜欢

转载自blog.csdn.net/weixin_41734687/article/details/105085114
今日推荐