pandas取出重复数据

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/apollo_miracle/article/details/100670837

drop_duplicates 为我们提供了数据去重的方法,那怎么得到哪些数据有重复呢?
实现步骤:
1. 采用 drop_duplicates 对数据去两次重,一次将重复数据全部去除(keep=False)记为 data1,另一次将重复数据保留一个(keep=‘first’)记为 data2;
2. 求 data1 和 data2 的差集即可:data2.append(data1).drop_duplicates(keep=False)。

猜你喜欢

转载自blog.csdn.net/apollo_miracle/article/details/100670837
今日推荐