【代码模版】数据基本信息、数据去重完整步骤

# 查看数据的基本情况
print(DataFrame.shape)
print("=" * 60)
print(DataFrame.info())
print("=" * 60)
print(DataFrame.describe())
print("=" * 60)
print(DataFrame.columns)

# 查看重复情况
DataFrame.duplicated().sum()
# 数据去重,并查看去重后的shape
DataFrame = DataFrame.drop_duplicates()
DataFrame.shape
# 数据去重后原索引缺失,需重构索引【注意】
DataFrame.index = range(data.shape[0])
DataFrame.index  # 查看重构后索引是否完善
发布了22 篇原创文章 · 获赞 0 · 访问量 918

猜你喜欢

转载自blog.csdn.net/weixin_44680262/article/details/104659492