2012美国大选的数据可以在下面百度云中下载
链接:https://pan.baidu.com/s/1BrVbI5zJodv3ANQAD0lV1g 密码:oqer
数据中单词解释:
- cand_nm – 接受捐赠的候选人姓名
- contbr_nm – 捐赠人姓名
- contbr_st – 捐赠人所在州
- contbr_employer – 捐赠人所在公司
- contbr_occupation – 捐赠人职业
- contb_receipt_amt – 捐赠数额(美元)
- contb_receipt_dt – 收到捐款的日期
首先导入需要的库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
1 ,数据载入(pd.read_csv())
因为单个数据过大,所以分三次三次上传,每次上传50w行。
# 数据读入使用pd.read_csv()
data1 = pd.read_csv('C:\\Users\\Administrator\\Desktop\\data\\data_01.csv')
data2 = pd.read_csv('C:\\Users\\Administrator\\Desktop\\data\\data_02.csv')
data3 = pd.read_csv('C:\\Users\\Administrator\\Desktop\\data\\data_03.csv')
2.数据合并(pd.concat())
将data1,data2,data3三组数据合并为一个大数据data。
# 数据合并,将之前的三分数据合在一起
data = pd.concat([data1, data2, data3])
3.数据预览
# 查看前5行数据
print(data.head())
# 查看数据的信息,包括每个字段的名称、非空数量、字段的数据类型
data.info()
# 用统计学指标快速描述数据的概要
data.describe()