利用python对2012美国大选进行数据分析(一,数据载入和总览)

2012美国大选的数据可以在下面百度云中下载

链接:https://pan.baidu.com/s/1BrVbI5zJodv3ANQAD0lV1g 密码:oqer

数据中单词解释:

  • cand_nm – 接受捐赠的候选人姓名
  • contbr_nm – 捐赠人姓名
  • contbr_st – 捐赠人所在州
  • contbr_employer – 捐赠人所在公司
  • contbr_occupation – 捐赠人职业
  • contb_receipt_amt – 捐赠数额(美元)
  • contb_receipt_dt – 收到捐款的日期

首先导入需要的库

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

1 ,数据载入(pd.read_csv())

因为单个数据过大,所以分三次三次上传,每次上传50w行。

# 数据读入使用pd.read_csv()
data1 = pd.read_csv('C:\\Users\\Administrator\\Desktop\\data\\data_01.csv')
data2 = pd.read_csv('C:\\Users\\Administrator\\Desktop\\data\\data_02.csv')
data3 = pd.read_csv('C:\\Users\\Administrator\\Desktop\\data\\data_03.csv')

2.数据合并(pd.concat())

将data1,data2,data3三组数据合并为一个大数据data。

# 数据合并,将之前的三分数据合在一起
data = pd.concat([data1, data2, data3])

3.数据预览

# 查看前5行数据
print(data.head())

# 查看数据的信息,包括每个字段的名称、非空数量、字段的数据类型
data.info()

# 用统计学指标快速描述数据的概要
data.describe()

猜你喜欢

转载自blog.csdn.net/jackfjw/article/details/82858553