Excel文件读写
- 使用read_excel读取,读取后的结果为dataframe格式
- 读取excel文件和csv文件参数大致一样,但要考虑工作表sheet页
- 参数较多,可以自行控制,但很多时候使用默认参数
- 读取excel时,注意编码,常用编码为utf-8、gbk、gbk2312和gb18030等
- 使用to_excel快速保存为xlsx格式
import pandas as pd
import os
os.getcwd()
'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据清洗之文件读写'
os.chdir('D:\\Jupyter\\notebook\\Python数据清洗实战\\数据')
df1 = pd.read_excel('meal_order_detail.xlsx', encoding='utf-8', sheet_name='meal_order_detail1')
df1.head(5)
|
detail_id |
order_id |
dishes_id |
logicprn_name |
parent_class_name |
dishes_name |
itemis_add |
counts |
amounts |
cost |
place_order_time |
discount_amt |
discount_reason |
kick_back |
add_inprice |
add_info |
bar_code |
picture_file |
emp_id |
0 |
2956 |
417 |
610062 |
NaN |
NaN |
蒜蓉生蚝 |
0 |
1 |
49 |
NaN |
2016-08-01 11:05:36 |
NaN |
NaN |
NaN |
0 |
NaN |
NaN |
caipu/104001.jpg |
1442 |
1 |
2958 |
417 |
609957 |
NaN |
NaN |
蒙古烤羊腿\r\n\r\n\r\n |
0 |
1 |
48 |
NaN |
2016-08-01 11:07:07 |
NaN |
NaN |
NaN |
0 |
NaN |
NaN |
caipu/202003.jpg |
1442 |
2 |
2961 |
417 |
609950 |
NaN |
NaN |
大蒜苋菜 |
0 |
1 |
30 |
NaN |
2016-08-01 11:07:40 |
NaN |
NaN |
NaN |
0 |
NaN |
NaN |
caipu/303001.jpg |
1442 |
3 |
2966 |
417 |
610038 |
NaN |
NaN |
芝麻烤紫菜 |
0 |
1 |
25 |
NaN |
2016-08-01 11:11:11 |
NaN |
NaN |
NaN |
0 |
NaN |
NaN |
caipu/105002.jpg |
1442 |
4 |
2968 |
417 |
610003 |
NaN |
NaN |
蒜香包 |
0 |
1 |
13 |
NaN |
2016-08-01 11:11:30 |
NaN |
NaN |
NaN |
0 |
NaN |
NaN |
caipu/503002.jpg |
1442 |
df1 = pd.read_excel('meal_order_detail.xlsx', encoding='utf-8', sheet_name=0)
df1.head(5)
|
detail_id |
order_id |
dishes_id |
logicprn_name |
parent_class_name |
dishes_name |
itemis_add |
counts |
amounts |
cost |
place_order_time |
discount_amt |
discount_reason |
kick_back |
add_inprice |
add_info |
bar_code |
picture_file |
emp_id |
0 |
2956 |
417 |
610062 |
NaN |
NaN |
蒜蓉生蚝 |
0 |
1 |
49 |
NaN |
2016-08-01 11:05:36 |
NaN |
NaN |
NaN |
0 |
NaN |
NaN |
caipu/104001.jpg |
1442 |
1 |
2958 |
417 |
609957 |
NaN |
NaN |
蒙古烤羊腿\r\n\r\n\r\n |
0 |
1 |
48 |
NaN |
2016-08-01 11:07:07 |
NaN |
NaN |
NaN |
0 |
NaN |
NaN |
caipu/202003.jpg |
1442 |
2 |
2961 |
417 |
609950 |
NaN |
NaN |
大蒜苋菜 |
0 |
1 |
30 |
NaN |
2016-08-01 11:07:40 |
NaN |
NaN |
NaN |
0 |
NaN |
NaN |
caipu/303001.jpg |
1442 |
3 |
2966 |
417 |
610038 |
NaN |
NaN |
芝麻烤紫菜 |
0 |
1 |
25 |
NaN |
2016-08-01 11:11:11 |
NaN |
NaN |
NaN |
0 |
NaN |
NaN |
caipu/105002.jpg |
1442 |
4 |
2968 |
417 |
610003 |
NaN |
NaN |
蒜香包 |
0 |
1 |
13 |
NaN |
2016-08-01 11:11:30 |
NaN |
NaN |
NaN |
0 |
NaN |
NaN |
caipu/503002.jpg |
1442 |
os.getcwd()
'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据'
df1.to_excel('asdf.xlsx', index=False, sheet_name='one')