pandas处理mongodb数据 01

最近在做神经网络预测出行的项目,在过程中遇到了一些问题。

因为数据是用mongodb存储的,而在项目当中需要很多对数据的操作。比如条件查询,条件更改,如果单纯的依靠mongodb自带的方法的话。太慢了。。。。骂人,下面介绍一下我的方法

1 python连接mongodb

from pymongo import MongoClient #如果没有,pip instal mongoClient就ok了
conn = MongoClient(ip, 27017<端口>)
db_auth = conn.admin #进行身份验证,如果没有可以不写
db_auth.authenticate(username,pwd)
db = conn.admin #admin是指要连接的数据库,可以自定义
collection = db[collection_name]

2 pandas 将 mongodb 数据转化为Dataframe

import pandas as pd#导入pandas

data = pd.DataFrame(list(collection.find()))

3 pandas 合并两个Dataframe 实现sql中的多表联合查询

 data3 = pd.merge(data1,data2,how = "left",on="index")

    将data1和data2两个Dataframe合并。合并的方式是“left”,即以左侧表为标准,右侧表中根据on参数设置的列名对data1进行填充。data2中多余的数据会被舍弃,data1中的则会被保存。合并之后的表存放在data3当中



猜你喜欢

转载自blog.csdn.net/qinjiechina/article/details/80067268