python大量excel文件处理的一点经验总结 - 代码天地

python大量excel文件处理的一点经验总结

其他 2019-06-23 12:11:08 阅读次数: 0

版权声明：本文为博主原创文章，转载请注明来源 https://blog.csdn.net/qq_26948675/article/details/89644120

首先，我的电脑是神舟笔记本超级战神，12线核（应该是6核切割成的12核），内存16G，CPU最大使用被限制在68%。

其次，数据时从oanda官网下载到的5s的31个货币对的bid和ask的K线报价，oanda限制每一次下载最多5000个K线（bar）。

最后，下载下来的结果得到80多万个csv文件，大小130多个G，每个文件是6小时时间长度的5s的bar数据

----

1、首先想的是使用os.listdir获取这个文件夹中的文件名称，做区分处理

os.listdir基本上跑不出来结果，文件夹文件太多。在网上找到了替代方法，使用os.scandir可以得到所有的文件名称

2、考虑把文件名分组，不同品种不同的小的文件夹，把大的文件夹拆分成62个小的文件夹

实际上，这个在下载的时候就应该考虑到，每下载一个，就直接放到子文件夹中

3、把每个文件夹中的文件，按照年份，形成每年每年的数据

如果是单线程跑的话，估计能跑好多天。使用多进程，加快效率（也不能开太多，磁盘读写有限制）

4、把每年每年的数据合并一个文件，这样就得到几百个每年每年的文件了。

5、把每年的bid,ask的价格合成为time，bid,ask的模式,以5s钟的收盘价作为bid和ask的价格

6、把每年的合并，成为一个总体的全部的数据。

------------------------

感悟：当最初的目标太大的时候，当问题似乎不可能解决的时候，学会拆分，把大的化小，把难的变容易，一点一点去完成。

猜你喜欢

转载自blog.csdn.net/qq_26948675/article/details/89644120

python大量excel文件处理的一点经验总结

formality的一点经验总结

gSoap一点小经验总结

资深报表开发经验总结：明白这一点，没有做不好的报表

一点经验

【经验总结】数据预处理经验总结1

python 预处理XML格式文档经验总结

Python 爬虫经验总结

Python selenium经验总结

python unnitest 经验总结

Python应用经验总结

关于IO处理的一点总结

springboot异常处理的一点总结

阿里总部HR主管十年经验总结8大面试技巧，每一点都是无价！

使用insert插入大量数据的个人经验总结

Python的一些编码经验总结

系统重构的10点经验总结

一点考研经验

mysql中null的处理经验总结

java处理excel的一点实践积累

一点Python总结（3）

一点Python总结（2）

一点Python基础总结

一点总结

Excel的一点小事

python元类使用经验总结

python kivy 开发经验总结

[Python]WingIDE的使用经验总结

一些经验总结

iOS开发经验总结（一）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)