DolphinDB使用案例1：将文本文件导入数据库 - 代码天地

DolphinDB使用案例1：将文本文件导入数据库

其他 2019-10-24 12:11:42 阅读次数: 0

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/The_Time_Runner/article/details/102612345

本文系对官方教程的复现，记录从新手的角度在实现目标道路上遇到的问题。

获取USstocks.csv

采用芝加哥大学的证券价格研究中心（CRSP）给出的1990-2016年上千只美股的每日交易记录，官网并不对外开放账号注册、DolphinDB也没有对外开放，网上我也没有找到。

就是说，找不到原汁原味的数据，改用数字货币历史数据替代。

我用的是火币btc_usdt_1t.csv
加载csv

并行加载btc_usdt_1t.csv

btc_usdt = ploadText("D:/DolphinDB/Data/btc_usdt_1t.csv")

非并行加载btc_usdt_1t.csv

btc_usdt = loadText("D:/DolphinDB/Data/btc_usdt_1t.csv")

比较两种加载方式时间
并行加载机制

并行加载文件需要的内存至少是表大小的两倍。

如果文件大小超过可用内存，可以把数据保存在分布式文件系统的分区表中。
数据类型
确定数据的类型

当加载外部文件时，系统会对每列随机抽样，然后推断每列的数据类型。

采用extractTextSchema函数检查文本文件中的数据类型。
```
schema = extractTextSchema("D:/DolphinDB/Data/btc_usdt_1t.csv")
```

更改数据类型

# 将col0列数据类型转换为DOUBLE
update schema set type=`DOUBLE where name=`col0
# 以上述结构加载文件到DolphinDB
btc_usdt= ploadText("D:/DolphinDB/Data/btc_usdt_1t.csv",,schema)
# 查看数据
schema = extractTextSchema("D:/DolphinDB/Data/btc_usdt_1t.csv")

双击右侧schema即可查看数据结构，可以发现col0数据类型已经变为DOUBLE

在这里插入图片描述

同样方式，可查看已经载入的数据：

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/The_Time_Runner/article/details/102612345

DolphinDB使用案例1：将文本文件导入数据库

JAVA编程实现郑码查询（1）——将码表放在文本文件.txt和.sqlite数据库中

文本文件中的数据导入到Oracle数据库表 .

使用kafka connect将文本文件数据导入到kafka

结构化文本文件零代码导入数据库的方法

kittle入门之文本文件导入数据库

JSON文本文件导入到Sqlite3数据库

navicat 将文本文件内容导入表中

python编程实现郑码查询——将码表放在文本文件或mysql数据库中

【大数据实战】将普通文本文件导入ElasticSearch

将文本文件导入到Excel数据表中

BI神器Power Query（7）-- PQ从文本文件导入数据(1/2)

bulk insert 文本文件数据导入

SQLServer --------- 将sql脚本文件导入数据库

python将数据写入txt文本文件

使用echo将文本文件置为空

kettle文本文件写入数据库，简单进行数据清洗

Kettle 数据库连接采用文本文件进行配置

Java读“文本文件”和读“SQLite数据库”对比

Excel导入文本文件

案例：复制文本文件

R的数据简单导入键盘导入、文本文件导入、excel导入

使用SQLyog导入MySql数据库脚本文件

Hive将txt、csv等文本文件导入hive表

Kettle(从MySQL数据库中的kettle库中的user表抽取到文本文件中)

万能数据库应用系列视频（一）使用SQL语句直接高效地访问文本文件

使用FileInputStream 读文本文件

python导入CSV文件、文本文件、Excel文件

Sql server bulk insert文本文件插入到数据库 Sql server bulk insert

shell脚本实现连接mysql数据库，并将结果输出到文本文件中

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)