机器学习从入门到精通50讲（九）-基于 ANTLR 自己实现一个 SQL 解析器 - 代码天地

机器学习从入门到精通50讲（九）-基于 ANTLR 自己实现一个 SQL 解析器

其他 2021-11-18 15:42:24 阅读次数: 0

一、背景

自2014年大数据首次写入政府工作报告，大数据已经发展7年。大数据的类型也从交易数据延伸到交互数据与传感数据。数据规模也到达了PB级别。

大数据的规模大到对数据的获取、存储、管理、分析超出了传统数据库软件工具能力范围。在这个背景下，各种大数据相关工具相继出现，用于应对各种业务场景需求。从Hadoop生态的Hive, Spark, Presto, Kylin, Druid到非Hadoop生态的ClickHouse, Elasticsearch，不一而足...

这些大数据处理工具特性不同，应用场景不同，但是对外提供的接口或者说操作语言都是相似的，即各个组件都是支持SQL语言。只是基于不同的应用场景和特性，实现了各自的SQL方言。这就要求相关开源项目自行实现SQL解析。在这个背景下，诞生于1989年的语法解析器生成器ANTLR迎来了黄金时代。

二、简介

ANTLR是开源的语法解析器生成器，距今已有30多年的历史。是一个经历了时间考验的开源项目。一个程序从源代码到机器可执行，基本需要3个阶段：编写、编译、执行。

在编译阶段，需要进行词法和语法的分析。ANTLR聚焦的问题就是把源码进行词法和句法分析，产生一个树状的分析器。ANTLR几乎支持对所有主流编程语言的解析。从antlr/grammars-v4可以看到，ANTLR支持Java,C, Python, SQL等数十种编程语言。通常我们没有扩展编程语言的需求，所以大部分情况下这些语言编译支持更多是供学习研究使用，或者用在各种开发工具(NetBeans、Intellij)中用于校验语法正确性、和格式化代码。

对于SQL语言，ANTLR的应用广度和深度会更大，这是由于Hive, Presto, SparkSQL等由于需

猜你喜欢

转载自blog.csdn.net/m0_50230964/article/details/120280061

机器学习从入门到精通50讲（九）-基于 ANTLR 自己实现一个 SQL 解析器

ANTLR实现的SQL解析器 - OQL

使用golang+antlr4构建一个自己的语言解析器（一）

如何实现一个SQL解析器

通过SQL操作Excel(基于Python + Antlr实现)

用 Go 构建一个 SQL 解析器

Antlr4 SQL Query 解析实例

sql 解析器

SQL解析器

Antlr4入门(三)-制作一个科学计算器

Antlr4入门(二)-制作一个简单的计算器

Antlr实战之JSON解析器slowjson

Antlr4 语法解析器(下)

go语言实现SQL解析器

ANTLR 学习

antlr4做一个计算器

基于antlr-3.5.2+Python实现一般HiveSQL血缘解析(一)

基于antlr-3.5.2+Python实现一般HiveSQL血缘解析(二)

自己实现一个SQL解析引擎

atitit java解析sql语言解析器解释器的实现

Spark SQL源码解析（二）Antlr4解析Sql并生成树

SQL 语句解析：Hive 通过 ANTLR 生成语法树，解析 SQL 语句。

Shell脚本（一）概述、解析器、脚本入门

antlr 语言解析工具

cmd-parser | 一个基于哈希匹配的超快命令解析器

做sql的一个解析器，已经生成ast了，接下来要怎么做呢？到ast这一步之后不知道接下来怎么做

一个JSON解析器

有时间了解一下Spark SQL parser的解析器架构

自己动手实现一个简单的JSON解析器

SQL解析器的性能测试

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)