大数据计算Hive中json数组日志解析 - 代码天地

大数据计算Hive中json数组日志解析

其他 2019-02-03 11:00:51 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/liweijie231/article/details/81939730

数据格式

假设hive上存储的数据有一列类型是string,内容为如下

[
    {
        "code": "000001",
        "market": "1",
        "label": "1",
        "addtime": "2015"
    },
    {
        "code": "0000002",
        "market": "1",
        "label": "1",
        "addtime": "2016"
    }
    
     ...
  
  
]

行列转换

hive
这里写图片描述

相关说明

因为原数据是string（并不是真正的数组类型）类型的，所以无法直接使用explode函数
1. regexp_extract('xxx','^\[(.+)\]$',1) 这里是把需要解析的json数组去除左右中括号，需要注意的是这里的中括号需要两个转义字符\[。
2. regexp_replace('xxx','\}\,\{', '\}\|\|\{') 把json数组的逗号分隔符变成两根竖线||，可以自定义分隔符只要不在json数组项出现就可以。
3. 使用split函数返回的数组，分隔符为上面定义好的。
4. lateral view explode处理3中返回的数组。

presto

这里写图片描述

json解析

hive


select json_tuple(a.stock, 'code','market', 'label','addtime')  from  test1.tmp_stock  a  limit 1;
 
select   sid, b.code ,b.market,b.label,b.addtime    from   test1.stock2    a  lateral view  json_tuple(a.stock_codes, 'code','market', 'label','addtime')  b  as  code, market, label,addtime   ;

presto

select json_extract_scalar(a.stock, '$.code') from test1.tmp_stock a limit 1

猜你喜欢

转载自blog.csdn.net/liweijie231/article/details/81939730

大数据计算Hive中json数组日志解析

hive中解析json数组

(转)hive中解析json数组

hive中解析json数组[转载chenzechao]

hive 中解析json

学会Hive解析Json数组

如何在 Apache Hive 中解析 Json 数组

hive中UDF开发：解析json对象和解析json数组对象

hive加载json数据和解析json

Hive 超赞的解析 Json 数组的函数

impala&hive大数据平台数据血缘与数据地图(一)-解析impala与hive的血缘日志

hive的复杂json数组对象中包含的数组对象扁平化解析

pyspark读取hive表解析json日志并写入hive表的简单案例——原始数据初步清洗

Hive中处理json数据

hive json数组解析explode，json_tuple

大数据 hive 15--hive日志分析案例

大数据云计算——Hive组件

在Hive中解析XML数据

解析埋点日志中的JSON的文件

大数据||导出Hive表中的数据

【大数据】Hive 中的批量数据导入

hive：函数：get_json_object和json_tuple 操作json数据（hive加载json数据和解析json）

hive json字段解析

Hive解析JSON串

Hive 解析 json,json array

Android-Gson解析JSON数据（JSON对象/JSON数组）

Android-解析JSON数据（JSON对象/JSON数组）

Python中解析json数据

php中json_decode解析bigint大数据的问题以及科学计数法的显示转换

Javascript中的Array(数组) 、{}(映射) 与JSON解析

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)