【数据库】HIVE SQL之JSON字符串解析的坑

     对于hive对JSON字符串的解析小白在之前博文中已经有两篇做过详细的介绍了,这边博文主要记录一下,小白在工作中遇到的一个实例,巨坑。

    案例如下:

{"id":"23|38","index":"1","name":"高星好评","subfilters":,"type":"23"}

一眼看上去,是不是符合JSON字符串的风格,然后就开始解析

select filters,
       id,
       index,
       name,
       type
  from aa
 lateral view json_tuple(filters, 'id', 'index', 'name', 'type') b 
      as id,
         index,
         name,
         type

结果为:

百思不得其解,为什么明明有数据,解析不出来呢?

仔细看{"id":"23|38","index":"1","name":"高星好评","subfilters":,"type":"23"}中"subfilters":,这个地方和别的不一样,像是缺了一个引号,那么抱着试试看的想法,试一下:

select filters,
       id,
       index,
       name,
       type
  from aa
 lateral view json_tuple(regexp_replace(filters,'\\"subfilters\\"\\:\\,','\\"subfilters\\"\\:\\" \\"\\,'), 'id', 'index', 'name', 'type') b 
      as id,
         index,
         name,
         type

将空的部分用引号代替,看下结果:

可以了,同样,不用引号代替用别的符号也行,比如[]{}都可以

看下[]替换的情况:

select filters,
       id,
       index,
       name,
       type
  from aa
 lateral view json_tuple(regexp_replace(filters,'\\"subfilters\\"\\:\\,','\\"subfilters\\"\\:\\{\\}\\,'), 'id', 'index', 'name', 'type') b 
      as id,
         index,
         name,
         type

结果为:

     所以,遇到解析不出来的情况时,一定要研究记录内容的情况,一定是有不符合JSON规范的时候才会产生这种情形。

发布了91 篇原创文章 · 获赞 125 · 访问量 22万+

猜你喜欢

转载自blog.csdn.net/Jarry_cm/article/details/103623824