hive导入csv出现中文乱码问题

在HIVE中序列化的时候需要指定一下字符编码,这是HIVE issue解决办法中找到的。https://issues.apache.org/jira/browse/HIVE-7142。
依照这个文档的说明,对指定的表进行设置,即设置序列化编码为GBK,以WINDOW拷贝导入的数据编码相匹配。

ALTER TABLE ** SET SERDEPROPERTIES ('serialization.encoding'='GBK'); 

问题解决!

猜你喜欢

转载自blog.csdn.net/album_gyd/article/details/80519749