【spark】命令行查看parquet文件内容

1,进入spark shell

./spark-shell

2,执行以下操作读取parquet文件

val sqlContext = new org.apache.spark.sql.SQLContext(sc)

val parquetFile = sqlContext.parquetFile("/home/neunntest/hdfs/dataSet/2018-1-2/iris20180102_1514855343/*.parquet")

3,打印具体内容

parquetFile.take(150).foreach(println)


链接:https://www.jianshu.com/p/57b20d9d7b4a

猜你喜欢

转载自blog.csdn.net/bible_reader/article/details/82803544
今日推荐