Apache Nifi技术内幕

2.3.3 数据接入类处理器单元
ConvertJSONToSQL

ConvertJSONToSQL处理器单元可以将结构化的Json转换成INSERT或者UPDATE这样命令的SQL,配合PutSQL处理器单元可以直接根据这鞋命令将数据插入数据库中。

上面的图中表示Processor根据输入的FlowFile的JSON内容,将JSON转化成Update的SQL语句。
ExecuteSQL

ExecuteSQL处理器单元直接运行运行用户配置的SQL查询语句,并将查询结果以Avro的格式写入到FlowFile的内容中去。

上面的图中表示Processor根据用户配置SQL select query语句,从数据库中查询出结果,并将结果FlowFile映射到success的relationship中。
PutSQL

PutSQL处理器单元可以根据传入的FlowFile内容中的DDM SQL对数据库进行更新操作。

上面的图中表示Processor根据输入的FlowFile的SQL内容,每100个SQL作为一个事务提交数据库,并将生成的Key返回且在事务提交失败的情况下对事务进行回滚。
SelectHiveQL

SelectHiveQL处理器单元执行Hive的查询语句HiveQL,并且将结果以Avro或者CSV的格式写入到FlowFile中。

上面的图中表示Processor根据HiveQL语句查询Hive,并将结果以CSV格式输出,CSV拥有Header为username和age。
PutHiveQL
PutHiveQL处理器根据传入的HiveQL DDM语句对Hive数据仓库的内容进行更新。上面的图中表示Processor根据输入的FlowFile中的HiveQL往Hive中写入或者更新数据。

猜你喜欢

转载自blog.csdn.net/wangmin1983/article/details/80037472