通过python 运行hadoop - 代码天地

通过python 运行hadoop

其他 2020-03-16 10:31:49 阅读次数: 0

时间函数

from datetime import date, timedelta

def last_n_days(current_date=date.today(), n=0):
    if n in (0,1):
        return str(current_date - timedelta(days=n))
    return [str(current_date - timedelta(x)) for x in range(n, 0, -1)]

生成shell命令

# -*- coding: utf-8 -*-
import subprocess

file_list = last_n_days(n=7)
mapper = "mapper.py"
reducer = "reducer.py"
input_files = " ".join(['-input /dm/qq/userinfo_qq/{date}-*/qq_guid.txt'.format(date=each_date) for each_date in file_list])
output = '/dm/qq/merge'

mr_cmd = """hadoop jar /opt/cloudera/parcels/CDH-4.2.0-1.cdh4.2.0.p0.10/lib/hadoop-0.20-mapreduce/contrib/streaming/hadoop-streaming-2.0.0-mr1-cdh4.2.0.jar \
-output {output} \
-mapper  'python {mapper}' \
-reducer 'python {reducer}' \
-file {mapper}  \
-file {reducer}  \
{input_files}""".format(output=output, mapper=mapper,
                        reducer=reducer, input_files=input_files)


if __name__ = "__main__":
    print mr_cmd
    subprocess.call(mr_cmd)

温柔一cai刀

发布了27 篇原创文章 · 获赞 4 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/caiguoxiong0101/article/details/48252161

通过python 运行hadoop

通过hadoop自带的demo运行单词统计

在Hadoop上运行python程序错误集合

在centos搭建的hadoop平台上运行Python

hadoop运行python脚本出错：subprocess failed with code 127

通过python运行asreml-R程序

Python通过CMD命令指定运行环境

大数据实验hadoop--通过编程实现词频统计并导出jar在终端运行

Hadoop streaming运行python程序如何设置map和reduce的个数（python）

Python Hadoop使用时注意的坑-- MRJob框架及python环境运行

Python-mqtt:通过运行深入理解

如何通过python+appium运行一个脚本

在网页上通过PHP运行Python代码

在python中通过调用dll来提高运行速度

Python通过wmi修改dns，通过windows的运行wbemtest.exe测试wql查询语句

大数据实验hadoop--通过编程实现数据去重排序并导出jar在终端运行

通过java操作hadoop

hadoop单点运行方式

hadoop (mapreduce运行原理)

eclipse 运行hadoop wordcount

Oozie运行Hadoop

hadoop运行WordCount实例

hadoop运行jar文件

Hadoop打包jar运行

eclipse运行hadoop程序

在hadoop运行java程序

hadoop中运行wordcount

hadoop 运行任务超时

hadoop运行环境

hadoop WordCount 运行

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

timesten性能问题分析

hdu1017A Mathematical Curiosity

利用FragmentTabHost和ViewPager来实现可滑动切换的页面

哪里找卖百度云资源

大数据技能图谱

PHP设计模式（5）—— 观察者模式

python list删除元素是要注意的坑点

TPM简介

并查集擒贼先擒王//解密犯罪团伙

码农也要修身

每日归档

更多

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)