目录
一、项目背景与目标
二、需求分析
三、主要思路与考点
详情
一、项目背景与目标
- 项目背景
-
在移动APP满天飞的当下,如何做好APP的营销和推广至关重要,而该环节的关键在于能对APP做大众喜欢的关键字描述,从而提高APP的搜索命中率和下载率。
-
找到热度标签,蹭热度标签,往往可以提高相应APP的下载量和使用量。
-
项目目标
- 用时不超过一周,主要是通过查看之前教学资料和视频,百度搜索等方式搞定,加强实战应用开发能力和自学能力。
- 最终达到对于常用的小模块开发,可以在1-5天内迅速解决战斗,并形成自身的类库积累。
-
二、需求分析
- 给定一批app名称及其描述信息,共52.9万条数据,天亮教育公开课资料链接:
链接:https://pan.baidu.com/s/1Iu0FrjYIP1QtoL63_w48Ug 密码:899x 进入后的具体位置如下图所示:
- 其内容结构为,共包含6个字段,分别为(appId,app名称, 一级分类,二级分类,三级分类,Tags描述信息),但并不一定完全规整,视 实际情况可能左对齐包括四个或五个或六个字段。
- 通过大数据开发之hive数据仓库命令行形式,完成数据加载、udf/udaf/udtf函数、统计分析的任务,并演示项目效果即可。
三、主要思路与考点
- 主要思路
- 通过hive命令将数据加到数据仓库中
- 使用hql+udf/udaf/udtf完成统计分析
- 将统计分析结果插入到hive中自建的新表中
- 主要考点
- 数据仓库的目录结构和开发规范
- hive及HiveSQl常用命令
- 系统函数+udf/udaf/udtf灵活使用
- hive常见问题的解决
天亮教育是一家从事大数据云计算、人工智能、教育培训、产品开发、咨询服务、人才优选为一体的综合型互联网科技公司。
公司由一批BAT等一线互联网IT精英人士创建,
以"快乐工作,认真生活,打造高端职业技能教育的一面旗帜"为愿景,胸怀"让天下没有难找的工作"使命,
坚持"客户第一、诚信、激情、拥抱变化"的价值观,
全心全意为学员赋能提效,践行技术改变命运的初心。
更多学习讨论, 请加入
官方-天亮大数据交流-366784928
群二维码:
天亮教育公开课-从小白到大佬修成记-全系列视频地址:http://bbs.myhope365.com/forum.php?mod=viewthread&tid=1422&extra=page%3D1
欢迎关注天亮教育公众号,大数据技术资料与课程、招生就业动态、教育资讯动态、创业历程分享一站式分享,官方微信公众号二维码:
天亮教育官方群318971238,
爬虫、nlp技术qq群320349384
hadoop & spark & hive技术群297585251
教育培训官网:http://myhope365.com
项目研发业务尚云科技官网:http://shangyuninfo.com/
官方天亮论坛:http://bbs.myhope365.com/