阿里云ACA大数据助理工程师认证学习笔记和题

1 某大型企业计划使用MaxCompute本公司的数据行加工和分析计该项目会有上万个表、数干个本分信,同有近4人的团队负责该项目的建和运。从工程角度出 ()可以大大减少目管理和建的成本。

A,使用DataWorks

B,直接在MaxCompute上开发,使用脚本定时调度任务

C ,使用eclipse

  1. 自己研究开发一个平台,苟卫氓该项目

A

2  DataV在制作可化大屏,基本的交互式() 实现

 A 回调lD

 B.大屏触摸

 C,系统时间参数

D,暂时不支持交互

A

3某公司采用阿里云DataWorks实现了数据分析的功能,因为业务变化而调整了某数据表的表结构,业务人员需要了解哪些相关表格受到了影响。此时可以采用DataWorks的( )解决这个问题。

O A. 个性化的数据收藏功能

O B. 灵活的角色管理、数据授权管理功能

O C. 数据处理代码的版本管理功能

O D. 可视化的血缘分析功能

D

4  在DataWorks中,( )是指使用系统或计算资源的客户,即公司。

O A. DataWorks项目

O B. MaxCompute项目空间

C.组织

O D.个人账号

C

5  DataWorks配置中可以设置重跑和 重跑 ,当重跑属性以下哪种 跑'属性不会示出来?

A.运行成功或失败后皆可重跑

 B.运行成功后不可重跑

 C.运行失败后可以重跑

 D.运行成功或失败后皆不可重跑

D

6  DataWorks是阿里云重要的PaaS平台品,您提供数据集成、数据开、数据地、数据量和数据等全方位的品服,以下属于DataWorks使用景的是?

A,存储海量的数据,进行数据的清洗

B,使用DataWorks, 对数据进行传输、转换和集成等操作,从不同的数据存储引入数据,并进行转化和开发

C.对数据进行离线计算

D.直接把计算的结果显示出来

B

7  DataV数据可视化是使用可视化应用的方式来分析并展示庞杂数据的产品,以下哪个应用场景不是使用DataV可以实现的?

O A.开发天猫双11、阿里云城市大脑同款数据可视化应用

O B. 开发工业级的数据可视化项目

O C. 搭建专业级地理信息可视化应用

D. 搭建企业级数据分析平台

D

8  按照学方式不同行分类 以下个不属于机器学的分类?

 A.监督学习

 B.无监督学习

 C ,半监督学习

  1. 全监督学习

D

9  机器学PAI (Platform of Artificial Intelligence) 是阿里云人工智能平台,提供—站式的机器学解决方案。以下哪个不属于机器学平台PAI 的基础设施?

 A.CPU集群

 B.GPU集群

 C. 自建集群

D . FPGA集群

C

单18.DataV制作的大屏通过()可以把作品嵌入到企业已有的门户中去.

OA.发布后的url

O B.预览时的url

O C.发布后得到的MD5码

OD.发布后导出的JAR包

A

 10 阿里云Quick Bl工具支持多种数据源方便用基于自己来自不同数据源的数据行分析和展目前不支持()作数据

A.API调用返回结果

B. MaxCompute

C.本地Excel文件

D.MySQLRDS

A

单选17 组织管理是Quick BI提供的功能,为用户提供了数据协同开发的能力。以下关于组织管理的描述错误的?

O A.组织成员管理工作就是负责把需要在该组织中进行协同工作的阿里云用户加到组织中

O B.在组织层面,只有两种组织角色:组织管理员和普通用户

O C. 组织创建者默认就是组织管理员

O D. 普通用户可以访问组织成员管理功能模块

D

单选21 . DataWorks中提供了简单模式和标准模式两种工作空间模式。关于两种模式,以下描述哪个是错误的?

O A. 简单模式是指-个Dataworks工作空间对应一个MaxCompute项目

O B. 标准模式是指-个Dataworks工作空间对应两个MaxCompute项目

C. 简单模式可以升级为标准模式;标准模式也可降级为简单模式

O D. 标准模式下,开发环境默认不开启任务调度,避免开发环境的任务周期运行时,和生产环境的任务抢夺资源

C

2.DataWorks数据集成主要用于离线(批量)数据同步。下列关于离线法正确的是?

A.只能实现结构化数据源的传输(结构化(例如RDS、DRDS等)、半结构化、无结构化

 B.只支持关系型数据库MySQL,ROS

 C.数据集成不仅完成数据同步(传输),还提供数据流的消费方式

 D.离线数据同步主要由三部分组成: Reader , Channel, Writer

D

I 单选I 35.MaxCompute的连接使用方式有多种,其中可以配置依赖、调度的方式是( )。

O A. 使用DataWorks

B. 使用Intelij IDEA

C. 使用MaxCompute Console

O D.目前暂无工具支持

A

22.MaxCompute架构由四层组成,每一完成不同工作。行命令"select count(*) from table_a",由()命令返回果。

A.计算层

 B .客户端

C .接入层

 D .逻辑层

A

23 关于MaxCompute SQL中分区的说法,以下错误的是哪一项?

0 A.使用MaxCompute SQL添加分区时,- -次只能添加个分区

0 B. 使用MaxCompute SQL删除分区时,-次可以删除多个分区

0 C. 对于多级分区的表,如果需要添加新的分区,必须指明全部的分区值。

O D.添加分区时,如果未指定IF NOT EXISTS而同名的分区已存在,则返回报错。

A

24.大数据面临着一些技术性难题,其中一个是海量数据的存储,目前主流的处理方式是通过()来解决。

A. 共享存储系统

O B. 分布式存储系统

O C. 网络文件系统

O D.本地文件系统

b

单选25 .阿里云大数据体系由多个大数据组件组成,下列技术中,哪一个属于阿里云大数据体系?

O A. Yarn

O B. ZooKeeper

O C. Pig

O D. DataWorks

d

26大数据存储一般采用的是分布式存储技术,以下关于分布式存储说法正确的是?

O A. Hadoop的分布式存储技术是GFS

O B. 分布式存储要求底层有多台高性能存储服务器

o C. 分布式存储实现数据冗余,提高了数据的安全性

O D. 分布式存储方式无法存储传统的结构化数据

c

27 使用DataWorks开发,可以建不同的任。如果某任内需要多点配合并包含表示依关系的连线则该的类型是()。

O A 节点任务

 B  工作流任务

o c  多节点任务

 D  多工作流任务

B

28.MaxCompute中荀晒由皿表方法, 种船吏用AS  种是使用LIKE  create table new_table_name as/like ... 。关千两种方式的正确的是().

A 使用as能根据其后的SQL带入数据到新建的表中, 使用like只能建空表

 B .使用as能保留源表的分区属性, 但是无法保留lifecycle属性

C  使用like能保留源表的所有属性, 包括llfeccycle、注释、分区等

D  使用like可以依赖千多张洹表, 使用as只能依赖千一张表

A

29 .MaxCompute中的表t dml中仅包含一个字段id,类型为string.以下SQL中肯定会报错的是()。

O A. insert into table t dml values(2) ;

O B. insert overwrite tablet _dml select 3.14 from dual;

O C. create table t _dml bak like t dml;

O D. create table t _dml bak as select fromt dml;

A

​​​​​​​题都是原题:这只是其中的一部分,想要全部的题库,请在下方留言

1 多选| 42.在MaxCompute SQL中可以通过命令清空表中已有的数据,以下命令正确的包括() .

A. 对非分区表truncate table table name;

O B. 对分区表truncate table table name;

0 C. 对分区表alter table table. name drop partition;

D.对所有表drop table table name;

AC

多选40 .阿里云机器学习PAI支持多种常见的算法,以下算法中属于分类算法的有()。

O A. KNN

0 B. RandomForest

O C. K-Means

O D. DBSCAN

AB

猜你喜欢

转载自blog.csdn.net/zgycsmb/article/details/122822912