考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

企业数据仓库里面的数据一般是由业务数据经过ETL技术处理后来的,以下关于ETL的说法错误的是
A. ETL过程中的主要环节是数据抽取、数据转换和加工、数据流转
B. 增量数据抽取过程中,提取增量数据的方法有通过时间戳、建立触发器、全表比对、日志比对等
C. 常用ETL工具包括datastage,Informatica等
D. 数据清洗需要对维度表中的重复数据进行处理
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

A: ETL是Extract-Transform-Load的缩写,数据抽取(Extract)、转换(Transform)、装载(Load)的过程。数据流转不属于ETL的主要环节。所以A错误;B:增量数据ETL中捕获数据变化的方法有:触发器方式、时间戳方式、全表删除插入方式、全表比对方式、日志表方式、系统日志分析方式等。C:datastage,Informatica属于常见的ETL工具,除此之外Spark等通用计算引擎也可用于ETL开发。D:数据清洗中需要删除无用的重复数据,维度表中的重复维度就是需要删除的

正确答案是:A: ETL过程中的主要环节是数据抽取、数据转换和加工、数据流转。

专业分析:

ETL(Extract, Transform, Load)是数据仓库中非常重要的过程,主要包括三个主要环节:数据抽取(Extract)、数据转换(Transform)和数据加载(Load)。具体分析如下:

1. **数据抽取(Extract)**:从各种源系统中抽取数据。这些源系统可以是关系数据库、文件系统、ERP系统等。

2. **数据转换(Transform)**:对抽取的数据进行清洗、转换、集成等处理,以符合目标数据仓库的要求。例如,数据格式的转换、数据清洗、数据汇总等。

3. **数据加载(Load)**:将转换后的数据加载到目标数据仓库中。

选项A中的“数据流转”并不是ETL过程中的主要环节,因此选项A的说法是错误的。

其他选项的分析:

- **B: 增量数据抽取过程中,提取增量数据的方法有通过时间戳、建立触发器、全表比对、日志比对等**:这个说法是正确的。增量数据抽取是ETL过程中的一个重要步骤,常用的方法包括时间戳、触发器、全表比对、日志比对等。

- **C: 常用ETL工具包括datastage,Informatica等**:这个说法是正确的。Datastage和Informatica都是业内非常常用的ETL工具。

- **D: 数据清洗需要对维度表中的重复数据进行处理**:这个说法是正确的。数据清洗是ETL过程中非常重要的一步,处理维度表中的重复数据是数据清洗的一部分。

综上所述,选项A是错误的。