考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

What type of analysis should be used for multiple data instances that actually refer to the same real-world entity? 对于实际引用同一个现实世界实体的多个数据实例,应该使用哪种类型的分析?
A. Profiling 剖析
B. Parsing 解析
C. Standardization 标准化
D. Similarity 相似性
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

对于实际引用同一个现实世界实体的多个数据实例,应该使用相似性分析(Similarity)。以下是各个选项的专业分析:

| 选项 | 分析 | 适用场景 |
|------|------|----------|
| A: Profiling 剖析 | 数据剖析用于了解数据的分布、缺失值、异常值等特点,通常用于数据初步探索。 | 数据质量评估 |
| B: Parsing 解析 | 数据解析是将原始数据转换为结构化格式,通常用于数据预处理阶段。 | 数据格式转换 |
| C: Standardization 标准化 | 标准化用于将数据转换为统一格式或单位,常用于数据一致化。 | 数据一致性 |
| **D: Similarity 相似性** | **相似性分析用于识别和比较不同数据实例的相似程度,以判断是否指代同一实体。** | **去重、实体识别** |

在处理多个数据实例以识别是否指向同一实体时,相似性分析是最有效的。这种分析可以通过计算字符串相似度、语义相似度或其他特征相似度来实现,从而帮助识别重复或相同的实体记录。