数据分析师考试：统计学抽样方法-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

在数据的抽样上，若我们想利用已知的数据结构来抽样的话，通常会采用何种抽样法？

A. 随机抽样(Random Sampling)

B. 分层抽样(Stratified Sampling)

C. 聚类抽样(Cluster Sampling)

D. 系统抽样(Systematic Sampling)

上一题

下一题

题目解析

题目评论(0)

在已知数据结构的情况下，通常会选择**分层抽样 (Stratified Sampling)**。这是因为分层抽样能够利用数据中的结构信息来提高样本的代表性和估计的精确度。以下是对选项的分析：

- **随机抽样 (Random Sampling)**：
- 适用于数据结构未知或不考虑结构信息的情况下，每个个体有相同的被抽取概率。
- 优点是简单易行，但如果数据结构复杂，可能导致某些群体在样本中的代表性不足。

- **分层抽样 (Stratified Sampling)**：
- 当数据可以根据某种已知结构或特征分成不同层级时使用。
- 在每个层中随机抽样，确保样本在各个层次上的代表性，有助于提高估计的精度。
- 特别适用于数据明显分组且组内同质性较高的情形。

- **聚类抽样 (Cluster Sampling)**：
- 适合处理样本群分群较多的情况，先随机抽取一些群组，然后调查这些群组内的所有成员或随机抽样。
- 通常用于地理上集中的群体，降低调查成本。
- 缺点是如果群内差异较大，可能影响样本代表性。

- **系统抽样 (Systematic Sampling)**：
- 适用于数据按照某种顺序排列的情况下，从一个随机起点开始，每隔一定间隔抽取样本。
- 简化抽样过程，适合于大规模或流式数据。

因此，在已知数据结构的情况下，**分层抽样 (Stratified Sampling)** 是最合理的选择，因为它能够充分利用数据的群组信息，增加样本的代表性和估计精度。