pandas离散化处理方法常用技巧-CDA考试官方模拟题库

备考刷题，请到

CDA认证小程序

以下哪项pandas方法可以用作对连续型变量作离散化处理？

A. pd.shape

B. pd.cut()

C. pd.resample()

D. ppop()

上一题

下一题

题目解析

题目评论(0)

正确答案是：B: `pd.cut()`

### 专业分析：

- **A: `pd.shape`**
- 作用：`pd.shape` 是一个属性，用于获取数据框（DataFrame）的行数和列数。它不用于数据处理，只是用于查看数据框的结构。
- 不相关：`pd.shape` 并不涉及数据的离散化处理。

- **B: `pd.cut()`**
- 作用：`pd.cut()` 用于将连续型数据分割成离散的区间，常用于数据的分箱操作。这是在数据预处理中对连续变量进行离散化的主要方法。
- 专业分析：`pd.cut()` 可以根据指定的区间或自动生成的区间将数据分配到相应的类别中，非常适合处理连续型变量的离散化。

- **C: `pd.resample()`**
- 作用：`pd.resample()` 主要用于时间序列数据的重采样，通过改变数据的频率。例如，将数据从每日采样转换为每月采样。
- 不相关：虽然涉及数据转换，但与连续型变量的离散化无关。

- **D: `ppop()`**
- 作用：`ppop()` 不是 pandas 的方法或函数，可能是一个拼写错误或误解。在 pandas 中，并不存在 `ppop()` 方法。
- 不相关：不涉及任何数据处理。

因此，对于处理连续型变量的离散化，`pd.cut()` 是准确而专业的方法选择。