考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

以下哪项pandas方法可以用作对连续型变量作离散化处理?
A. pd.shape
B. pd.cut()
C. pd.resample()
D. ppop()
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是:B: `pd.cut()`

### 专业分析:

- **A: `pd.shape`**
- 作用:`pd.shape` 是一个属性,用于获取数据框(DataFrame)的行数和列数。它不用于数据处理,只是用于查看数据框的结构。
- 不相关:`pd.shape` 并不涉及数据的离散化处理。

- **B: `pd.cut()`**
- 作用:`pd.cut()` 用于将连续型数据分割成离散的区间,常用于数据的分箱操作。这是在数据预处理中对连续变量进行离散化的主要方法。
- 专业分析:`pd.cut()` 可以根据指定的区间或自动生成的区间将数据分配到相应的类别中,非常适合处理连续型变量的离散化。

- **C: `pd.resample()`**
- 作用:`pd.resample()` 主要用于时间序列数据的重采样,通过改变数据的频率。例如,将数据从每日采样转换为每月采样。
- 不相关:虽然涉及数据转换,但与连续型变量的离散化无关。

- **D: `ppop()`**
- 作用:`ppop()` 不是 pandas 的方法或函数,可能是一个拼写错误或误解。在 pandas 中,并不存在 `ppop()` 方法。
- 不相关:不涉及任何数据处理。

因此,对于处理连续型变量的离散化,`pd.cut()` 是准确而专业的方法选择。