考试报名
考试报名
考试内容
考试大纲
在线客服
返回顶部

备考刷题,请到

CDA认证小程序

可以实现多个连续变量的单变量描述的python语法( )
A. data.iloc[[4,5,6],:].describe()
B. data.iloc[:,[4,5,6]].describe()
C. data.iloc[:,4].value_counts(normalize=True)
D. data.value_counts()
上一题
下一题
收藏
点赞
评论
题目解析
题目评论(0)

正确答案是 B: `data.iloc[:,[4,5,6]].describe()`

分析:

- A: `data.iloc[[4,5,6],:].describe()` 选择的是第 4, 5, 6 行的数据,而不是列。`.describe()` 用于生成描述性统计信息,通常在列上使用,因此这个选项不适合用于多个连续变量的描述。

- B: `data.iloc[:,[4,5,6]].describe()` 选择的是第 4, 5, 6 列的数据,并对这些列进行描述性统计分析。`.describe()` 会生成这些列的统计信息,如均值、标准差、最小值、四分位数等。这是对多个连续变量进行描述性统计的正确方法。

- C: `data.iloc[:,4].value_counts(normalize=True)` 用于计算第 4 列中每个值出现的频率,并将其标准化为比例。这通常用于分类变量,而不是连续变量的描述。

- D: `data.value_counts()` 用于统计整个 DataFrame 中每行出现的频率,通常用于一维数据的频率统计,而不是用于连续变量的描述性统计。

因此,选项 B 是正确的选择,因为它能够对多个连续变量列进行描述性统计分析。