【Pandas】pandas DataFrame select_dtypes
Pandas2.2 DataFrame
Attributes and underlying data
方法 | 描述 |
---|---|
DataFrame.index | 用于获取 DataFrame 的行索引 |
DataFrame.columns | 用于获取 DataFrame 的列标签 |
DataFrame.dtypes | 用于获取 DataFrame 中每一列的数据类型 |
DataFrame.info([verbose, buf, max_cols, …]) | 用于提供 DataFrame 的简要概述 |
DataFrame.select_dtypes([include, exclude]) | 用于根据数据类型选择 DataFrame 中的列 |
pandas.DataFrame.select_dtypes
pandas.DataFrame.select_dtypes
是一个非常有用的函数,用于根据数据类型选择 DataFrame 中的列。通过指定 include
和 exclude
参数,可以选择包含或排除特定数据类型的列。
参数说明
- include: 可以是单个字符串或字符串列表,表示要包含的数据类型。
- exclude: 可以是单个字符串或字符串列表,表示要排除的数据类型。
数据类型字符串
以下是一些常用的数据类型字符串:
'object'
: 字符串'number'
: 数值类型(整数和浮点数)'float'
: 浮点数'int'
: 整数'bool'
: 布尔值'datetime64'
: 日期时间'timedelta[ns]'
: 时间差'category'
: 类别数据
示例
假设有一个 DataFrame 如下:
import pandas as pddata = {'A': [1, 2, 3],'B': [1.1, 2.2, 3.3],'C': ['x', 'y', 'z'],'D': [True, False, True]
}df = pd.DataFrame(data)
示例1:选择所有数值类型的列
df.select_dtypes(include=['number'])
结果:
A B
0 1 1.1
1 2 2.2
2 3 3.3
示例2:选择所有整数类型的列
df.select_dtypes(include=['int'])
结果:
A
0 1
1 2
2 3
示例3:排除布尔类型的列
df.select_dtypes(exclude=['bool'])
结果:
A B C
0 1 1.1 x
1 2 2.2 y
2 3 3.3 z
示例4:选择所有字符串和浮点类型的列
df.select_dtypes(include=['object', 'float'])
结果:
B C
0 1.1 x
1 2.2 y
2 3.3 z
通过这些示例,你可以看到 select_dtypes
函数如何帮助你根据数据类型选择 DataFrame 中的列。