当前位置: 首页 > news >正文

Pandas中df常用方法介绍

目录

  • 常用方法
    • df.columns
    • df.index
    • df.values
    • df.T
    • df.sort_index()
    • df.sort_values()
  • 案例

常用方法

df.columns

df.columns 是 Pandas 中 DataFrame 对象的一个属性,用于获取 DataFrame 中的列标签(列名)。

基本语法如下:

df.columns

该属性返回一个包含 DataFrame 中所有列标签的 Index 对象,您可以将其视为一个包含列标签的列表。

示例:

import pandas as pd# 创建一个 DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)# 获取 DataFrame 的列标签
columns = df.columns
print(columns)
Index(['A', 'B'], dtype='object')

df.index

df.index 是 Pandas 中 DataFrame 对象的一个属性,用于获取 DataFrame 的行标签(行索引)。

基本语法如下:

df.index

该属性返回一个表示 DataFrame 的行索引的 Index 对象,类似于一个包含行标签的列表。

示例:

import pandas as pd# 创建一个 DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)# 获取 DataFrame 的行索引
index = df.index
print(index)RangeIndex(start=0, stop=3, step=1)

df.values

df.values 是 Pandas 中 DataFrame 对象的一个属性,用于获取 DataFrame 中的数据部分,即 DataFrame 的值。

基本语法如下:

df.values

该属性返回一个包含 DataFrame 中所有数据的 NumPy 数组。每行代表 DataFrame 中的一行数据,每列代表 DataFrame 中的一列数据。

示例:

import pandas as pd# 创建一个 DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)# 获取 DataFrame 的值
df_values = df.values
print(df_values)[[1 4][2 5][3 6]]

df.T

df.T 是 Pandas 中 DataFrame 对象的一个属性,用于对 DataFrame 进行转置操作,即将行和列进行互换。

基本语法如下:

df.T

该属性返回一个新的 DataFrame,新的 DataFrame 中的行标签(行索引)变为原 DataFrame 的列标签(列名),列标签(列名)变为原 DataFrame 的行标签(行索引)。

示例:

import pandas as pd# 创建一个 DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)# 对 DataFrame 进行转置操作
df_transposed = df.T
print(df_transposed)0  1  2
A  1  2  3
B  4  5  6

df.sort_index()

df.sort_index() 是 Pandas 中 DataFrame 对象的一个方法,用于根据行索引或列索引对 DataFrame 进行排序。

基本语法如下:

df.sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True, ignore_index=False)

其中,常用的参数包括:

  1. axis:用于指定按行索引(axis=0)还是列索引(axis=1)进行排序。
  2. ascending:用于指定排序的顺序,True表示升序,False 表示降序。
  3. inplace:用于指定是否在原地修改 DataFrame,True 表示在原地修改,False表示返回一个新的排序后的 DataFrame。

示例:

import pandas as pd# 创建一个 DataFrame
data = {'A': [1, 3, 2], 'B': [4, 6, 5]}
df = pd.DataFrame(data, index=['c', 'a', 'b'])# 根据行索引排序
sorted_df = df.sort_index()
print(sorted_df)A  B
a  3  6
b  2  5
c  1  4

df.sort_values()

df.sort_values() 是 Pandas 中 DataFrame 对象的一个方法,用于根据列中的值对 DataFrame 进行排序。

基本语法如下:

df.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last', ignore_index=False)

其中,常用的参数包括:

  1. by:指定按照哪一列或多列的值进行排序。
  2. axis:用于指定按行(axis=0)还是按列(axis=1)进行排序。
  3. ascending:用于指定排序的顺序,True 表示升序,False 表示降序。
  4. inplace:用于指定是否在原地修改DataFrame,True 表示在原地修改,False 表示返回一个新的排序后的 DataFrame。

示例:

import pandas as pd# 创建一个 DataFrame
data = {'A': [3, 1, 2], 'B': [6, 4, 5]}
df = pd.DataFrame(data)# 根据列'A'的值进行排序
sorted_df = df.sort_values(by='A')
print(sorted_df)A  B
1  1  4
2  2  5
0  3  6

案例

import pandas as pd
import numpy as npdf2 =pd.DataFrame({'A':1,
'B':pd.Timestamp('20160102'),
'C':pd.Series(1,index=list(range(4)),dtype='float32'),
'D':np.array([3]*4,dtype='int32'),
'E':pd.Categorical(['test','train','test','train']),
'F':'foo'
})print(df2)
#print(df2.columns)
#print(df2.values)
#print(df2.index)
#print(df2.T)
print(df2.sort_index(axis=1,ascending =False))print(df2.sort_index(axis=0,ascending =False))print(df2.sort_values(by='E'))A          B    C  D      E    F
0  1 2016-01-02  1.0  3   test  foo
1  1 2016-01-02  1.0  3  train  foo
2  1 2016-01-02  1.0  3   test  foo
3  1 2016-01-02  1.0  3  train  fooF      E  D    C          B  A
0  foo   test  3  1.0 2016-01-02  1
1  foo  train  3  1.0 2016-01-02  1
2  foo   test  3  1.0 2016-01-02  1
3  foo  train  3  1.0 2016-01-02  1A          B    C  D      E    F
3  1 2016-01-02  1.0  3  train  foo
2  1 2016-01-02  1.0  3   test  foo
1  1 2016-01-02  1.0  3  train  foo
0  1 2016-01-02  1.0  3   test  fooA          B    C  D      E    F
0  1 2016-01-02  1.0  3   test  foo
2  1 2016-01-02  1.0  3   test  foo
1  1 2016-01-02  1.0  3  train  foo
3  1 2016-01-02  1.0  3  train  foo

http://www.mrgr.cn/news/31149.html

相关文章:

  • vue计算属性 初步使用案例
  • 2024版本IDEA创建Sprintboot项目下载依赖缓慢
  • UniApp 应用、页面与组件的生命周期详解
  • LeetCode【0017】电话号码的字母组合
  • npm i忽略依赖冲突
  • 使用ookii-dialogs-wpf在WPF选择文件夹时能输入路径
  • C++日期类详解 第二级支线任务
  • FB FC里调用全局变量注意事项
  • 用 JS 实现一个发布订阅模式
  • Unity的Text组件中实现输入内容的渐变色效果
  • FedOV
  • solana项目counter,测试过程中执行报错记录分享
  • 【leetcode】堆习题
  • 铲屎官进!宠物空气净化器真的有用吗?哪款去浮毛效果好
  • SQLAlchemy思维导图
  • [产品管理-28]:NPDP新产品开发 - 26 - 产品生命周期管理 - 产品上市的八大步骤
  • 软考高级第四版备考---第四十八天(项目基本要素-项目内外部运行环境、组织系统、项目管理和产品管理)
  • java踩坑
  • Highcharts甘特图基本用法(highcharts-gantt.js)
  • 什么是机房IP?有什么缺点
  • 骨传导耳机哪个牌子比较好?2024耳机排行榜首发!一文读懂谁更值得入手!
  • 虚拟机(VMware)安装,保姆级教程(附所有安装包及所有安装步骤)
  • 稳了,搭建Docker国内源图文教程
  • 微服务架构---Ribbon\Feign
  • 牛客BC68,X型图案
  • 【JS】path的使用说明