当前位置: 首页 > news >正文

【升华】python pandas库学习总结

pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool,
built on top of the Python programming language.

Pandas 是 Python 数据分析的核心技术库,可以进行数据的读取、清洗、过滤、统计、分析、汇总、透视、特征工程、数据可视化等各种处理和分析,是数据分析和机器学习等学科的重要基础技术。

Pandas的数据结构

Pandas主要有两种数据结构:‌‌Series‌和‌‌DataFrame‌。

  • Series‌:一维数组,具有标签。可以看作是一个一维数组,但每个元素都有一个标签。
  • DataFrame‌:二维的表格型数据结构,类似于Excel表格,可以存储不同数据类型的数据,并且支持缺失值。

Pandas的基本操作

  1. 位置索引访问‌:通过位置索引访问Series中的元素,例如s访问第一个元素。
  2. 标签索引访问‌:通过标签索引访问DataFrame中的行,例如df['column_name']访问某列。
  3. 查看数据信息‌:使用head()tail()方法快速预览数据的前几行和后几行。
  4. 数据清洗‌:包括删除重复行、填充缺失值等操作。

Pandas的高级功能

  1. 聚合函数‌:Pandas支持多种聚合函数,如sum()mean()max()min()等,用于计算统计指标。
  2. 数据透视表‌:使用pivot_table()方法创建数据透视表,用于数据的汇总和转换。
  3. 缺失值处理‌:Pandas提供了丰富的函数处理缺失值,如dropna()删除含有缺失值的行,fillna()填充缺失值。

  1. 什么是 Pandas
  2. Pandas 怎样读取数据
  3. Pandas 的数据结构 DataFrame 和 Series
  4. Pandas 查询数据的5种方法
  5. Pandas 怎样新增数据列
  6. Pandas 的数据统计函数
  7. Pandas 对缺失值的处理
  8. Pandas 的 SettingWithCopyWarning 报警
  9. Pandas 怎样对数据进行排序
  10. Pandas 字符串处理
  11. Pandas 的 axis 参数怎么理解
  12. Pandas 的索引 index 有什么用途
  13. Pandas 怎样实现数据的 Merge
  14. Panda 实现数据 Concat 合并
  15. Pandas 批量拆分与合并 Excel 文件
  16. Pandas 怎样实现分组数据统计
  17. 怎样使用 Pandas 的分层索引 Multilndex
  18. 怎样使用 Pandas 的 map-apply-applymap 数据转换函数
  19. Pandas 怎样实现 groupby 每个分组的 apply
  20. Pandas 使用 stack 和 pivot 实现数据透视

python中使用

import numpy as np
import pandas as pd
from collections import namedtupleItem = namedtuple('Item', 'reply pv')
items = []with codecs.open('reply.pv.07', 'r', 'utf-8') as f: for line in f:line_split = line.strip().split('\t')items.append(Item(line_split[0].strip(), line_split[1].strip()))df = pd.DataFrame.from_records(items, columns=['reply', 'pv'])df = pd.DataFrame(pd.read_csv('name.csv',header=1))
df = pd.DataFrame(pd.read_excel('name.xlsx'))


http://www.mrgr.cn/news/55250.html

相关文章:

  • C语言 | Leetcode C语言题解之第480题滑动窗口中位数
  • Python数据处理工具笔记 - matplotlib, Numpy, Pandas
  • 计算机网络——第三章 数据链路层
  • 暴雨亮相第四届岩土力学与工程青年科学家论坛
  • WPF实现类似网易云音乐的菜单切换
  • 高等数学 7.5可降阶的高阶微分方程
  • onlyoffice docker启用jwt并生成jwt
  • 【OD】【E卷】【真题】【100分】数字排列(PythonJavaJavaScriptC++)
  • 关于 SpringBootTest 你必须知道的 - 登录认证在 Spring Boot 上的标准单元测试写法,看一眼就会怀孕。
  • c语言基础程序——经典100道实例。
  • On-Device Training Under 256KB Memory 端侧极端算力设备资源下的模型训练工作研究
  • 使用mvn命令导出依赖包
  • @Component 和 @Bean 的区别与联系
  • C++ 异步执行任务async()(补充)
  • 基于Java+SpringBoot+Vue的IT技术交流和分享平台
  • Linux中部署Mysql保姆级教程
  • Django中的ModelForm组件
  • 自动求导实现
  • C++ 新特性 | C++ 11 | tuple 模版
  • 跟风考的PMP帮我拿到了offer
  • Unity3D功耗和发热分析与优化详解
  • Android中使用bottomnavigation实现底部导航栏
  • CST软件如何验证“平面波+探针”的频域结果
  • 怎么用六西格玛增强解决问题的逻辑性?
  • ATTCK 框架讲解
  • 建议使用requestAnimationFrame替代定时器setInterval、setTimeout完成页面动画