当前位置: 首页 > news >正文

【Kaggle | Pandas】练习5:数据类型和缺失值

文章目录

    • 1. 获取列数据类型.dtype / .dypes
    • 2. 转换数据类型.astype()
    • 3. 获取数据为空的列 .isnull()
    • 4. 将缺少值替换并且排序.fillna(),.sort_values()

1. 获取列数据类型.dtype / .dypes

数据集中points列的数据类型是什么?

# Your code here
dtype = reviews.points.dtype

2. 转换数据类型.astype()

从points列中的条目创建一个系列,但将条目转换为字符串。提示:字符串在本机 Python 中是str

point_strings = reviews.points.astype(str)

3. 获取数据为空的列 .isnull()

有时价格列为空。数据集中有多少评论缺少价格?

missing_price_reviews = reviews[reviews.price.isnull()]
n_missing_prices = len(missing_price_reviews)
# Cute alternative solution: if we sum a boolean series, True is treated as 1 and False as 0
n_missing_prices = reviews.price.isnull().sum()
# or equivalently:
n_missing_prices = pd.isnull(reviews.price).sum()

4. 将缺少值替换并且排序.fillna(),.sort_values()

最常见的葡萄酒产区有哪些?创建一个系列,计算每个值在region_1字段中出现的次数。该字段经常缺少数据,因此将缺少的值替换为Unknown 。按降序排列。你的输出应该是这样的:
在这里插入图片描述


reviews_per_region = reviews.region_1.fillna('Unknown').value_counts().sort_values(ascending = False)

http://www.mrgr.cn/news/63623.html

相关文章:

  • 鸿蒙HarmonyOS应用开发者(基础+高级)认证
  • 便携剃须刀性能王者,小但专业,未野MAX SE剃须刀测评
  • day 5
  • 使用语言模型进行文本摘要的五个级别(llm)
  • 浅谈串口服务器的作用
  • 在基于AWS EC2的云端k8s环境中 搭建开发基础设施
  • Virtuoso使用layout绘制版图、使用Calibre验证DRC、LVS、PEX抽取RC
  • 2024/11/1 数据结构大题打卡
  • Kafka日志记录
  • 深入解析C/C++中的__attribute__((packed)):内存对齐与紧打包技术
  • opencv学习笔记(6):图像预处理(直方图、图像去噪)
  • js的小知识
  • 《AI从0到0.5》之提示工程
  • python代码实现了一个二维粒子系统的模拟,模拟粒子在离散空间中的随机运动和相互作用
  • Apple iap2协议栈在蓝牙中的移植及MFi认证的实现
  • 分账系统对电商多重要,为何电商平台都选择分账系统?
  • 【数据结构】数组和向量
  • 5G三大应用场景中的URLLC
  • 推荐一款功能强大的媒体播放管理:Zoom Player MAX
  • Python数字类型在“用户信息管理“项目中的应用
  • vue3项目中el-tooltip实现内容溢出时再显示,并设置tip的最大宽度
  • 每个软件开发人员都应该知道的 9 个定律
  • 【Linux内核大揭秘】程序地址空间
  • Cpp二叉搜索树的讲解与实现(21)
  • Node.js:Express 服务 路由
  • 干货速学,带你一文读懂嵌入式领域!