当前位置：首页 > news >正文

【Kaggle | Pandas】练习5：数据类型和缺失值

news 2025/7/10 13:07:15

文章目录

- 1. 获取列数据类型.dtype / .dypes
- 2. 转换数据类型.astype()
- 3. 获取数据为空的列 .isnull()
- 4. 将缺少值替换并且排序.fillna()，.sort_values()

1. 获取列数据类型.dtype / .dypes

数据集中points列的数据类型是什么？

# Your code here
dtype = reviews.points.dtype

2. 转换数据类型.astype()

从points列中的条目创建一个系列，但将条目转换为字符串。提示：字符串在本机 Python 中是str

point_strings = reviews.points.astype(str)

3. 获取数据为空的列 .isnull()

有时价格列为空。数据集中有多少评论缺少价格？

missing_price_reviews = reviews[reviews.price.isnull()]
n_missing_prices = len(missing_price_reviews)
# Cute alternative solution: if we sum a boolean series, True is treated as 1 and False as 0
n_missing_prices = reviews.price.isnull().sum()
# or equivalently:
n_missing_prices = pd.isnull(reviews.price).sum()

4. 将缺少值替换并且排序.fillna()，.sort_values()

最常见的葡萄酒产区有哪些？创建一个系列，计算每个值在region_1字段中出现的次数。该字段经常缺少数据，因此将缺少的值替换为Unknown 。按降序排列。你的输出应该是这样的：
在这里插入图片描述


reviews_per_region = reviews.region_1.fillna('Unknown').value_counts().sort_values(ascending = False)

查看全文

http://www.mrgr.cn/news/63623.html

Virtuoso使用layout绘制版图、使用Calibre验证DRC、LVS、PEX抽取RC

2024/11/1 数据结构大题打卡

Kafka日志记录

深入解析C/C++中的__attribute__((packed))：内存对齐与紧打包技术

opencv学习笔记(6)：图像预处理（直方图、图像去噪）

js的小知识

《AI从0到0.5》之提示工程

python代码实现了一个二维粒子系统的模拟，模拟粒子在离散空间中的随机运动和相互作用

Apple iap2协议栈在蓝牙中的移植及MFi认证的实现

分账系统对电商多重要，为何电商平台都选择分账系统？

【数据结构】数组和向量

5G三大应用场景中的URLLC

推荐一款功能强大的媒体播放管理：Zoom Player MAX

Python数字类型在“用户信息管理“项目中的应用

vue3项目中el-tooltip实现内容溢出时再显示，并设置tip的最大宽度

文章目录

1. 获取列数据类型.dtype / .dypes

2. 转换数据类型.astype()

3. 获取数据为空的列 .isnull()

4. 将缺少值替换并且排序.fillna()，.sort_values()

相关文章：