Pandas数据处理:缺失值处理示例
在Python的pandas库中,处理缺失值是数据分析中的常见步骤。以下是一些处理缺失值的基本示例:
- 检查缺失值:
```python
import pandas as pd
创建一个包含缺失值的数据框
df = pd.DataFrame({‘A’: [1, 2], ‘B’: [3, np.nan]}, index=[‘row1’, ‘row2’]))
print(df)
输出结果:
A B
row1 1 3
row2 2 NaN
可以看到,列`B`出现了缺失值(NaN)。
2. **删除含有缺失值的行或列**:
```python
# 删除含有缺失值的行
df = df.dropna(subset=['B']])
print(df)
输出结果:
A B
row1 1 3
row2 2 NaN
现在B
列已经没有了含有缺失值的行。
print(df)
输出结果(假设`B`列有缺失值):
A B
row1 1 3.0
row2 2 NaN``
此时,列
B`已经使用中位数填充了缺失值。
以上就是在pandas中处理缺失值的基本示例。根据实际数据和需求,你可能需要采用不同的方法来填补或删除缺失值。
还没有评论,来说两句吧...