Python数据科学实践:Pandas操作案例
Pandas是Python中一个强大的数据处理库,它提供了丰富的数据结构和数据分析工具。下面我将通过几个实例来展示Pandas的操作。
- 导入Pandas并创建DataFrame
import pandas as pd
# 创建一个简单的 DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'London', 'Sydney']}
df = pd.DataFrame(data)
print(df)
- 数据清洗和处理
- 删除重复数据
df.drop_duplicates(inplace=True)
print(df)
- 缺失值处理(填充、删除等)
```python使用中位数填充缺失值
median_filled = df[‘Age’].fillna(df[‘Age’].median())
print(median_filled)
使用dropna方法删除包含缺失值的行
cleaned_data = df.dropna(subset=[‘Age’]])
print(cleaned_data)
3. 数据分组和汇总
- 按列分组
```python
grouped_by_city = df.groupby('City')
citywise_data = grouped_by_city['Age'].sum()
print(citywise_data)
- 对数值进行四舍五入
rounded_age = df['Age'].round(0) # 将年龄数据四舍五入到个位数
print(rounded_age)
以上就是Pandas操作的一些基本案例,实际使用中可能需要处理更复杂的数据和场景。
还没有评论,来说两句吧...