Python数据科学库:使用Pandas、Numpy等进行数据分析的案例
在Python中,Pandas和Numpy是两个非常重要的数据科学库。下面我们将通过一些实际案例来解释它们的作用。
- Pandas:数据处理与分析
案例一:数据读取
import pandas as pd
data = {'Name': ['John', 'Anna'],
'Age': [25, 30]}
df = pd.DataFrame(data)
print(df)
案例二:数据清洗与处理
# 去掉重复项
df.drop_duplicates(inplace=True)
# 数据填充或替换
df['Age'].fillna(value=28, inplace=True)
# 选择特定列或行
filtered_df = df[df['Name'] == 'Anna']]
print(filtered_df)
- Numpy:数值计算与处理
案例一:数组和矩阵的创建
import numpy as np
# 创建一个1x3的一维数组
arr = np.array([1, 2, 3]])
# 创建一个2x3的二维数组
matrix = np.array([[4, 5, 6], [7, 8, 9]]])
print("Arr:", arr)
print("\nMatrix:", matrix)
通过以上实例,我们可以看到Pandas在数据清洗、处理和分析方面的强大功能,而Numpy则主要用于数值计算和处理。两者结合,构成了Python进行数据科学操作的主要库。
还没有评论,来说两句吧...