Python数据科学库:使用Pandas、Numpy等进行数据分析的案例

原创 心已赠人 2025-02-13 03:33 33阅读 0赞

在Python中,Pandas和Numpy是两个非常重要的数据科学库。下面我们将通过一些实际案例来解释它们的作用。

  1. Pandas:数据处理与分析
  • 案例一:数据读取

    1. import pandas as pd
    2. data = {'Name': ['John', 'Anna'],
    3. 'Age': [25, 30]}
    4. df = pd.DataFrame(data)
    5. print(df)
  • 案例二:数据清洗与处理

    1. # 去掉重复项
    2. df.drop_duplicates(inplace=True)
    3. # 数据填充或替换
    4. df['Age'].fillna(value=28, inplace=True)
    5. # 选择特定列或行
    6. filtered_df = df[df['Name'] == 'Anna']]
    7. print(filtered_df)
  1. Numpy:数值计算与处理
  • 案例一:数组和矩阵的创建

    1. import numpy as np
    2. # 创建一个1x3的一维数组
    3. arr = np.array([1, 2, 3]])
    4. # 创建一个2x3的二维数组
    5. matrix = np.array([[4, 5, 6], [7, 8, 9]]])
    6. print("Arr:", arr)
    7. print("\nMatrix:", matrix)

通过以上实例,我们可以看到Pandas在数据清洗、处理和分析方面的强大功能,而Numpy则主要用于数值计算和处理。两者结合,构成了Python进行数据科学操作的主要库。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,33人围观)

还没有评论,来说两句吧...

相关阅读