数据标准化【0~1标准化和Z标准化】-向日葵屋

数据标准化【0~1标准化和Z标准化】

数据标准化

一、0~1标准化

1.自定义函数：

"""
1.0~1标准化：也称离差标准化，它是对原始数据进行线性变换，
使结果落到 [0,1] 区间.
X=(x - min)/(max - min)
"""
#0~1标准化
def min_max(df,cl,new_cl):
    df[new_cl] = (df[cl]-df[cl].min())/(df[cl].max()-df[cl].min())
min_max(df,'cl1','new_cl1')

示例：

import pandas as pd
df = pd.read_excel(r"C:\Users\wwb\Desktop\indata\data.xls")
def min_max(df,cl,new_cl):
    df[new_cl] = (df[cl]-df[cl].min())/(df[cl].max()-df[cl].min())
min_max(df,'家庭收入','家庭收入标准化')
df['家庭收入标准化'].describe()

2.使用sklearn接口

from sklearn import preprocessing
min_max_scaler = preprocessing.MinMaxScaler()
df['家庭收入标准化'] = min_max_scaler.fit_transform(df['家庭收入'].values.reshape(-1,1))

二、Z标准化

经过处理后，数据的均值为0，标准差为1。

1.自定义函数：

"""
2.Z标准化:数据均值为0，方差为1.
X=(x - mean)/std
"""
#Z标准化
def z_score(df,cl,new_cl):
    df[new_cl] = (df[cl]-df[cl].mean())/(df[cl].std())
z_score(df,'家庭收入','家庭收入标准化')

示例：

import pandas as pd
df = pd.read_excel(r"C:\Users\wwb\Desktop\indata\data.xls")
#Z标准化
def z_score(df,cl,new_cl):
    df[new_cl] = (df[cl]-df[cl].mean())/(df[cl].std())
z_score(df,'家庭收入','家庭收入标准化')

2.使用sklearn接口

from sklearn import preprocessing
df['家庭收入标准化'] = preprocessing.scale(df['家庭收入'].values.reshape(-1,1))

数据标准化【0~1标准化和Z标准化】

数据标准化

一、0~1标准化

二、Z标准化

发表评论取消回复

还没有评论，来说两句吧...

相关阅读

相关 GitHubHack：标签标准化

相关数据的标准化（离差标准化、log函数转换、atan函数转换、z标准化）

相关数据标准化【0~1标准化和Z标准化】

相关 matlab 音量标准化,matlab 音量标准化

相关数据标准化方法z-score讲解(matlab)

相关数据标准化和归一化

相关标准化率

相关数据预处理_数据标准化

相关【大数据】数据标准化

相关 python 数据标准化

随便看看

MYSQL安装

Linux——(CentOS) gcc 升级

亚马逊ubuntu新服务器部署

C/C++编程：模板的多态

HTTP协议的演变

【Spring源码这样读】-细扒ApplicationContext之super(parent)

教程文章

热评文章

1江湖小白之一起学Python （二）爬取数据的保存

2Java Shiro：简化身份验证和授权的安全框架

3Java中try()catch{}的使用方法

4Swagger注解-@ApiModel 和 @ApiModelProperty

5windows下强制杀死tomcat进程

6uni-app 条形码(一维码)/二维码生成实现

标签列表