Python教程

Python教程 Python特性 Python的历史 Python应用程序 Python安装 Python示例 Python变量 Python数据类型 Python的关键词 Python文字 Python运营商 Python的评论 Python If else Python循环 Python For循环 Python While循环 Python打破 Python继续 Python通过 Python字符串 Python列表 Python元组 Python列表Vs元组 Python集 Python字典 Python函数 Python内置函数 Python Lambda函数 Python文件I/O Python模块 Python的例外 Python的日期 Python正则表达式 Python发送邮件读取CSV文件写入CSV文件读取Excel文件写Excel文件 Python断言 Python列表推导 Python Collection模块 Python数学模块 Python OS模块 Python随机模块 Python统计模块 Python Sys模块 Python ide Python数组命令行参数 Python魔法方法 Python Stack & Queue PySpark MLlib Python装饰 Python发电机使用Python进行网页抓取 Python JSON 出现Python Itertools Python多处理如何用地理位置法计算两点之间的距离 Python中的Gmail API 如何在Python中使用folium包绘制谷歌地图 Python中的网格搜索 Python高阶函数 Python中的nsetools Python程序查找第n个斐波那契数 Python OpenCV对象检测 Python SimpleImputer模块 Python中的第二大数字

Python哦

Python oop概念 Python对象类 Python的构造函数 Python继承 Python中的抽象

Python MySQL

环境设置数据库连接创建新数据库创建表插入操作读操作更新操作连接操作执行事务

Python MongoDB

Python SQLite

Python的问题

Python Tkinter (GUI)

Python网页拦截器

介绍构建Python脚本 Linux下的脚本部署 Windows部署脚本

Python MCQ

Python MCQ Python MCQ第2部分

Python程序

下一个→ ←上一页

Python中的Box-Cox变换

在我们的环境中，数据是随机分布的，其中一些数据是指数据集曲线的峰值，而一些数据点是指曲线的尾部。对于任何数据集，我们都可以使用其方差和均值来计算分布，并且我们可以看到数据分布到均值的距离。

通常，我们可以将数据的分布分为两种方式:

正态分布
非正态分布或幂律分布

正态分布

在这种分布中，数据沿均值的分布是非常一致的。在这里，我们得到曲线的峰值贯穿于平均值，数据沿平均值对称分布。

我们可以很容易地实现对正态分布数据的分析技术。

幂律分布

在这种类型的分布中，对于一些小数据集，我们会看到曲线的峰值，然后对于大量数据集，我们会看到曲线的长尾。

但在环境中，数据的性质并不总是正态分布的。因此，在box-cox变换的帮助下，我们可以用一些数学公式将幂律分布的数据转化为正态分布的数据。

变换的数学分析是，我们将找到这样的值，即非正态分布的变换尽可能接近正态分布的数据集。

为了实现box-cox转换，我们将使用scipy库，函数将是scipy.stats.boxcox()函数。

语法:

InputArray

这是我们想要转换成正态分布的数据集。

如果lambda为none，我们将找出使value log函数最大的lambda值，如果它不是none，则对lambda的值执行转换。

这是一个可选参数，它接受0.0到1.0之间的浮点值。如果lambda为none，则考虑它，如果lambda不是none，则忽略它。

优化器

它是一个可选的可调用参数，在需要时调用。当lambda的值为none时，则使用此优化器查找使日志函数最小的lambda值。

例子:

在这个例子中，我们将采用非正态分布的数据集，然后将其转换为正态分布的数据集。

            #python代码将非正态数据转换为正态分布数据#导入所需模块从scipy导入numpy导入stats #导入绘图模块导入seaborn作为SNS导入matplotlib生成随机的非正态数据(指数)。指数(大小= 1200)#将数据转换为正常数据并获得lambda值fittedData, lambdavvalue = stats.boxcox(originalData) #创建坐标轴来绘制数据集图fig, ax = plt子图(1,2)#使用histplot()函数绘制非正态或原始数据。histplot(originalData, kde = True,stat="density"，linewidth=2,label =" Non-Normal distribution"， color ="red"， ax = ax[0]) #使用histplot()函数sns绘制正态或原始数据。histplot(fittedData, kde = True,stat="density"，linewidth=2,label ="正态分布"，color ="blue"， ax = ax[1]) #向子图plt添加图例legend(loc = "upper right") #重新缩放子图fig. set_fight (5) fig.set_figwidth(10) print(f"用于转换的Lambda值:{lambdaValue}") #显示图plt.show()
           

输出: