当前位置:科学 > 正文

机器学习理论入门-统计学习之逻辑斯蒂回归与最大熵

2023-02-14 22:46:11  来源:通过技术看生活


在讲逻辑斯蒂回归之前先复习下感知机的一些知识:


(资料图片)

感知机的公式:f(x) = sign(w·x + b) 输出+1或-1

那么问题来了,1.只输出-1和+1是不是太生硬了?这样的判别方式真的有效吗?

2.超平面左侧0.001距离的点和超平面右侧0.001距离的点真的有天壤之别吗?

同时感知机的缺陷不容忽视:感知机通过梯度下降更新参数,但在sign函数中,x=0是间断点,不可微

怎么解决极小距离带来的+1和-1的天壤之别?2.怎么让最终的预测式子连续可微呢?

逻辑斯蒂回归可以解决以上问题


逻辑斯蒂回归


逻辑斯蒂回归的定义

P(Y = 1|x) = 取值范围:(0~1)

P(Y = 0|x) = 取值范围:(0~1)

用图表表示为

若将P(Y=1|x)记作A,P(Y=0|x)记作B,则 A/A+B + B/A+B = 1

逻辑斯蒂回归是连续可微的

参数估计

逻辑斯蒂回归模型学习时,对于给定的训练数据集 T = {(,),(,)...,(,)} , 其中,,{0,1},可以应用极大似然估计法估计模型参数,从而得到逻辑斯蒂回归模型。

设: P(Y = 1 | x) = (x),P(Y = 0|x) = 1 - (x)

似然函数为


对数似然函数为

上图的对数似然函数看似简单的三个步骤,其用到了很多知识,下面进行详细步骤说明,如些图





再次说明下,机器学习有关对数的小知识点:和熵有关的默认,简写成log;和商没有关系的默认,简写成log或ln

似然函数对w的求导


总结

1.逻辑斯蒂以输出概率的形式解决了极小距离带来的+1和-1的天壤之别。同时概率也可以作为模型输出的置信程度

2.逻辑斯蒂使得最终的模型函数连续可微。训练目标与预测目标达成了一致

3.逻辑斯蒂采用了极大似然估计来估计参数


最大熵

什么是最大熵?

在我们猜测概率时,不确定的部分我们认为是等可能的,就好像骰子一样,我们知道有6个面,因此认为每个面的概率是1/6,也就是等可能

换句话说,趋向于均匀分布,最大熵使用的就是这么一个朴素的道理:

凡是我们知道的,就把它考虑进去,凡是不知道的,通通均匀分布

终极目标是求概率 P(Y | X)

熵:H(P) = -

将终极目标代入熵:H(P) = -

做些改变,调整熵:

H(P) = H(y | x) = -

注:1.H(P) = H(y | x)为条件熵

2.~代表从训练集中统计出来的

下面看下训练集中的统计概率:

(X=x) =

特征函数及特征函数f(x,y)关于经验分布(x,y)的期望值

特征函数f(x,y)关于模型P(Y|X)与经验分布(x)的期望值:





最大熵模型

拉格朗日乘子法:


总结

1.最大熵强调不提任何建设,以熵最大为目标

2.将终极目标代入熵的公式后,将其最大化

3.在训练集中寻找现有的约束,计算期望,将其作为约束。使用拉格朗日乘子法得到P(y|x),之后使用优化算法得到P(y|x)中的参数w


参考视频链接:https://www.bilibili.com/video/BV1i4411G7Xv?p=6&vd_source=7621d9b6568d814ad80158fea1c47dcc

#头条创作挑战赛#

关键词: 机器学习 约瑟夫·拉格朗日

推荐阅读

盐亭发现超大储量油气田 四川盐亭发现超大储量油气田是真的吗?

随着城市化进程的不断推进,成正在成为天然气,的宝贵资源,这也是中国早些年启动西气东输项目的原因之一。中国有许多能源型城市,如以煤炭 【详细】

红旗无人驾驶汽车有消息吗?红旗无人驾驶汽车是否已经生产?

红旗无人驾驶汽车有消息吗?之前和百度所牵手的,如何了?在百度举行的2018年世界大会上,百度宣布将与一汽集团合作生产Apollo红旗, L4级无 【详细】

小天鹅波轮洗衣机有什么?小天鹅波轮洗衣机推荐

最近有比较多的朋友都比较关注洗衣机的一些相关问题。不过洗衣机作为家用必不可缺的一个物件,如此受人关注也是理所当然的。所以今天我们就 【详细】

坎儿井的原理吐鲁番是具备了哪些条件?

新疆吐鲁番之坎儿井的原理介绍,新疆吐鲁番的坎儿井全长约5000公里,几乎赶上黄河和长江的长度,是世界上最大的地下水利灌溉系统,被称为地 【详细】

手机钢化膜品牌排行榜 手机钢化膜品牌的十大排行榜汇总

随着手机时代的崛起,跟着手机一起的附属产品也变得越来越重要,因为手机屏幕容易碎屏、内屏被压导致触屏不灵等多种情况,所以大家开始给手 【详细】

相关新闻

关于我们  |  联系方式  |  免责条款  |  招聘信息  |  广告服务  |  帮助中心

联系我们:85 572 98@qq.com备案号:粤ICP备18023326号-40

科技资讯网 版权所有