机器学习理论入门-统计学习之逻辑斯蒂回归与最大熵
在讲逻辑斯蒂回归之前先复习下感知机的一些知识:
(资料图片)
感知机的公式:f(x) = sign(w·x + b) 输出+1或-1
那么问题来了,1.只输出-1和+1是不是太生硬了?这样的判别方式真的有效吗?
2.超平面左侧0.001距离的点和超平面右侧0.001距离的点真的有天壤之别吗?
同时感知机的缺陷不容忽视:感知机通过梯度下降更新参数,但在sign函数中,x=0是间断点,不可微
怎么解决极小距离带来的+1和-1的天壤之别?2.怎么让最终的预测式子连续可微呢?
逻辑斯蒂回归可以解决以上问题
逻辑斯蒂回归
逻辑斯蒂回归的定义
P(Y = 1|x) = 取值范围:(0~1)
P(Y = 0|x) = 取值范围:(0~1)
用图表表示为
若将P(Y=1|x)记作A,P(Y=0|x)记作B,则 A/A+B + B/A+B = 1
逻辑斯蒂回归是连续可微的
参数估计
逻辑斯蒂回归模型学习时,对于给定的训练数据集 T = {(,),(,)...,(,)} , 其中,,{0,1},可以应用极大似然估计法估计模型参数,从而得到逻辑斯蒂回归模型。
设: P(Y = 1 | x) = (x),P(Y = 0|x) = 1 - (x)
似然函数为
对数似然函数为
上图的对数似然函数看似简单的三个步骤,其用到了很多知识,下面进行详细步骤说明,如些图
再次说明下,机器学习有关对数的小知识点:和熵有关的默认,简写成log;和商没有关系的默认,简写成log或ln
似然函数对w的求导
总结
1.逻辑斯蒂以输出概率的形式解决了极小距离带来的+1和-1的天壤之别。同时概率也可以作为模型输出的置信程度
2.逻辑斯蒂使得最终的模型函数连续可微。训练目标与预测目标达成了一致
3.逻辑斯蒂采用了极大似然估计来估计参数
最大熵
什么是最大熵?
在我们猜测概率时,不确定的部分我们认为是等可能的,就好像骰子一样,我们知道有6个面,因此认为每个面的概率是1/6,也就是等可能
换句话说,趋向于均匀分布,最大熵使用的就是这么一个朴素的道理:
凡是我们知道的,就把它考虑进去,凡是不知道的,通通均匀分布
终极目标是求概率 P(Y | X)
熵:H(P) = -
将终极目标代入熵:H(P) = -
做些改变,调整熵:
H(P) = H(y | x) = -
注:1.H(P) = H(y | x)为条件熵
2.~代表从训练集中统计出来的
下面看下训练集中的统计概率:
(X=x) =
特征函数及特征函数f(x,y)关于经验分布(x,y)的期望值
特征函数f(x,y)关于模型P(Y|X)与经验分布(x)的期望值:
最大熵模型
拉格朗日乘子法:
总结
1.最大熵强调不提任何建设,以熵最大为目标
2.将终极目标代入熵的公式后,将其最大化
3.在训练集中寻找现有的约束,计算期望,将其作为约束。使用拉格朗日乘子法得到P(y|x),之后使用优化算法得到P(y|x)中的参数w
参考视频链接:https://www.bilibili.com/video/BV1i4411G7Xv?p=6&vd_source=7621d9b6568d814ad80158fea1c47dcc
#头条创作挑战赛#
推荐阅读
盐亭发现超大储量油气田 四川盐亭发现超大储量油气田是真的吗?
随着城市化进程的不断推进,成正在成为天然气,的宝贵资源,这也是中国早些年启动西气东输项目的原因之一。中国有许多能源型城市,如以煤炭 【详细】
红旗无人驾驶汽车有消息吗?红旗无人驾驶汽车是否已经生产?
红旗无人驾驶汽车有消息吗?之前和百度所牵手的,如何了?在百度举行的2018年世界大会上,百度宣布将与一汽集团合作生产Apollo红旗, L4级无 【详细】
小天鹅波轮洗衣机有什么?小天鹅波轮洗衣机推荐
最近有比较多的朋友都比较关注洗衣机的一些相关问题。不过洗衣机作为家用必不可缺的一个物件,如此受人关注也是理所当然的。所以今天我们就 【详细】
坎儿井的原理吐鲁番是具备了哪些条件?
新疆吐鲁番之坎儿井的原理介绍,新疆吐鲁番的坎儿井全长约5000公里,几乎赶上黄河和长江的长度,是世界上最大的地下水利灌溉系统,被称为地 【详细】
手机钢化膜品牌排行榜 手机钢化膜品牌的十大排行榜汇总
随着手机时代的崛起,跟着手机一起的附属产品也变得越来越重要,因为手机屏幕容易碎屏、内屏被压导致触屏不灵等多种情况,所以大家开始给手 【详细】
相关新闻
- 机器学习理论入门-统计学习之逻辑斯蒂回归与最大熵
- 最后一台小屏旗舰!iPhone 13 mini就是备用机的天花板 短讯
- 全球热点!倍搏集团(08331)公布年度业绩 净利451.4万元 同比减少50.49%
- ChatGPT为肇庆写了一篇推荐语!它的回答亮了
- 打工往事:2015年富士康摸奖郭台铭帮我摸了1000元_热点评
- 非刚需别买,新能源汽车价格即将重回三年前
- 用人工智能为熊癫子画像 当前报道
- 世界快资讯:和火爆全网的ChatGPT聊柬埔寨,看看它怎么说?
- 网易云音乐有网页版吗?(网易云音乐网页版怎么登陆)
- 年入246亿,浙大学霸干出全球第二大手机代工厂,冲刺A股上市
- 【天天新视野】一加Ace2开售旗开得胜,首批评价出炉,这些产品卖点最受好评
- 2023年购机推荐,同样都是高性价比机型,K60与一加Ace2谁更香?|当前简讯
- 天天最资讯丨优惠三百,一加Ace2从主角变成陪衬,Redmi K60同价位依旧没有对手
- 天天热文:红米K60看了自降300!16+1TB 3499,realme GT Neo5 240W有多香?
- 头条焦点:马嘉祺的真实姓名?(马嘉祺到底有多优秀)
- 血脂高吃什么食物好
- 杜荫早_关于杜荫早简述
- 雷军正式发力,中端性价比必须拿捏,友商该如何选择
- 环球热头条丨苹果高端地位遇挑战?折叠屏这些功能用好,效率翻倍不是问题
- “悲情老总”余联兵:从穷小子到百亿身家,但父母还在农村种田|微资讯