只要你用ReLU,就是“浅度学习”:任意ReLU都有等效3层网络
只要你用了ReLU,我们就是好朋就是“浅度学习”。
【资料图】
最近有研究证明,所有基于ReLU的深度神经网络都可以重写为功能相同的3层神经网络。
基于这个证明,伦敦国王学院的研究团队还提出一种为任意ReLU网络找到相应浅层网络的算法。
由此产生的浅层网络是透明的,可用于解释网络的行为。
只要通过算法,就能找到任意深度ReLU网络的对应浅层网络。
对此网友惊呼:我要读这篇论文,立刻马上!
任何深度ReLU网络都是浅层的
ReLU是深度学习领域最常用的一种激活函数,由Nair & Hintonw在2010为限制玻尔兹曼机(restricted Boltzmann machines)提出的。
由于常常在实践中有着比其他常用激励函数(例如逻辑函数)更好的效果,而被深度神经网络广泛用于图像识别等计算机视觉人工智能领域。
论文指出,每个深度ReLU网络都可以转换为一个功能相同且具有“三个隐藏层”的浅层网络。并提供了一个找到对应浅层网络权重的算法,提高神经网络的全局可解释性。
简单来说就是,通过划分输入空间,使用线性函数对每个分区进行建模,来实现深层网络浅化。
具体分为这三步。
首先,需要构建一个将线性模型和半空间编码的第一层,通过使用一个矩阵来表示半空间条件,其中每个行向量表示一个半空间的线性方程。
然后,构建第二层,该层根据输入的所属区域决定哪些边界是活跃的。
最后,构建第三层,通过将输入与每个线性模型相乘并使用指示函数来选择正确的模型。
基于此,每一个深度ReLU网络都可以被转换为一个功能上相同的三层网络,其权重值在扩展实数中。
当然要完成浅化,还需要一些咒(suan)语(fa)。
根据论文,使用算法时只需找到H、c、α、β这些参数,并知道每个区域所需的半空间就可以,主要分三步。
首先,识别可行的模式集,对于每个可行模式,计算全局线性规划的参数A(l)和d(l)。
然后,确定半空间条件,将这些矩阵堆叠起来,确定每个激活模式的半空间条件。最终得到矩阵H和向量c。
最后,计算局部线性模型,根据模型的权重和激活模式,使用显式公式,计算局部线性模型α和β。
简单理解,就是根据已训练好的网络,通过启发式搜索在可能的神经元激活空间中找到合适的权重值。
通过构建浅层白盒网络,能够快速计算出每个数据点的SHAP值,大大提高数据的可解释性。
实验表明,通过上面算法就可以找到给定深度ReLU网络对应的浅层网络的显式权重。
网友:实验很酷,但也有些问题
论文很新颖的提出一个算法,可以实现“深转浅”,不过该方法仍有一些缺点。
比如构建浅层网络使用了无限权重,尽管这些权重可以在Python中实现,但不能使用梯度下降进行微调。
当然,“找茬儿”这块,怎能少得了热心肠的网友。
根据论文可以发现,如果使用团队提供的算法,实验过程中计算时间其实是会随着神经元数量增加呈指数增长。
所以就有网友提出疑惑:算法运行时间与神经元数量成指数关系,12个神经元需要近10分钟,那计算一个普通大小的DNN所需时间岂不是长了去了……
网友指出:假设单层神经网络可以计算任何函数,那么对于任何神经网络来说,这不是都成立吗?
对于这个研究,也有网友犀利表示:这就是个「普遍逼近定理」,没什么大惊小怪的。
不过无论网友怎么说,这篇论文仍然有一些出彩点。
比如,通过这个方式得到的浅层网络是透明的,可以用来生成模型行为的解释。
此外还提供了用于复现实验的代码,供其他研究人员使用来探索和实验。
论文地址已经贴在下面,感兴趣可以去看看~
论文传送门:
https://arxiv.org/abs/2306.11827
参考链接:
[1]https://twitter.com/mathemagic1an/status/1672430954152083456?s=46&t=iTysI4vQLQqCNJjSmBODPW
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
关键词:
推荐阅读
月壤形成的主要原因 月壤与土壤有什么区别
月壤形成的主要原因月壤形成过程没有生物活动参与,没有有机质,还极度缺水干燥;组成月壤的矿物粉末基本是由陨石撞击破砰形成,因此,粉末 【详细】
域名抢注是是什么意思?投资角度来看什么域名好?
域名抢注是是什么意思域名抢注是通过抢先注册的方式获得互联网删除的域名的使用权。域名是由点分隔的一串数字,用于标记一台计算机或一组计 【详细】
捷达保养费用是多少?捷达是哪个国家的品牌?
捷达保养费用是多少?全新捷达的保修期为2年或6万公里,以先到者为准,新车可享受一次免费保养,首次免费保养在5000-7500km或1年内进行。如 【详细】
天然气泄露会造成爆炸吗?天然气泄漏怎么办?
天然气泄露会造成爆炸吗?家里用的天然气如果泄露是会发生爆炸的。当空气中含有混合天然气时,在与火源接触的一系列爆炸危险中,就会发生爆 【详细】
四部门明确App收集个人信息范围 个人信息保护范围判断标准
四部门明确App收集个人信息范围近日,国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合印发《常见类型移动互联网 【详细】
相关新闻
- 只要你用ReLU,就是“浅度学习”:任意ReLU都有等效3层网络
- 空调评测:27°和25°,一晚上耗电量竟能差出一倍!
- 獍是什么动物(衣冠枭獍指什么动物或者生肖) 天天视讯
- 天天热议:2023年福建一级消防工程师报考网站及报名流程
- 科目二镜子怎么调_科目二新手怎么调镜子 天天快播报
- 阿里影业、大麦发布ESG报告,专注公益,履行文化企业社会责任 全球观天下
- 2023青白江省级师范高中中考录取结果查询时间及方式
- 今日精选:便宜口红和贵的口红有什么差别(五块一支的口红和五百块一支的口红有什么差别呢?)
- 每日快报!蒋中炜是哪里人_蒋中伟:气象局:26日起高温逐步缓解
- 发源地二部(关于发源地二部的基本详情介绍)
- 每日信息:西铁城推出世界首款可自动计算月相的手表,售价12.65万日元起
- 小米印度裁员惊人!市场份额创下新低,政府审查严厉,还能撑多久 全球看热讯
- 张志东:马化腾背后的男人,身家百亿,却只开20万的车
- 要闻:龙腾院士:仪器类专业是所有科技突破都离不开的“宝藏专业”
- 手持小风扇成夏季爆款!有企业订单排到8月
- 水舌排水_水舌 全球微动态
- 什么是惯性系(正面吊重量、偏心检测系统?)-焦点消息
- 基金转换按哪天的净值计算-世界头条
- 湖南遇特大暴雨市民街头抱团互救 天天热点评
- 封面科技·周报丨菜鸟推自营快递“菜鸟速递”;B站将以“视频播放分钟数”代替“播放次数” 环球今热点