即时:微软发布13亿个参数的微型AI代码编程模型,性能上超越GPT-3.5
微软的AI研究人员发布了一款名为phi-1的新代码生成模型,它被设计成轻量级的,并且在性能上超越了ChatGPT背后的大型语言模型GPT-3.5。
【资料图】
这个基于Transformer的模型仅拥有13亿个参数——相比之下,OpenAI的Codex模型,也就是GitHub Copilot的基础,有120亿个参数。
微软的研究人员仅用了四天时间,利用来自Nvidia的八个A100芯片对phi-1进行训练。该模型使用了来自网络的60亿个标记,以及使用GPT-3.5生成的另外10亿个标记。GPT-3.5是构建OpenAI的ChatGPT的底层模型之一。
在性能方面,phi-1在HumanEval基准测试中取得了50.6%的一次通过准确率。尽管phi-1的体积要小得多,但它击败了Hugging Face和ServiceNow的StarCoder(33.6%),OpenAI的GPT-3.5(47%)和Google的PaLM 2-S(37.6%)。
在MBPP pass@1测试中,phi-1表现更好,取得了55.5%的分数。很多上述模型尚未公布此基准测试的结果,但是WizardLM的WizardCoder在本月早些时候进行的一次测试中得分为51.5%。与phi-1的13亿参数相比,WizardCoder是一个拥有150亿参数的模型。
高质量的数据能够产生巨大的影响
微软的研究人员认为,正是“高质量数据的力量”使得phi-1表现出色。为了强调这一点,研究人员将他们的模型论文命名为“只需教科书”。
他们写道:“就像一本全面、精心制作的教科书可以为学生提供掌握新科目所需的知识一样,我们的工作展示了高质量数据在提高语言模型在代码生成任务中的熟练程度方面的显著影响。”
通过精心打造“教科书级别”的数据,我们能够训练出一个模型,在编码基准测试(如HumanEval和MBPP)中超越几乎所有开源模型,尽管模型大小只有它们的十分之一,数据集大小只有它们的百分之一。
Phi-1在Python编码方面存在一些限制,与其他可用的编码模型相比。他们说这个模型的局限性还在于它缺乏像使用特定API进行编程这样的更大型模型所具备的领域特定知识。
为了扩展他们的工作,微软的研究人员建议使用GPT-4而不是GPT-3.5来生成模型训练所需的合成数据。
研究人员还将努力改善数据集的多样性和非重复性,尽管团队表示他们必须找到方法来“在数据生成过程中注入随机性和创造力,同时仍保持示例的质量和连贯性。”
ZeRO++:加速大型模型微调
微软的研究人员本周还宣布了一种名为ZeRO++的新方法,旨在改进大型模型的预训练和微调。
像ChatGPT和GPT-4这样的大型AI模型需要大量的内存和计算资源来进行训练和优化。
有时候在相对于批次大小而言使用大量的GPU进行训练时,会导致每个GPU的批次大小较小,需要频繁的通信。
为了解决这个问题,微软推出了ZeRO++系统,它利用量化技术,将连续无限的值映射到一个较小的离散有限值集合上,结合数据和通信重映射,将总通信量与ZeRO相比减少了4倍,而不会影响模型质量。
实际上,ZeRO++ 的设计目的是在您使用的硬件相对于模型的大小太小的情况下,提高您尝试训练的模型与 GPU 之间的通信效率。
根据微软的研究人员所说,ZeRO++使得带宽较低的集群能够达到与带宽高4倍的集群相似的吞吐量。
该系统的团队声称,与微软早期的训练优化系统ZeRO相比,它的吞吐量高达2.2倍。
ZeRO++对AI社区中的任何人都是可用的,并且可以通过GitHub进行访问。研究人员宣布将在“未来几周内”发布一个用于聊天的版本。
关键词:
推荐阅读
域名抢注是是什么意思?投资角度来看什么域名好?
域名抢注是是什么意思域名抢注是通过抢先注册的方式获得互联网删除的域名的使用权。域名是由点分隔的一串数字,用于标记一台计算机或一组计 【详细】
捷达保养费用是多少?捷达是哪个国家的品牌?
捷达保养费用是多少?全新捷达的保修期为2年或6万公里,以先到者为准,新车可享受一次免费保养,首次免费保养在5000-7500km或1年内进行。如 【详细】
天然气泄露会造成爆炸吗?天然气泄漏怎么办?
天然气泄露会造成爆炸吗?家里用的天然气如果泄露是会发生爆炸的。当空气中含有混合天然气时,在与火源接触的一系列爆炸危险中,就会发生爆 【详细】
四部门明确App收集个人信息范围 个人信息保护范围判断标准
四部门明确App收集个人信息范围近日,国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合印发《常见类型移动互联网 【详细】
丰田致炫介绍 致炫威驰对比汇总
丰田致炫介绍参考价格: 6 88ー10 28W,基本参数: 1 3升 1 5升 5mt,5 3升 100公里。YARiS L致炫是YARiS L的替代传统车型,也是我们中国 【详细】
相关新闻
- 即时:微软发布13亿个参数的微型AI代码编程模型,性能上超越GPT-3.5
- 印度式不讲武德的"杀猪盘":磨刀霍霍向小米_即时
- 每日消息!气不足吃什么食物好(女性气血不足吃什么食物)
- 环球看热讯:好六街游园会曾黎保护王鹤棣好有安全感赵露思曝理想型
- 环球快报:风吹十里荷花香 “莲”通乡村“致富路”
- 日本强推核污染水排海 日本民众:不应做危害子孙后代的事
- 热点!AI即将完全取代人类!盘点近年人工智能发展
- 中国人类基因图谱的公开,或是“精英”们精心策划中的一部分! 环球新动态
- 环球焦点!博格巴:我在尤文得到了球迷和俱乐部的爱 但在曼联没有
- 肛门痒挂什么科(我老公老是肛门瘙痒,如果爱爱过后我也会痒,我们想去医院看看,不知道挂...)_全球动态
- 斯凯孚轴承型号含义(6312轴承型号含义)
- 大小S宣布起诉葛斯齐,网友:挽回名誉,毛发验毒比起诉有用_微资讯
- 心悦俱乐部g分有什么用(心悦g分有什么用)-环球热文
- 又一家家乐福突然宣布停业!
- 工会法人资格证书查询网站官网 工会法人资格证书查询_全球观速讯
- 烧烤店爆炸后的银川:市委书记随机检查餐厅,市长鞠躬道歉!
- GPT-4竟被CS学生「开源」了!OpenAI威胁:不撤下项目就告你
- 科技夯实产业根基——河北正定采访见闻-世界速讯
- 我市推进专项行动 强化河湖水域岸线保护
- 世界热文:透析对身体有什么影响(透析对身体有危害吗?)