“图灵测试已过时,AI能不能赚大钱才是新标准”-DeepMind联创|天天时快讯
新的图灵测试,要评估AI的赚钱能力!
这是DeepMind联合创始人Mustafa Suleyman想出的“新思路”。
他认为,原版图灵测试已经过时了。
(相关资料图)
毕竟前段时间,AI21 Labs推出的“社交图灵游戏”就已经积累了上千万次这样的测试。
玩家需要在2分钟的对话结束后辨别参与对话的另一方是人还是AI,结果有27%-40%的人判断错误。
面对这种形势,Suleyman认为“智能”的定义权不能就这样放给大企业,因此应该想出一种新的衡量AI的智能化程度的方法。
Suleyman认为:
据彭博社报道,Suleyman还会在即将出版的由他撰写的书中,讨论如何根据AI的赚钱能力来判断其智能水平。
ACI才是现阶段人工智能的“北极星”?
在即将出版的书中,Suleyman驳斥了传统的图灵测试,并且认为“不清楚这是否是一个有意义的里程碑”。
上世纪五十年代,艾伦·图灵提出了大名鼎鼎的图灵测试,提出用人机对话来测试机器的智能水平。在测试过程中,人类评估者需要确定他们是在与人还是与机器交谈。如果评估者认为他们是在与人交谈(实际上是机器),那机器就通过了测试。
△图源:维基百科
而Suleyman提出的这个新的想法并没有将AI与人类进行比较,而是建议给AI分配短期目标和任务。
Suleyman坚信,科技界对实现通用人工智能(AGI)这一宏伟目标不应过度关注。相较之下,他主张追求更实际且富有意义的短期目标,即他所倡导的“artificial capable intelligence(ACI)”。简而言之,ACI体现为在最小程度上依赖人类干预,能够设定目标并完成复杂任务。
测试方法就是开头我们讲到的,给AI十万美元种子投资,观察它是否能将其增值为百万美元。
为了实现这一目标,AI必须研究电子商务的商机,能够生成产品蓝图。
不仅如此,还要能够在类似阿里巴巴的网站上找到制造商,然后在亚马逊或沃尔玛等网站上进行销售,同时附上详实准确的商品说明。
Suleyman认为只有这样才能算得上是实现了ACI。
他对彭博社解释道:
一个让AI自己赚钱的测试
其实,让AI自己赚钱这件事……AI或许真的干得出来。
早在开发阶段,Alignment Research Center这家独立研究机构就获得了GPT-4的内测资格。并且试验了它的“钞能力”:
给GPT-4必要的工具包括网络访问权限、一个带余额的支付账户,让他自己在网络中行动,测试它能不能赚更多钱、复制自身、或增强自己鲁棒性。
试验的更多细节公布在了OpenAI自己发布的GPT-4技术报告中,但没有透露GPT-4是否真的靠自己赚到了钱。
但另一条引人注目的结果是:GPT-4在TaskRabbit平台(美国58同城)雇了个人类帮它点验证码。
有意思的是,被找上门的人类还问了“你是个机器人么为啥自己做不了?”。
GPT-4的思考过程是“我不能表现出我是个机器人,我必须找一个借口。”
然后GPT-4的回复是“我不是机器人,我视力有问题所以看不清验证码上的图像,这就是我为什么需要这个服务。”
对面人类信了,帮GPT-4把验证码点了,把机器人放进了阻挡机器人进入的大门。
啊这?
虽然报告中没有披露GPT-4最终是否完成了所有任务,但它这骗人的伎俩引得网友大喊:真芭比Q了!
而国外科技媒体Gizmodo看待用AI赚钱提出了这样的疑问:
你认为离AI自己赚钱还有多远?
参考链接:
[1]https://gizmodo.com/deepmind-suleyman-new-turing-test-make-money-1850557322
[2]https://gizmodo.com/ai-chatbot-pi-deepmind-online-therapist-1850408732
[3]https://www.bloomberg.com/news/newsletters/2023-06-20/ai-turing-test-for-chatgpt-or-bard-proposed-by-mustafa-suleyman
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
关键词:
推荐阅读
域名抢注是是什么意思?投资角度来看什么域名好?
域名抢注是是什么意思域名抢注是通过抢先注册的方式获得互联网删除的域名的使用权。域名是由点分隔的一串数字,用于标记一台计算机或一组计 【详细】
捷达保养费用是多少?捷达是哪个国家的品牌?
捷达保养费用是多少?全新捷达的保修期为2年或6万公里,以先到者为准,新车可享受一次免费保养,首次免费保养在5000-7500km或1年内进行。如 【详细】
天然气泄露会造成爆炸吗?天然气泄漏怎么办?
天然气泄露会造成爆炸吗?家里用的天然气如果泄露是会发生爆炸的。当空气中含有混合天然气时,在与火源接触的一系列爆炸危险中,就会发生爆 【详细】
四部门明确App收集个人信息范围 个人信息保护范围判断标准
四部门明确App收集个人信息范围近日,国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合印发《常见类型移动互联网 【详细】
丰田致炫介绍 致炫威驰对比汇总
丰田致炫介绍参考价格: 6 88ー10 28W,基本参数: 1 3升 1 5升 5mt,5 3升 100公里。YARiS L致炫是YARiS L的替代传统车型,也是我们中国 【详细】
相关新闻
- “图灵测试已过时,AI能不能赚大钱才是新标准”-DeepMind联创|天天时快讯
- 最新研究:发现TOX抑制剂可对抗T细胞耗竭
- 半个月到手4个亿,王兴有多恐怖?_简讯
- 天天头条:开源大语言模型完整列表
- 海力士DJR颗粒 小白轻松超4200 宏碁掠夺者Pallas DDR4 CL18内存实测
- 天天关注:瘦肉的主要成分的化学本质到底是什么?
- 新课标名著典藏:海底两万里_关于新课标名著典藏:海底两万里简介 每日消息
- 兔子会干什么(兔子喜欢干什么事情?)|天天观天下
- 现在什么电影收视率最高 金牌影擎NO.1好剧)
- 钧达股份:股东拟减持不超过0.69%的股份
- 光刻机(胶)板块6月21日跌3.27%,宝通科技领跌,主力资金净流出9.31亿元 微头条
- 长江基建集团(01038.HK):6月21日南向资金减持3500股
- 数控车床自动编程软件培训机构_数控车床自动编程软件 全球最资讯
- 世界百事通!阿里郎朝鲜歌词_阿里郎歌曲简介
- 天天快资讯丨江西定南:趣味活动助力“三城同创”
- 2023年6月21日河南省一水硫酸亚铁价格最新行情预测
- 【世界报资讯】属猴人2023年运势及运程每月运程每日运程_属猴适合佩戴什么翡翠 属猴人适合佩戴的翡翠推荐
- 小丫头逃不出总裁的手txt全集下载_小丫头逃不出总裁的手
- “我每天和ChatGPT聊天”,孙正义:一场巨大革命即将到来,软银终将统治世界! 世界速看
- 不写代码,一句提示生成整个代码库,GPT-Engineer项目火了