当前位置:科学 > 正文

焦点热议:商汤ChatGPT「商量」炸场!秒生6K神图代码提速62%,现场直播怼脸

2023-04-11 17:46:32  来源:新智元

编辑:桃子 好困

【新智元导读】「日日新SenseNova」大模型体系发布,商汤正式官宣入局!


(资料图片仅供参考)


商汤正式加入ChatGPT战局!

就在昨天,商汤在发布会现场一口气来了个全套的,大模型文生图、代码生成、做视频、2D/3D数字人....

话不多说,直接上图。

一个人类站在非常有未来感的建筑面前,畅想平行宇宙种种可能。

只需5分钟真人视频素材,活灵活现的数字人就来了。

还有代码翻译实时演示,码农狂喜。

日日新,又日新


这些让所有人惊呆的大模型能力,便来自商汤的「日日新SenseNova」大模型体系。

「日日新SenseNova」这一名字取自《礼记·大学》中,汤之盘铭曰「苟日新、日日新、又日新」。

它寓意着在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI更多可能。

在这一大模型体系中,商汤自研了中文语言大模型商量SenseChat、以及包括AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型与应用。

商量SenseChat:妙解复杂问题,创作一流文本

商量SenseChat是商汤最新研发的中文语言大模型。

模型训练使用了大量数据,并充分考虑了中文语境,能够更好地理解和处理中文文本。

活动现场,商量SenseChat不仅能进行单轮对话,而且多轮对话,超长文本理解能力上表现出色。

在单轮对话上,理解句子含义,判断句子合理性不在话下。

另外,还能够进行逻辑推理,比如正确完成非命题和命题的逻辑问题。

问它旺仔的爸爸有三个孩子,老大叫大毛,老二叫二毛,老三叫什么?

在多轮对话中,商量SenseChat还具备出色的语义理解、创造力和共情能力。

能够为你提供情感上的抚慰,比如「如何提高自我认识,更好地了解自己?」

它还可以进行共同创作,比如与人一人一句共同创作儿童故事。

最后,在超长文本理解上,商量SenseChat能够帮助用户快速通过与大模型互动来获取知识、寻找答案。比如,让它快速阅读理解《专利法》。

此外,商汤直接把商量SenseChat用在了代码开发上,推出了AI代码助手。

更刺激一点在于,他们这次竟然上了现场实时演示,而且还是镜头直接怼屏幕的那种。

据了解,全新的AI代码助手为码农提供了代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。

与此同时,AI代码助手还支持中英文,以及多种编程语言,并能够快速适应码农个性化编码风格。

在内部实测中,AI代码助手可以让代码编写效率提升62%,HumanEval测试集一次通过率40.2%。

商汤科技董事长兼CEO徐立称,下一代软件开发范式是AI for AI,并提出了全新的二八定律:代码= 80% AI生成+20%人工。

除了写代码,商量SenseChat已经用在医疗场景中,比如问诊分诊、医疗知识科普、疾病鉴别诊断。

未来,将继续拓展在药物治疗、手术方案等方面的问诊能力,帮助医生进一步提升诊疗效率。

真·全能AI


除了发布中文语言大模型,当前,最火的就是生成式AI了,商汤在该领域也展开了全方位的布局。

基于「日日新SenseNova」大模型体系,商汤自研了包括秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings等一系列生成式AI模型及应用。

文生图创作平台「秒画SenseMirage」

文生图有多强,其实你刚刚也见证到了。秒画SenseMirage能够展现光影真实、细节丰富、风格多变,还能支持6K高清图的生成。

该模型基于超10亿参数自研文生图生成模型,支持二次元、三次元等多种生成风格。

另外,用户还可以自主训练,可基于单卡,5分钟内定制属于自己的LoRA 模型@20张训练图片。

对创作者来说,生成模型开源社区汇聚了1万+开源模型,结合自研模型及训练能力,为其提供了更加完善的内容生产工具。

AI数字人视频生成平台「如影SenseAvatar」

谈到元宇宙,就需要数字化分身Avatar。

如今,无需专业拍摄设备,通过文字驱动,你就可以快速、高效打造一个高度逼真的数字形象。

如影SenseAvatar仅需要5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。

甚至,只需提供一个粗略的想法,文案也有了。此外,它还能支持百种语言,让你轻松创作跨国际化内容。

除了打造短视频,「如影SenseAvatar」还可以轻松制作教育、企业,娱乐文化等领域的视频。

3D内容生成平台「琼宇SenseSpace/格物SenseThings」

格物SenseThings可基于3D内容生成技术实现对空间和物体的复刻与交互,并支持再编辑再创作。

除了数字人,基于NeRF,商汤的琼宇SenseSpace可以进行场景生成,复刻和还原真实空间。

琼宇SenseSpace生成的场景不仅支持自由漫游,还支持实时交互和编辑。

比如进行城市生成,高度还原场景细节。

甚至有厘米级的重建精度,可通过实时渲染和互动带来超真实感的场景。

多源数据融合带来超精细化的清晰度和细节效果。

另外,格物SenseThings可以进行物体3D内容生成。

它能够良好支持复杂结构物体复刻,并做到光照精准复刻,材质完美还原。

以上是日日新SenseNova大模型体系带来的强大内容生成能力,不论在图片、还是数字人、视频上,直接打破了人类创意天花板,将重塑行业生态。

释放大模型这么多能力,商汤的底气在哪?

5年磨一剑,直指AGI


2023年,由AIGC及ChatGPT引领的新一轮人工智能热潮已箭在弦上。

其实,早在2018年,商汤就开始着手AI大模型研发。只不过,这个概念,今年才被炒火。

到现在,这家AI公司已经5年多的技术沉淀和实践经验。已经打造了CV、NLP、AIGC多个AI大模型。

2019年,商汤最先推出了10亿参数量规模的视觉模型,实现了当时业界最好的算法效果。

那时,商汤已经具备了千卡并行的系统能力,使用了上千张GPU卡进行单任务训练。

在2021-2022年,商汤还训练了百亿参数规模的超大视觉模型,这相当于千亿参数语言模型的训练量。

目前,商汤已成功研发了320亿参数量的全球最大的通用视觉模型。

该模型已经实现了高性能的目标检测、图像分割和多物体识别算法,并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。

今年3月,商汤还开源了多模态多任务通用大模型书生(INTERN)2.5,有30亿参数。

商汤这家前沿AI科技公司,不仅有着深厚的算法积淀,最重要的是还有强大的基础设施——SenseCore AI大装置。

在急需算力的当下,商汤SenseCore AI大装置以5000 Petaflops超大规模算力和出色的并行计算能力,为大模型研发提供强大的算力基础设施。

现有27000块GPU,可输出5000 PetaFlops算力,能够以最大4000卡规模集群进行单任务训练,并可做到7天以上不间断的稳定训练。

算法,算力有了,数据怎么来?

一直以来,商汤在智慧城市、智慧商业等领域的长期耕耘,积累了海量真实世界的高质量视觉数据。

徐立表示,模型的能力应考量包括参数量和数据量。而参数量和数据量的乘积即计算量,即模型的能力可以用所依赖计算量来做标定。这就是新时代下,算法、数据和算力的新公式。

发布会现场,商汤基于「日日新SenseNova」大模型体系和AI大装置SenseCore,面向商业伙伴提供API。

其中包括图片生成,自然语言生成,视觉感知通用任务与标注服务,客户可以根据自己想要的内容进行调用。

在推进AGI布局上,商汤向所有人展示了大模型+大算力的战略布局。

未来,商汤还将继续推进「日日新SenseNova」大模型体系的建设,将AGI作为核心发展目标。

日复一日,在大模型研发实现AGI突破,让AI惠及每个人。

关键词:

推荐阅读

中国天眼4月1日正式对全球开放 中国天眼是干什么的在哪里?

中国天眼于2020年1月11日正式开放运行。在中科院国家天文台主导建设之初,即确立了中国天眼将按国际惯例逐步开放的原则,以更好地发挥其科 【详细】

雾霾对经济的影响 雾霾的危害有多大?

雾霾对经济的影响1、雾霾天气迫使工业产业进行结构调整在雾霾天气的现实影响下,只有合理调整工业产业结构,关停重污染企业,加强环境管理 【详细】

​非洲大蜗牛介绍 ​非洲大蜗牛为什么是入侵物种?

在我们的印象中,蜗牛都很小,没有争议。但有一种蜗牛,不仅有手掌大小,而且在很多国家和地区已经成功成为入侵物种,那么这种像手掌一样大 【详细】

祝融号火星车首批摄影作品公布 火星和地球有什么相似之处?

祝融号火星车首批摄影作品公布今天(6月11日),国家航天局举行了第一批天问一号探测器登陆火星科学影像图的揭牌仪式,并发布了祝融号火星车 【详细】

mac mini干什么用 新款macmini性能怎么样?

Mac mini现在已经发布了,不少人还在犹豫要不要入手,那么mac mini主要干什么用?mac mini价格多少?新款macmini性能怎么样?今天一起来看 【详细】

相关新闻

关于我们  |  联系方式  |  免责条款  |  招聘信息  |  广告服务  |  帮助中心

联系我们:85 572 98@qq.com备案号:粤ICP备18023326号-40

科技资讯网 版权所有