当前位置:科学 > 正文

环球热推荐:历史学家的数字兴奋剂:历史、记忆和理论能被人工智能化吗?

2023-01-13 15:53:20  来源:笔杆先生

毫不夸张地说,人工智能正在创造历史。机器学习工具在制作流行文化中关于过去的图像和故事方面发挥着关键作用。AI大概也已经进入了历史课堂。有大型语言模型,如GPT-3,能够响应简单的自然语言输入生成引人注目的、非抄袭的文本,从而为学生提供了一个以最小的努力产生高质量书面作业的机会。

同样,像GPT-3这样的工具可能会彻底改变历史研究,让历史学家和其他处理文本的专业人士能够依赖人工智能生成的中间工作产品,如准确的翻译、摘要和年表。但当今的大型语言模型在历史学家高度重视的关键任务上失败了。他们在结构上无法说出真相,也无法透过层层文本追踪信息。更有甚者,他们缺乏伦理上的自反性。

因此,就目前而言,学术史的写作将需要人类的代理。但是对于历史理论家来说,大型语言模型可能提供一个机会来检验关于历史写作本质的基本假设。例如,历史理论家可以定制大型语言模型来编写一系列关于同一事件的描述性、叙述性和断言性历史,从而使他们能够探索历史写作中描述、叙述和论证之间的精确关系。


(相关资料图)

简而言之,有了专门设计的大型语言模型,历史理论家们可以进行大规模的写作实验,这是他们在真正的历史学家那里永远也不可能实现的。

作为公共历史学家,他们在博物馆、纪念馆和其他受欢迎的场所,如历史电视和视频游戏中帮助塑造二十一世纪的记忆文化。但是当涉及到披上专业历史学家的外衣时,他们仍然被束缚在书上。

博士生在他们与资料来源的创造性斗争结束时提交的专著,采用了自利奥波德·冯·兰克时代以来没有太大变化的格式,正如快速浏览兰克工作的一个著名细节所示。的数字副本德国宗教改革史揭示了兰克,像他的21世纪的弟子一样,最初使用脚注来讨论术语,然后在每页上包含一个或两个脚注,其中包含对主要来源的引用。

脚注的文本附录已经为兰克的同时代人所熟悉,尽管兰克的学术和文学前辈都没有设法给附录注入如此多的专业魅力,并将其确立为新兴历史专业的决定性基准。兰克提出的吸引人的脚注证明了书面文本在符号和实践方面的认识论完整性。今天,随着历史学家进入人工智能的世界,脚注及其代表的内容可能会成为一个受欢迎的绊脚石。

由于历史学家像他们一样专注于文本,文本生成人工智能的最新突破将为历史研究和历史教学开辟新的机遇,并可能塑造该学科的未来。然而,重要的问题仍然存在。目前存在的人工智能驱动的机器学习技术能够创建语法完美、语义引人注目的文本,即使是专家读者也无法区分人类的写作。

此外,机器学习工具可以通过简单、简短的自然语言命令来启动。但是这些被称为大型语言模型的模型是根据商业目标设计的,而且据我们所知,它们无法辨别真伪。他们可以按照兰克的风格写作,作为文体练习的一部分,他们甚至可以在页面底部生成看似合理的脚注。但他们不像兰克,不能产生真实的脚注。

最先进的可公开访问的法学硕士AI是GPT-3;它是由总部位于旧金山的开放AI行动开发的。GPT-3在结构上无法将其生成的声明归因于特定的文本来源,更不用说评估其任何文本输入或输出的事实可靠性。法学硕士还不能在参考真理的范畴内运作,而参考真理是历史学科中学术的基本前提。它们缺乏产生精确参考所需的垂直存储器。

相反,他们遵循一种简单而强大的横向逻辑,一次又一次地问自己,在给定的一串单词或符号之后可能会出现什么单词或符号,并把他们在训练期间吸收的大量文本作为统计基准,一次一个单词或符号地快速做出决定。这也许不是火箭科学,但对于所有专业作家来说,法学硕士AI是一项爆炸性的技术。

作为历史学家选择的专业产出,对文本的持久依恋维持了稳步积累历史知识的美好愿景。21世纪研究宗教改革的历史学家已经转移了分析重点,从政治史转向社会文化史,并进入前沿领域,如情感史。追求新问题和运用新概念,许多历史学家只是顺便承认兰克,尽管他们仍然称赞他因为“他的分析视野的纯粹范围”而塑造了一个多世纪的学术。

其间发生了很多事情,包括两次世界大战、几次种族灭绝、去殖民化以及对各种民族主义的幻灭,但兰克的见解显然仍然有效。他的文本仍然可以引用,其真理价值完好无损。但是,对于所有人工智能生成的文本,包括人工智能生成的历史,大型同质研究机构的美好幻想构成了重大的道德风险因素。用于训练特定法学硕士的文本语料库中嵌入的任何结构性偏见迟早会进入该法学硕士的文本输出。

直截了当地说,如果一个法学硕士接受了带有种族主义和性别歧视内容的培训,就很可能产生种族主义和性别歧视的文本。使用有偏见的材料来训练法学硕士是难以避免的,因为法学硕士只有在机械地吸收了大量人类生成的文本后,才能获得令人惊叹的类似人类的写作技能。

历史学家非常清楚,但也经常成为受害者,同样的风险复制他们的来源扭曲的道德世界。然而,与历史学家不同的是,法学硕士在结构上无法违背自己的训练背景来写作。在这点上,法学硕士AI制作的光滑文本表面比历史学术的专业雕刻表面隐藏了更多的极差的道德。

一方面,在历史专业中对历史真相的社会建构,另一方面,在支持二十一世纪记忆文化的大量视觉和沉浸式媒体中对历史真实性的社会建构,存在着重要的差异。原则上,历史学家没有理由不制作带有“脚注”基础设施的数字电影、游戏或虚拟现实环境,这些基础设施提供参考并解释概念和美学选择。

然而,尽管历史学家以文本为中心,但他们确信,他们已经开发出了基于经验来源创作散文文本的协议,就他们所知,这些协议反映了历史现实。由于缺乏操纵其他媒体的经验,历史专业的成员对电影、电视或游戏没有类似的信念历史学家将很难决定哪些对过去事件的视觉再现,特别是那些不是根据纪录片制作的再现——应该被称为历史准确。

鉴于电影和游戏的许多美学参数,这种沉默是完全合理的,尽管许多历史理论家会认为,即使是散文文本,它们是古老的信息技术,也通过美学和其他结构参数传达意义,这些参数与文本的参考功能无关。

在视觉记忆文化中,与专业的历史写作不同,人工智能已经发挥了决定性和迅速扩大的作用,塑造了人们对过去的看法和感受,以及应该如何记住它。例如,人工智能在阅读和合成固定图像方面非常先进。

想想DALL-E2等机器学习工具的精彩娱乐输出,例如,以乔尔乔·德·契里柯风格渲染的相扑选手的“画作”。AI擅长在视频游戏和电影中提供视觉背景、特殊效果和过渡场景。因此,通过人类与机器学习技术生成的图像的互动,不断扩大的社会记忆范围应运而生,这些图像对这些社会记忆的进化产生了尚未充分探索和理论化的后果。这些机器摄取了数量惊人的人造图像,却没有求助于任何一套伦理准则来克服这些偏见和缺陷。

乍一看,我们想象的视觉记忆机器应该让历史学家和档案工作者感到高兴,尽管二十世纪和二十一世纪的纪录片和电视材料的完整库存只能提供真实的输出,如果这些材料虽然庞大,但受到人类质量控制,并由人工智能过滤器持续筛选,这些过滤器经过训练,可以检测材料的数字操作。否则,我们的视觉数据库将很快受到其他人工智能成就的感染,例如DeepFakes,它们定期出现在媒体流中,很难从推动我们记忆文化的快速搅动的数字平台中消除。

而DeepFakes只是冰山一角。我们想象中的二十世纪和二十一世纪的电影和电视镜头将包含大量技术上原始的、未经处理的历史宣传材料,深度学习技术将为材料中包含的任何偏见提供图像。例如,纳粹宣传电影在结构上更符合希特勒生活中的新纳粹分子,而不是反法西斯分子。

更有理由对投入和产出进行人类质量控制,就电影和电视而言,这是一个雄心勃勃——但或许并非完全不现实——的主张。如果我们认为我们消费的故事和图像影响了我们的记忆、身份和未来行为,我们应该非常警惕让人工智能在我们道德和政治上有严重缺陷的文化遗产的基础上设计我们未来的娱乐。数字时代的良好记忆政治似乎需要明智而普遍的审查努力。

如果人工智能发展了意识,并开始关心其陈述的真实性,或者更有可能的是,如果人工智能工具可以在可能的未来GPT历史中组装起来,而这种历史建立在不同于当前可用的法学硕士的构建原则上,那么人工智能和历史专业的婚姻只会成为一场梦想的婚礼。

首先,一部GPT历史将需要一个档案部分,至少在一些文本输出的来源方面,这个档案部分要更加公开。就像上面想象的GPT电影一样,GPT历史需要一个垂直的记忆,这将使它能够为它认为与特定历史学家的查询相关的引用和文本摘要提供脚注。此外,GPT历史的文本创作部分应该在真实文本和最新学术的帮助下专门进行训练。

最有可能的是,机器学习已经在历史上发挥了作用,正如它在许多以文本为中心、受规则约束的艺术和职业中所做的那样,如文学、新闻和法律。在所有这些设置中,人工智能主要用于常规的小规模写作任务,成功的人工智能写作的规模可能会迅速增加。对历史的一个暗示是显而易见的。

这门学科将需要获得更宽松、更灵活的抄袭定义,尤其是因为我们可能会面临一波聪明的本科生提交的作业,这些作业将由机器学习工具编写,可能很难被发现是伪造的,特别是如果学生在整个大学生涯中一直使用这些工具。

根据迈克·夏普勒斯的说法,“一个学生现在可以在几秒钟内完成一篇论文或作业,成本大约是1美分。”事实上,我认为负责任地使用机器写作工具,尤其是为法学硕士AI设计有效的自然语言提示的技能,应该成为所有本科课程的关键组成部分。毕竟,我们也已经放弃了正确的拼写是真正学者的标志这一想法。此外,GPT-3是一些任务的优秀平台,如提供文章和整本书的合格摘要。

文体学和机器学习技术为开发和测试关于专业历史写作的微观和宏观语法的假设提供了机会。传统上,历史理论家分析由真正的历史学家撰写的历史学术样本,以确定支配整个学科的模式和规则。

法学硕士AI通过将我们对历史如何运作的假设转化为一套指令,并让法学硕士将这些指令应用于文本实践,使我们能够彻底改变这一过程。通过一种逆向历史理论,我们可以让机器工具根据反映我们对历史如何运作的假设的语言规范来撰写历史论文;然后,我们可以看到结果在多大程度上与“在野外”创造的史学相匹配。

历史理论是不确定的知识。关于历史的本质,有三种不同的说法:对于一些理论家和大多数历史学家来说,历史是一门经验主义的学科,它为读者提供了对过去现实的详细描述。语言学的转向暗示了历史学不同的存在理由,将叙事表现确定为专业历史写作的主要内在价值。

最后,一些后叙事主义者,如库卡宁,坚持认为历史文本应该作为旨在让读者相信一套命题的合理性的论证干预来欣赏和评估。我认为这三种说法都是正确的。没有理由假设历史是一场零和游戏,只关注描述、叙述或论证。事实上,我认为历史是一种混合的智力写作活动,它在文本的不同层面上不断融合描述、叙述和论证。

与此同时,许多历史著作可以被确定为服务于一个主要目标。因此,实际上可能存在至少三种不同类型的历史,应该根据不同的标准进行评估。有使用描述和论证来讲述一个好故事的叙事历史,使用叙事和描述性段落来说服读者某个特定论点的合理性的断言历史,以及整理叙事和断言文本元素来捕捉历史场景或背景的描述历史。

笔者认为:首先也是最重要的,速度快和规模大以及它们带来的所有优势。这些优势包括有吸引力的、引人入胜的集体记忆网站,这些网站反映了创作者的政治和伦理偏好,对资源和文献的全面掌握不再能够由单个学者和研究团队获得,跨不同语言的多视角和多尺度写作的新形式,在瞬间对假设和反事实情景的测试,访问迄今为止被专业历史学家忽视的社会和时代的历史,对不同规模的历史写作的语言和语义模式进行快速、深入的分析,以及从历史文本内的有利位置测试历史理论的基本公理的机会。

所有这一切的代价都很高,可能高得令人望而却步。机器学习技术很昂贵,有巨大的碳足迹,并且旨在为其商业所有者的利益服务。有人必须为学术界兼容的机器学习技术付费。这段GPT历史应该受到公开控制,尤其是要确保它遵守民主合法的审查规则。

最后,它的产出需要迅速果断地推进环境保护事业;否则,所需的稀缺资源投资将难以证明是合理的。正如GPT-3非常恰当地提醒我们的那样:“大型语言模型需要大量电力来训练。这种电力消耗导致温室气体排放,加剧了气候变化。此外,这些模型通常托管在使用化石燃料的服务器上,这进一步恶化了它们对环境的影响。”

参考文献:

关键词: 人工智能 机器学习 电子游戏

推荐阅读

水生植物有哪些 水生植物有什么?

水生植物有哪些?1)湿生植物湿生植物是指生长在河流、湖泊和沼泽中的植物,这些植物非常喜欢潮湿的环境和水,它们的抗旱能力通常很弱,如果 【详细】

科帕奇有哪些方面不足 科帕奇值得买吗?

近几年,我国的汽车市场上,各种品牌大放光彩。那么,你知道科帕奇怎么样吗?接下来我们就来一起看看吧。很多人在考虑买车之前,会有很多的 【详细】

最小的马产地在哪 最小的马产地有哪些?

见过最小的马长啥样?如图所示:马儿在我们的印象中是疾驰飞奔、健硕高大的形象,但是图中这种马完全颠覆我们的对马儿的印象,究竟是怎么回 【详细】

6月16日是什么日子? 为什么美国宇航局6月16日致敬?

您可以使用Freedom做到惊人。6月快乐。Godspeed在您的旅程中。1月16日纪念1865年6月19日,当时少将戈登·格兰杰(Gordon Granger)将军抵达 【详细】

运动型轿车是什么 运动型轿车与普通车有何区别?

运动型轿车凭借着外观酷炫,动力性能强的特点,深受国内众多消费者的喜爱。特别是在年轻消费者心目中,运动型轿车基本上是购车的首选。但是 【详细】

关于我们  |  联系方式  |  免责条款  |  招聘信息  |  广告服务  |  帮助中心

联系我们:85 572 98@qq.com备案号:粤ICP备18023326号-40

科技资讯网 版权所有