百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

共生与共构:人工智能与历史学结合的新探索

myzbx 2025-02-15 00:15 45 浏览

编者按

近年来人工智能技术飞速发展尤其是ChatGPT、DeepSeek等生成式人工智能技术的兴起,为历史研究和教学带来新的机遇。借助人工智能技术,历史学家们可以便捷地获取数据、释读史料,发现不同文本之间存在的关联。此外,运用人工智能进行历史模拟,也逐渐成为历史教学中积极探索的方向。人工智能为史学研究带来便利的同时,也给历史学家的工作带来不少挑战,如学者们必须注意到生成式人工智能引用的已有数据可能会存在价值偏见,进而影响输出内容的真实性等。人工智能与历史学之间如何共融共生?人工智能时代历史学家应该如何提升技能,积极运用新技术,推进历史知识生产和公共历史实践呢?基于此,本版特刊发专题文章,以期对上述问题作出回答。

作者:向静(中国社科院大学数字史学研究中心副教授)

当前AI(人工智能)正在逐渐改变世界,成为政府决策、医疗干预、金融交易、司法审议、环境保护、科学研究等领域的重要“参与者”。历史学者将要面对的是一个前所未有的与AI共生的时代。不过,到目前为止,大多数学者并不认为AI会从根本上改变历史学,或者历史学会对AI发挥关键性的作用。

这种态度部分源自于人文学者将AI理解为机器能力的进展,从而把接受AI视为纯粹的技术问题。1956年,美国科学家约翰·麦卡锡提出了“Artificial Intelligence(人工智能,简称AI)”这一术语,指代能展示人类智能行为的计算机系统。数十年后,随着计算能力提高、有了可用的大规模数据集,在2010年代中期,出现了基于深度学习技术的算法决策系统与预测性的机器学习,“人工智能”的涵义不断扩展,代表了IT系统(包括机器或软件系统)通过学习和解释庞大的人类记录数据,实现模拟人类认知能力的一系列技术、方法和流程。机器学习的算法和模型走出了学术研究与科学实验,开始应用于商业、医疗、教育以及国家战略等层面。戏剧性的转变发生在2022年底,生成式AI的应用ChatGPT问世,上线两个月,活跃用户达到1亿人,在引起广泛关注的同时,也促进中国开发的诸多大语言模型(LLM)投放市场。2024年底,DeepSeek上线并同步开源的V3模型,以其创新的模型构架和高性价比点燃了民众以中文使用AI的极大热情。通过ChatGPT、DeepSeek、Kimi、豆包这些国内外聊天机器人,AI对于普通人变得触手可及。人们能运用自己熟悉的语言指示机器执行任务,个人的决策、行动随时可以参考、调用算法和模型,机器的回应不仅符合人类表达的逻辑,顺畅自然,还能针对个人的输入进行调整,如同一个适应性强、情绪稳定的同伴,使人感到亲近。在与人类的互动关系上,这是人工智能一次革命性的飞跃,大语言模型不仅是一项在语义空间里应用生成式人工智能的典型技术,还下沉到日常生活,拉近了人类历史与现实之间的互动关系。

虽然到目前为止,人们还无法解释人工智能算法在内部运行的机制细节,但通过其训练过程,可以看到它正在为人类历史与现实的关系提供一种从未有过的数字交互模式。以生成式AI为例,开发者为了让AI理解人类语言的指令,实现人机连贯对话,主要让机器学习大量的文本数据。近两年来,现有的基础大语言模型几乎使用了绝大部分的可用高质量文本数据源,其中公开的、数字化的历史记录、档案、书籍论文虽然数量占比不大,对AI的训练影响却很重要。通过理解这些训练文本背后的结构,AI实现了与人类语言的“对齐”,也表征了这些历史文献与历史认识当中反映出来的偏好、价值观与意识形态。主流的机器学习算法目前都近似于一种优化多数的策略,擅长从历史数据中识别模式与类型,如果用于训练的历史文本和图片里含有明显的偏见、歧视与局限性,数量又多的话,就会被AI当作重要的参数,带入判断当下、影响未来的决策和预测当中,威胁到人类社会的安全、伦理、道德等基本需求。换言之,训练AI的过程,是在使AI历史化,从数据中获得定义过去的方法;运用AI的过程,则极大加速了从认识过去到付诸当下行动的转化,使人类历史与现实活动之间的关系在数字层面上呈现为一种持续相遇、顷刻相通、实时作用的互动形态。从一开始,AI系统的研究与应用,可以说就是赋予AI历史性与社会性的过程。

为了确保这项新信息技术的发明能服务于人类共同的福祉,除了技术开发者外,还需要人文社会科学工作者的深入理解与广泛参与。对历史学者来说,这会是一个与AI共同建构学科、学理与学识的过程。一方面,AI会促成重大的历史变革,它能自行决策、提出想法,将来还会使大量的非人类智能加入对历史的研究当中,它们擅长高速处理多模态的历史资源,通过智能体模拟进行“虚拟历史实验”,可能提出对复杂社会的解释系统,挑战人类学者的主体性,重新界定历史学的存在边界与独特领域。另一方面,历史学者如果能理解并掌握AI,可以增强历史学的技艺,作为领域专家参与审查AI训练的历史数据集,从长期的历史脉络中揭示AI系统的价值内嵌与认识机制,评估AI的预测、决策,并将历史学提供的对过去记忆与事实的选择书写,对人类活动价值与意义的总结反思,通过数据构建与算法改进,贯注作用于AI系统,影响AI的走向。

以古代历史研究为例,可以看到AI与历史学者之间这种正在探索中的共同建构。对于历史研究工作的核心要素与基础工作,AI能发挥积极作用,同时历史学也有力量推动AI从数据与算法两方面改变现状、提升性能。

为了理解古代社会、探究人群生活,历史研究需要的史料搜集与处理技艺非常复杂,比如泥板、纸草、甲骨、金石、写本这些载体的文献修复,古汉语、古希腊文等多种文字的识别与释读,图像、雕塑、考古遗址的辨识、分类等。近年来,学者运用深度神经网络、卷积神经网络等深度学习技术,结合迁移学习等策略,贡献出了前沿成果。中国科学院团队提高了甲骨文字符的自动识别率;谷歌的模型Ithaca,能合理推断古希腊铭文的时间与地理归属范围;浙江大学团队实现了缀合敦煌写本的自动化流程;中国矿业大学团队发布敦煌壁画的MuralDH图像数据集,进行分类、修复。2024年初,机器学习从碳化的意大利赫库兰尼姆卷轴里,识别出了莎草纸符,提供了古希腊哲学的新史料。像这类具有原创性和影响力的工作,都是由包括历史学在内的领域专家与计算机科学家组成的跨学科团队完成,显示出AI对历史研究的来源,尤其是在多模态史料发掘、解析方面的效能。由于目前大多数的AI算法依赖英语等主流语种,偏重近现代的历史训练集,在将AI运用于古代语言的文本、图像与考古对象时,需要明显扩大数据的多样性和包容性,在使AI处理古代历史中非标准化的、异质的、不完整的资料时,也要同时推进算法的批判性创新,这都显示出历史学研究将是助力AI突破结构性限制的重要领域。

研究古代的学者,也可能遇到史料数量庞大或者类型复杂得难以把握,此时找寻到最合适的AI技术,不仅使研究得以展开,还能发现隐藏的事实,提出有解释价值的新问题。在一项针对15至17世纪欧洲史的研究中,学者需要考察359本天文学教科书,其中含有76000页文本、数万幅科学插图与天文表格。德国马普所的研究人员通过机器学习来识别文本间的联系,检测、分类与聚类这些插图和表格,历史学者则从数据中看到了以前不被注意的事实,即欧洲的科学知识传播并不受宗教改革的分裂影响,而是呈现出凝聚与同质化的形态。这一时段对应着中国历史上的明清时期,研究者们同样也面临着史料复杂烦琐、文献汗牛充栋的问题,对于在整理、分析与思考中如何运用AI系统有着迫切的需求。比如对于明清档案文献,中国人民大学团队提出了深度学习、人机协同的智能著录标引流程;对于地方志研究,中国社科院大学团队开发了专有工具,通过调用大语言模型的API端口,批量实现方志数据的多层次、多义性标注,以知识图谱进行可视化呈现与分析。这些尝试都希望能从明确的问题出发,探索以数据建设为核心、以算法呈现历史语境、具有透明性与可解释性的研究工作流程,以一种符合职业与专业的要求,来推进与AI的共构,使研究者把更多的时间和精力解放出来,真正用于历史学的创造性思考、深度解释以及价值反思。

在积极拥抱AI变化的历史学者中,很多人从数字人文、数字史学的兴起之时已经在讨论史学与AI的共生之道。在AI迅速发展、推理思考能力不断迭代的当下,相信还会有更多的历史学家主动了解AI运作的机制,视其为学术助手、影子同行,共同建构一种从思考、写作到交流、教育的史学工作新生态,这将是一场引人注目、面向未来的探索之旅。

(本文系国家社科基金重点项目“清史地理信息系统开发与研究”的阶段性成果)

相关文章:①游戏还是工具——生成式人工智能与历史模拟 ②人工智能在史学研究中并非无往不利

《光明日报》(2025年02月10日 14版)

来源: 光明网-《光明日报》

相关推荐

别让水 “跑” 出卫生间!下沉设计打造滴水不漏的家

你是否遭遇过卫生间的水“偷偷溜”进客厅,导致木地板鼓起、墙角发霉的糟心事?又是否为卫生间门口反复渗漏,不得不一次次返工维修而头疼不已?在家庭装修中,卫生间防水堪称“兵家必争之地”,而卫生间门口下...

歼-10CE vs 阵风:谁才是空中霸主?全面性能对比解析

歼10CE与法国阵风战斗机性能深度对比分析一、总体定位与设计哲学歼10CE:单发中型多用途战斗机,侧重于空优(制空权争夺)和对地对海打击,具有较高的性价比和较强的多任务能力。法国阵风战斗机:双发中型多...

知名移植工作室肯定Switch2的图形性能,却被CPU拖了后腿

虽然Switch2发售多日,但没入手的玩家对其性能还是有顾虑。近日,知名移植工作室Virtuos的技术总监在接受采访时讨论了Switch2的性能,并给出了他们工作室的评价。简单来说,Switch2在D...

虹科实测 | CAN XL vs CAN FD传输性能深度对比:速率翻倍,抖动锐减!

导读在汽车电子与工业通信领域,CAN协议持续进化,推动着数据传输效率的提升。本次实测基于虹科PCAN-USBXL与虹科PCAN-USBProFD硬件,在同等严苛条件下对比CANXL与CANF...

1J117合金材料优异的耐腐蚀性、机械性能

1J117合金材料概述定义:1J117是一种不锈软磁精密合金,属于铁铬基合金,其圆棒产品具有特定的形状和尺寸,可满足各种工业应用中的特定需求。标准:技术条件标准为GB/T14986,品种规格标准...

据高管所称,Switch2能轻松移植XSS平台60帧游戏

任天堂,作为主机游戏界的御三家之一,一直注重游戏性而不注重更新升级硬件设备是其最大的特点。各位任豚们,忍受着任天堂早已落后硬件设备,真想感叹一句,天下苦任久矣!但Switch2的出现或许正在渐渐的改变...

FJK-110LED-HXJSN磁传感器有哪应用

作为一名从事电子技术相关工作的自媒体人,我经常会遇到各种传感器的应用问题。其中,FJK-110LED-HXJSN磁传感器是一款在工业自动化、智能设备等领域比较常见的磁场检测元件。今天我想和大家聊一聊这...

浅谈欧标方管200x200x5-12mm质S275JRH的优势与劣势

欧标方管200x200x5-12mm材质S275JRH是一种常见的结构用钢材,广泛应用于建筑、机械制造、桥梁、钢结构等领域。本文将对这种方管的优势与劣势进行浅谈,以帮助读者更好地了解其特性和适用场景。...

宽带拨号错误 651 全解析:故障定位与修复方案

在使用PPPoE拨号连接互联网时,错误651提示「调制解调器或其他连接设备报告错误」,通常表明从用户终端到运营商机房的链路中存在异常。以下从硬件、系统、网络三层维度展开排查:一、故障成因分类图...

模型微调:从理论到实践的深度解析

在人工智能领域,模型微调已成为提升模型性能、使其适应特定任务的关键技术。本文将全面系统地介绍模型微调的各个方面,帮助读者深入理解这一重要技术。一、什么是模型微调模型微调是指在已经训练好的预训练模型基础...

汉语拼音 z、c、s图文讲解(拼音字母表zcs教学视频)

以下是汉语拼音z、c、s的图文讲解,结合发音要领、书写规范及教学技巧:一、发音方法与口诀1.z的发音发音要领:舌尖轻抵上齿背,形成阻碍后稍放松,气流从窄缝中挤出,声带不振动(轻短音)。口诀:“写字写...

吴姗儒惹怒刘宇宁粉丝!吴宗宪护航「是综艺梗」叮咛女儿对话曝光

记者孟育民/台北报道Sandy吴姗儒在《小姐不熙娣》因为节目效果,将男星刘宇宁的头像踩在地上,引起粉丝怒火,节目发声明道歉后仍未平息,她也亲自发文郑重道歉:「我对刘宇宁本人完全没有任何恶意,却在综艺表...

苹果错误地发布了macOS Tahoe公开测试版 现已将其撤下

一些Beta测试人员下载了他们以为是macOSSequoia15.6RC的版本,但却错误地下载了macOSTahoe26公开测试版,后来苹果修复了该问题。苹果预计将于7月25...

make的多种用法!(make 的用法总结)

一、make的用法美make[meik]①V.制造;制定,拟定;使变得,使处于;造成,引起;整理(床铺);做,作出;强迫;挑选,任命…②n.(机器、设备等的)品牌,型号;结构,构造;通电,接电⑤[...

北顿尖刀哗变?俄第20近卫集团军损失惨重,拒绝执行指挥官命令?

【军武次位面】作者:太白近日,外国社交媒体“电报”上传出了一些消息,称俄罗斯在北顿涅兹克战场上的“尖刀”部队之一,俄第20近卫集团军因为损失惨重,已经出现了部分部队拒绝执行指挥官命令,甚至哗变的情况。...