百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

共生与共构:人工智能与历史学结合的新探索

myzbx 2025-02-15 00:15 18 浏览

编者按

近年来人工智能技术飞速发展尤其是ChatGPT、DeepSeek等生成式人工智能技术的兴起,为历史研究和教学带来新的机遇。借助人工智能技术,历史学家们可以便捷地获取数据、释读史料,发现不同文本之间存在的关联。此外,运用人工智能进行历史模拟,也逐渐成为历史教学中积极探索的方向。人工智能为史学研究带来便利的同时,也给历史学家的工作带来不少挑战,如学者们必须注意到生成式人工智能引用的已有数据可能会存在价值偏见,进而影响输出内容的真实性等。人工智能与历史学之间如何共融共生?人工智能时代历史学家应该如何提升技能,积极运用新技术,推进历史知识生产和公共历史实践呢?基于此,本版特刊发专题文章,以期对上述问题作出回答。

作者:向静(中国社科院大学数字史学研究中心副教授)

当前AI(人工智能)正在逐渐改变世界,成为政府决策、医疗干预、金融交易、司法审议、环境保护、科学研究等领域的重要“参与者”。历史学者将要面对的是一个前所未有的与AI共生的时代。不过,到目前为止,大多数学者并不认为AI会从根本上改变历史学,或者历史学会对AI发挥关键性的作用。

这种态度部分源自于人文学者将AI理解为机器能力的进展,从而把接受AI视为纯粹的技术问题。1956年,美国科学家约翰·麦卡锡提出了“Artificial Intelligence(人工智能,简称AI)”这一术语,指代能展示人类智能行为的计算机系统。数十年后,随着计算能力提高、有了可用的大规模数据集,在2010年代中期,出现了基于深度学习技术的算法决策系统与预测性的机器学习,“人工智能”的涵义不断扩展,代表了IT系统(包括机器或软件系统)通过学习和解释庞大的人类记录数据,实现模拟人类认知能力的一系列技术、方法和流程。机器学习的算法和模型走出了学术研究与科学实验,开始应用于商业、医疗、教育以及国家战略等层面。戏剧性的转变发生在2022年底,生成式AI的应用ChatGPT问世,上线两个月,活跃用户达到1亿人,在引起广泛关注的同时,也促进中国开发的诸多大语言模型(LLM)投放市场。2024年底,DeepSeek上线并同步开源的V3模型,以其创新的模型构架和高性价比点燃了民众以中文使用AI的极大热情。通过ChatGPT、DeepSeek、Kimi、豆包这些国内外聊天机器人,AI对于普通人变得触手可及。人们能运用自己熟悉的语言指示机器执行任务,个人的决策、行动随时可以参考、调用算法和模型,机器的回应不仅符合人类表达的逻辑,顺畅自然,还能针对个人的输入进行调整,如同一个适应性强、情绪稳定的同伴,使人感到亲近。在与人类的互动关系上,这是人工智能一次革命性的飞跃,大语言模型不仅是一项在语义空间里应用生成式人工智能的典型技术,还下沉到日常生活,拉近了人类历史与现实之间的互动关系。

虽然到目前为止,人们还无法解释人工智能算法在内部运行的机制细节,但通过其训练过程,可以看到它正在为人类历史与现实的关系提供一种从未有过的数字交互模式。以生成式AI为例,开发者为了让AI理解人类语言的指令,实现人机连贯对话,主要让机器学习大量的文本数据。近两年来,现有的基础大语言模型几乎使用了绝大部分的可用高质量文本数据源,其中公开的、数字化的历史记录、档案、书籍论文虽然数量占比不大,对AI的训练影响却很重要。通过理解这些训练文本背后的结构,AI实现了与人类语言的“对齐”,也表征了这些历史文献与历史认识当中反映出来的偏好、价值观与意识形态。主流的机器学习算法目前都近似于一种优化多数的策略,擅长从历史数据中识别模式与类型,如果用于训练的历史文本和图片里含有明显的偏见、歧视与局限性,数量又多的话,就会被AI当作重要的参数,带入判断当下、影响未来的决策和预测当中,威胁到人类社会的安全、伦理、道德等基本需求。换言之,训练AI的过程,是在使AI历史化,从数据中获得定义过去的方法;运用AI的过程,则极大加速了从认识过去到付诸当下行动的转化,使人类历史与现实活动之间的关系在数字层面上呈现为一种持续相遇、顷刻相通、实时作用的互动形态。从一开始,AI系统的研究与应用,可以说就是赋予AI历史性与社会性的过程。

为了确保这项新信息技术的发明能服务于人类共同的福祉,除了技术开发者外,还需要人文社会科学工作者的深入理解与广泛参与。对历史学者来说,这会是一个与AI共同建构学科、学理与学识的过程。一方面,AI会促成重大的历史变革,它能自行决策、提出想法,将来还会使大量的非人类智能加入对历史的研究当中,它们擅长高速处理多模态的历史资源,通过智能体模拟进行“虚拟历史实验”,可能提出对复杂社会的解释系统,挑战人类学者的主体性,重新界定历史学的存在边界与独特领域。另一方面,历史学者如果能理解并掌握AI,可以增强历史学的技艺,作为领域专家参与审查AI训练的历史数据集,从长期的历史脉络中揭示AI系统的价值内嵌与认识机制,评估AI的预测、决策,并将历史学提供的对过去记忆与事实的选择书写,对人类活动价值与意义的总结反思,通过数据构建与算法改进,贯注作用于AI系统,影响AI的走向。

以古代历史研究为例,可以看到AI与历史学者之间这种正在探索中的共同建构。对于历史研究工作的核心要素与基础工作,AI能发挥积极作用,同时历史学也有力量推动AI从数据与算法两方面改变现状、提升性能。

为了理解古代社会、探究人群生活,历史研究需要的史料搜集与处理技艺非常复杂,比如泥板、纸草、甲骨、金石、写本这些载体的文献修复,古汉语、古希腊文等多种文字的识别与释读,图像、雕塑、考古遗址的辨识、分类等。近年来,学者运用深度神经网络、卷积神经网络等深度学习技术,结合迁移学习等策略,贡献出了前沿成果。中国科学院团队提高了甲骨文字符的自动识别率;谷歌的模型Ithaca,能合理推断古希腊铭文的时间与地理归属范围;浙江大学团队实现了缀合敦煌写本的自动化流程;中国矿业大学团队发布敦煌壁画的MuralDH图像数据集,进行分类、修复。2024年初,机器学习从碳化的意大利赫库兰尼姆卷轴里,识别出了莎草纸符,提供了古希腊哲学的新史料。像这类具有原创性和影响力的工作,都是由包括历史学在内的领域专家与计算机科学家组成的跨学科团队完成,显示出AI对历史研究的来源,尤其是在多模态史料发掘、解析方面的效能。由于目前大多数的AI算法依赖英语等主流语种,偏重近现代的历史训练集,在将AI运用于古代语言的文本、图像与考古对象时,需要明显扩大数据的多样性和包容性,在使AI处理古代历史中非标准化的、异质的、不完整的资料时,也要同时推进算法的批判性创新,这都显示出历史学研究将是助力AI突破结构性限制的重要领域。

研究古代的学者,也可能遇到史料数量庞大或者类型复杂得难以把握,此时找寻到最合适的AI技术,不仅使研究得以展开,还能发现隐藏的事实,提出有解释价值的新问题。在一项针对15至17世纪欧洲史的研究中,学者需要考察359本天文学教科书,其中含有76000页文本、数万幅科学插图与天文表格。德国马普所的研究人员通过机器学习来识别文本间的联系,检测、分类与聚类这些插图和表格,历史学者则从数据中看到了以前不被注意的事实,即欧洲的科学知识传播并不受宗教改革的分裂影响,而是呈现出凝聚与同质化的形态。这一时段对应着中国历史上的明清时期,研究者们同样也面临着史料复杂烦琐、文献汗牛充栋的问题,对于在整理、分析与思考中如何运用AI系统有着迫切的需求。比如对于明清档案文献,中国人民大学团队提出了深度学习、人机协同的智能著录标引流程;对于地方志研究,中国社科院大学团队开发了专有工具,通过调用大语言模型的API端口,批量实现方志数据的多层次、多义性标注,以知识图谱进行可视化呈现与分析。这些尝试都希望能从明确的问题出发,探索以数据建设为核心、以算法呈现历史语境、具有透明性与可解释性的研究工作流程,以一种符合职业与专业的要求,来推进与AI的共构,使研究者把更多的时间和精力解放出来,真正用于历史学的创造性思考、深度解释以及价值反思。

在积极拥抱AI变化的历史学者中,很多人从数字人文、数字史学的兴起之时已经在讨论史学与AI的共生之道。在AI迅速发展、推理思考能力不断迭代的当下,相信还会有更多的历史学家主动了解AI运作的机制,视其为学术助手、影子同行,共同建构一种从思考、写作到交流、教育的史学工作新生态,这将是一场引人注目、面向未来的探索之旅。

(本文系国家社科基金重点项目“清史地理信息系统开发与研究”的阶段性成果)

相关文章:①游戏还是工具——生成式人工智能与历史模拟 ②人工智能在史学研究中并非无往不利

《光明日报》(2025年02月10日 14版)

来源: 光明网-《光明日报》

相关推荐

以文本的方式绘制简单的SVG流程图——flowchart.js

介绍flowchart.js是在浏览器和终端中运行的流程图DSL和SVG渲染。节点和连接是分别定义的,因此可以重复使用节点,并可以快速更改连接。也可以在DSL中对节点和连接器样式进行细微的更改。Git...

全国首套构网型SVG在木垒投运

中新网新疆新闻1月5日电(翟文辉)12月29日,全国首套构网型SVG在新疆木垒华电220千伏四十个井子汇集站并网,本项目是新疆电网继阿克陶构网型储能后又一次构网型支撑项目示范。为全面响应国家“双碳”...

Popmotion – 小巧,灵活的 JS 运动引擎

Popmotion是一个只有12KB的JavaScript运动引擎,可以用来实现动画,物理效果和输入跟踪。原生的DOM支持:CSS,SVG,SVG路径和DOM属性的支持,开箱即用。Popmoti...

零基础教你学前端——43、初识SVG

解决网站图标问题的最佳方案——SVG!SVG是一种基于XML语法的图像格式,英文全称是:ScalableVectorGraphics,即可缩放矢量图,是W3C的一项建议。我们用手机拍摄...

2.3 文件格式全解:PSD/JPG/PNG/SVG/GIF

2.3文件格式全解:PSD/JPG/PNG/SVG/GIF一、文件格式的核心意义文件格式是数字图像的存储规则,决定了:-信息保留程度(图层/透明度/动画)-压缩方式与画质损失-跨平台兼容性-...

vite v6.3.2 发布!HMR 优化+CSS 增强+稳定性提升,前端开发再提速!

前言:Vite6.3.2来了!2025年4月18日,Vite团队正式发布了v6.3.2版本!虽然是一个小版本更新,但修复了多个关键问题,并带来了性能优化和稳定性提升,让开发体验更丝滑!如果你还...

一篇文章带你了解SVG 蒙版(Mask)

SVG蒙版功能可将蒙版应用于SVG形状。蒙版可确定SVG形状的哪些部分可见,以及具有什么透明度。运行效果可以将SVG蒙版视为剪切路径的更高级版本。一、简单的蒙版代码解析:本示例使用ID=mask1定义...

SVG实现的流程图绘制

一、项目简介使用SVG技术实现的流程图绘制二、实现功能流程图块生成、连线、拖拽产生相应的xml和xpdl导入导出json数据放大缩小功能保存操作(选择、自动插入、开始结束、普通活动、子活动、块活动、路...

解锁国内 404 页面:Next.js 设置指南和 33 个有趣 SVG 资源分享

前言当我们访问网站时,如果访问到不存在的路径时,会出现404错误。为了避免给访问者带来不良体验,设计网站时通常会在页面上展示“404页面不存在”的提示,并引导用户进行返回首页等操作。因此在建立网...

交互设计师做好动画后,提交给开发的文档有哪些?

谢邀!简单的说一下自己的看法。首先从制作动画开始。目前制作动画的方式主要有:Gif动画视频动画Web动画,而Web动画又包括:CSS动画、JS动画(Canvas动画、原生JS动画API)、SVG动画等...

Motion for Vue:为Vue量身定制的强大动画库

在前端开发中,动画效果是提升用户体验的重要手段。Vue生态系统中虽然有许多动画库,但真正能做到高性能、易用且功能丰富的并不多。今天,我们要介绍的是MotionforVue(motion-v),...

Web开发人员的福音!8个实用的SVG工具

SVG可缩放矢量图形(ScalableVectorGraphics)是基于可扩展标记语言(XML),用于描述二维矢量图形的一种图形格式。SVG是W3C在2000年8月制定的一种新的二维矢量图形格式...

一键画波浪线、一键多图片调色?这3个网站好玩到停不下来

作为一个经常收集网站的PPT设计师,无意中发现了一些超级有趣的网站。只要你动手能力足够强,就一定会利用它做出创意作品。不说废话,直接进入主题。1、炫酷的光线绘画网站http://weavesilk.c...

vite 6.2.5 更新速递:告别SVG路径Bug,构建效率再提升!

Vite6.2.5更新公告2025年4月3日,Vite团队正式发布了Vite6.2.5版本!此次更新虽然是一个小版本迭代,但修复了一个关键问题,涉及SVG文件路径检查,对前端开发者尤...

DrawSVG – SVG 路径动画 jQuery 插件

jQueryDrawSVG使用了jQuery内置的动画引擎实现SVG路径动画,用到了stroke-dasharray和stroke-dashoffset属性。DrawSVG是完全...