链接器是如何一步步发明出来的?_如何使用连接器
myzbx 2025-09-03 05:31 6 浏览
在计算机编程的早期年代,你面临一个挥之不去的的噩梦。。。
你找了一个刚刚运行成功的程序仔细看了看:
; main.asm - 主程序start: ; 初始化 mov cx, 10 mov dx, 20 ; 调用math.asm中的add函数 call 0x1234 ; 这里的0x1234是add函数在内存中的绝对地址 ; 退出 mov ax, 0 int 21h
; math.asm - 数学函数模块add: ; 加法函数 mov ax, cx add ax, dx ret
你一眼就注意到main.asm中的那些数字了,0x1234和0x5678。
这些是函数在最终内存中的绝对地址,也是所有程序员的噩梦,因为这些地址都是程序员手动计算出来的!
例如,如果math.asm被加载到内存地址0x1000,而add函数在模块内的偏移是0x234,那么add的绝对地址就是0x1234。
这个过程不仅繁琐,而且极易出错,更糟糕的是维护问题。
你清楚地知道,如果程序员在math.asm的开头添加了一个新函数,会发生什么!
; math.asm - 修改后new_function: ; 新增的函数 ; 一些代码 retadd: ; 位置改变了! mov ax, cx add ax, dx ret
这个看似无害的修改会导致add函数的位置发生变化!它的偏移量增加了,绝对地址也随之改变。现在,main.asm中的call 0x1234指令将跳转到错误的位置!
程序员必须重新计算add函数的新地址并修改所有调用add的地方。
如果程序有数十个模块,数百个函数调用,这个过程将变成一场噩梦,每次修改代码,都可能引发一连串的地址更新工作。
于是你的开始思索,需要一种机制,能够自动处理这些地址绑定,让程序员们专注于代码逻辑而非地址计算,为实现这种机制就决不能在程序中使用绝对内存地址!
不使用内存地址使用啥呢?
此时你想到当你找喊一个人的时候直呼其名而不是喊这个人的经纬度坐标,对了!这里也可以使用名字而不是地址来引用函数和变量,想到这里符号(Symbol)概念诞生了。
是啊,为啥要用内存地址硬编码,程序员可以使用符号啊:
; main.asm - 使用符号名start: ; 初始化 mov cx, 10 mov dx, 20 ; 使用符号名而非硬编码地址 call add ; 使用符号名"add"而非0x1234 ; 退出 mov ax, 0 int 21h
这种方法的核心思想是:程序员只需关心名字(如add、print),而不必关心这些函数最终在内存中的确切位置。
这是一个巨大的抽象飞跃!
你设计的符号概念带来了2个关键优势:
减少错误:不再需要手动计算和更新地址,消除了一大类潜在错误。
简化维护:当函数位置变化时,只需保持符号名不变,调用代码无需修改。
最重要的是,符号为自动化解决依赖关系奠定了基础。
符号概念是很优雅,但问题是:如何确定符号名最终的内存地址呢?
显然这次需要有一个能够自动确定符号最终内存地址的工具,让程序员彻底摆脱地址计算的负担,到底该怎么做到呢?
要达到这个目的就不能让编译器直接生成机器码,而是把这个过程拆成两步:
编译器处理各个模块,但不必关心跨模块引用
根据各个模块提供的信息来确定符号最终的内存地址并合并所有的模块为一个最终可执行文件
就这样在你的设想中你把整个编程过程拆成了两步,第一步是编译、第二步你将其称之为链接,link。
第二步中各个模块提供的信息还是比较模糊,这个信息是什么,该怎么提供?
既然编译器不直接生成最终的机器码,那么就需要一种文件来承接这一阶段编译器的输出,这个用来记录编译器第一阶段输出的文件就是所谓的目标文件,Object File。
这个文件包含机器码,但不去确定引用的外部符号的内存地址:
call print
你把所有这样的符号收集起来记录来目标文件中,这就是所谓的重定位表(Relocation Table),标记代码中需要在链接时填充正确地址的位置,这就是所谓的重新定位,重定位。
同时这个文件记录模块定义的所有符号(函数、变量)及其相对位置,这就是所谓符号表(Symbol Table):记录模块定义的所有符号(函数、变量)及其相对位置。
它们可能长这样:
-- main.obj --代码段: 偏移 0x03: mov dx, 20 偏移 0x06: call ??? (需要重定位,调用add) 偏移 0x0B: mov bx, ax 偏移 0x0D: call ??? (需要重定位,调用print)符号表: start -> 偏移 0x00 (本模块定义,"我能提供什么")重定位表: 偏移 0x07: 需要add的地址 偏移 0x0E: 需要print的地址未解析引用: add (外部符号,“我需要什么”)print (外部符号,“我需要什么”)
目标文件的出现是一个关键突破,因为它:
分离了编译和链接:编译器只需关注单个模块的翻译,不必处理跨模块引用。
明确记录了依赖关系:每个模块清楚地表达了"我提供什么"(符号表)和"我需要什么"(未解析引用)。
为自动化链接提供了数据结构:重定位表明确标记了需要修正的地址位置。
现在, 你的任务就变得明确了:读取多个目标文件,解析它们的符号和依赖关系,然后将它们正确地"链接"在一起。
但如何实现这个链接过程?很明显,你需要实现两个核心算法:符号解析和重定位。
符号解析解决一个基本问题:将每个模块的"需求"与其他模块的"供给"匹配起来。
具体来说,你需要:
收集所有符号:遍历每个目标文件的符号表,建立一个全局符号字典,记录每个符号的定义位置。
检查未解析引用:对每个模块的未解析引用,在全局符号字典中查找其定义。
处理冲突和错误:如果一个符号有多个定义(冲突)或没有定义(未解析),生成适当的错误信息。
如果所有未解析引用都能在全局符号表中找到对应的定义,符号解析就成功了。否则,你的算法会生成一个错误,这就是后来的程序员熟悉的"undefined reference to..."。
符号解析解决了"符号供需匹配"问题,重定位的任务是:确定每个模块和符号在最终内存中的确切位置。
重定位过程包括:
内存布局规划:决定各个模块在最终内存空间中的排列顺序和基址。
地址计算:根据模块基址和符号在模块内的偏移,计算每个符号的最终绝对地址。
填充重定位条目:遍历每个模块的重定位表,将正确的地址填充到代码中的相应位置。
符号解析和重定位这两个步骤解决了模块化编程中最核心的问题:如何让分散在不同文件中的代码片段正确地找到并调用彼此。
至此,这两个核心算法的实现彻底解放了程序员,让他们不再需要手动计算和修改地址。
来源:码农的荒岛求生
编辑:未
转载内容仅代表作者观点
不代表中科院物理所立场
如需转载请联系原公众号
相关推荐
- 掌握JavaScript中的Call和Apply,让你的代码更强大、更灵活
-
在学习JavaScript时,你可能会遇到call和apply这两个方法。它们的作用其实很相似,都是用来调用函数并设置函数内部的this值,但它们的使用方式稍有不同。想象一下,你和朋友们一起拍照。ca...
- 性能调优方面,经常要优化跑的最慢的代码,教你一种快速的方法
-
在我们遇到性能问题的时候,很多时候需要去查看性能的瓶颈在哪里,本篇文章就是提供了多种常用的方案来监控函数的运行时间。1.time首先说明,time模块很多是系统相关的,在不同的OS中可能会有一些精度差...
- call和apply的实现方式_call和apply用法
-
call和apply的实现方式1、函数Function.call()的实现//第一步简单是实现call()varfoo={value:”1”,bar:function(){conso...
- 线上问题排查:接口超时_接口超时时间设置多少合适
-
最近就看到了一个非常厉害的关于“接口超时”问题排查的帖子,从应用排查到内核级别。虽然看到后面的时候我已经有点跟不上了,但是对于整个问题排查的过程还是比较清晰的。(细节不重要,排查思路,方向值得学习)问...
- javascript中的call方法的另一种实现方式-更接近原方法
-
上集我们说到对应的我们自己实现的call方法还是有一点纰漏,这里我们就解决它//一、预备知识(简单介绍)//1、Function.prototype.call()//语法:function....
- 链接器是如何一步步发明出来的?_如何使用连接器
-
在计算机编程的早期年代,你面临一个挥之不去的的噩梦。。。你找了一个刚刚运行成功的程序仔细看了看:; main.asm - 主程序start: &nb...
- Day59:回调(callback)函数_回调 callback
-
定义Acallbackisafunctionthatispassedasanargumenttoanotherfunctionandisexecutedafteri...
- 大促数据库压力激增,如何一眼定位 SQL 执行来源?
-
作者:京东科技王奕龙你是否曾经遇到过这样的情况:在大促活动期间,用户访问量骤增,数据库的压力陡然加大,导致响应变慢甚至服务中断?更让人头疼的是,当你试图快速定位问题所在时,却发现难以确定究竟是哪个业...
- 一键追欠料!WPS表格实战MRP欠料计算-7
-
昨天第6章内容主要聚焦于本报表的核心欠料运算。通过子件库存的引用以及累计需求的计算,计算出了子件的累计欠料。累计欠料的显示方式是按日期进行逐日累加,并不能清晰的看到每张订单欠料多少?所以在今日第7章的...
- Python教程(二十五):装饰器–函数的高级用法
-
今天您将学习什么什么是装饰器以及如何创建装饰器函数装饰器和类装饰器带参数的装饰器装饰器的实际应用真实世界示例:日志记录、性能监控、缓存、权限验证什么是装饰器?装饰器是Python中的一种...
- 在 Excel 日历制作中,尤其是动态日历方案,会用到的多个函数详解
-
在Excel日历制作中,尤其是动态日历方案,会用到多个核心函数。下面我将详细解析这些函数的作用、参数和使用技巧:核心日期函数1.DATE(year,month,day)作用:创建指定日期参...
- java高级用法之:在JNA中将本地方法映射到JAVA代码中
-
简介不管是JNI还是JNA,最终调用的都是native的方法,但是对于JAVA程序来说,一定需要一个调用native方法的入口,也就是说我们需要在JAVA方法中定义需要调用的native方法。对于JN...
- 14.4 查找与引用函数综合应用 - 下
-
一、使返回错误值以简化公式例提取一二三级科目名称在下图所示的科目代码表中,A列为科目代码,B列为对应科目名称。A列科目代码中长度为4的为一级代码,长度为6的为二级代码,长度为8的为三级代码。要求根据...
- 记一次酣畅淋漓的JavaScript逆向_js逆向webpack
-
背景介绍今天在写爬虫的练习题时遇到了这样一个难题:目标资源是一个图片的url,但是不同于以往的情况,我在http响应记录里搜索这个图片的url,发现并不能搜到。从逻辑上来讲,这个url被展示到浏览器上...
- 「Postman」测试(Tests)脚本编写和断言详解
-
测试确认您的API按预期工作,服务之间的集成运行可靠,并且新开发没有破坏任何现有功能。您可以使用JavaScript为PostmanAPI请求编写测试脚本。当您的API项目出现问题时...
- 一周热门
- 最近发表
- 标签列表
-
- HTML 简介 (30)
- HTML 响应式设计 (31)
- HTML URL 编码 (32)
- HTML Web 服务器 (31)
- HTML 表单属性 (32)
- HTML 音频 (31)
- HTML5 支持 (33)
- HTML API (36)
- HTML 总结 (32)
- HTML 全局属性 (32)
- HTML 事件 (31)
- HTML 画布 (32)
- HTTP 方法 (30)
- 键盘快捷键 (30)
- CSS 语法 (35)
- CSS 轮廓宽度 (31)
- CSS 谷歌字体 (33)
- CSS 链接 (31)
- CSS 定位 (31)
- CSS 图片库 (32)
- CSS 图像精灵 (31)
- SVG 文本 (32)
- 时钟启动 (33)
- HTML 游戏 (34)
- JS Loop For (32)