C編譯器入門~想懂低階系統從自幹編譯器開始~
  • 譯者序
  • 前言
    • 符號與規範
    • 本書的開發環境
    • 關於作者
    • 結束前言之前
  • 機械語言與組譯器
    • CPU 與記憶體
    • 什麼是組譯器
    • C程式和所對應的組合語言
      • 簡單的範例
      • 包含呼叫函式的範例
    • 本章小結
  • 創造計算機等級的語言
    • 第1步:創造能編譯1個整數的語言
    • 第2步:製作可以算加減法的編譯器
    • 第3步:加入標記解析器(tokenizer)
    • 第4步:改良錯誤訊息
    • 文法的記法與遞迴下降分析法
      • 將文法結構表示為樹(tree)
      • 以生成規則定義文法
      • 以 BNF 描述生成規則
      • 簡單的生成規則
      • 以生成規則描述運算子的優先順序
      • 包含遞迴的生成規則
      • 遞迴下降語法分析
    • 堆疊機
      • 堆疊機的概念
      • 編譯成堆疊機指令
      • 以x86-64實作堆疊機的方法
    • 第5步:製作可進行四則運算的編譯器
    • 第6步:單項加與單項減
    • 第7步:比較運算子
      • 修改標記解析器
      • 新的文法
      • 產生組合語言指令
  • 分離編譯與連結
    • 分離編譯
      • 分離編譯與其必要性
      • 標頭檔的必要性與其內容
      • 連結錯誤
      • 全域變數的宣告與定義
    • 第8步:分割檔案與修改 Makefile
      • 分割檔案
      • 修改 Makefile
  • 函式與區域變數
    • 第9步:1個字的區域變數
      • 堆疊上的變數空間
      • 修改標記解析器
      • 修改分析器
      • 左邊值與右邊值
      • 從任意的記憶體位址取得其值
      • 修改指令產生器
      • 修改主函式
    • 第10步:複數文字的區域變數
    • 第11步:return
    • 1973年的C編譯器
Powered by GitBook
On this page

Was this helpful?

  1. 分離編譯與連結
  2. 分離編譯

全域變數的宣告與定義

雖然我們的編譯器還沒有全域變數,所以這節不會出現對應全域變數的組合語言指令作為範例,但是全域變數在組語階段和函式幾乎是一樣的。因此和函式一樣,全域變數也有分宣告和定義。所以如果變數本體出現在複數C程式檔中的話,通常會報連結錯誤。

全域變數預設是放在不可執行的記憶體區域內,所以要跳到該位址的話程式會發生記憶體區段錯誤(segment fault)然後崩潰(crash),但除此之外,資料和程式本質上是沒有不同的。執行時可以把函式作為資料像全域變數那樣讀取,也可以把記憶體的屬性改成可執行,跳躍到資料的位址,把資料作為程式執行。

函式和全域變數兩方本質上都只是記憶體裡的資料,我們實際用一段程式來確認看看吧。底下的程式是把main這個識別碼定義為全域變數。main的內容為x86_64的機械碼:

char main[] = "\x48\xc7\xc0\x2a\x00\x00\x00\xc3";

把上述的C程式碼存成 foo.c 後編譯,使用objdump確認看看其內容吧。objdump預設是顯示為16進制,加上-D參數就可以強制把檔案作為程式反組譯:

$ gcc -c foo.c
$ objdump -D -M intel foo.o
Disassembly of section .data:

0000000000000000 <main>:
   0:   48 c7 c0 2a 00 00 00    mov    rax,0x2a
   7:   c3                      ret

預設把資料放在不可執行區域的作法,可以在編譯時加上-Wl,--omagic參數來變更。現在來使用這個參數生成可執行檔:(譯註:譯者在 Windows 10下使用 WSL 的 Debian 無法成功完成此操作,請使用安裝 Linux 發行版的電腦或是虛擬機器來操作。)

gcc -static -Wl,--omagic -o foo foo.o

函式和變數都被組譯變成單純的標籤,屬於同一個命名空間(namespace),連結器在整合複數目標檔的時候就不會在意誰是資料誰是函式了。因此main在C的標籤就算被定義為資料,也可以像main是函數的時候一樣成功連結。

執行看看生成出來的檔案吧:

$ ./foo
$ echo $?
42

如上所述,正確傳回了42。main這個全域變數的內容被作為程式執行了。

在C的文法中,全域變數加上extern就會變成宣告。底下是int型態全域變數foo的宣告:

extern int foo;

要寫包含foo的程式時,就要把這行寫在標頭檔。然後,在某個C程式檔中要定義foo,底下為foo的定義:

int foo;

此外,C語言中在初始化的時候全域變數會被初始化為0,和用0或{0, 0, ...}、"\0\0\0\0..."來進行初始化是一樣的意思。

像int foo = 3這樣寫初始值的時候,請只在定義寫初始值。宣告只是為了告訴編譯器型態,不需要寫具體的初始值。編譯器看到全域變數的宣告也不會輸出指令,不需要知道其內部究竟是被初始化成什麼樣。

省略初始值的情況下,全域變數的定義和宣告就只差在extern而已,雖然外表很像,但是宣告和定義是不同的東西。這部份概念請好好在此節區分清楚。

小知識:連結器的歷史

連結器能把複數片斷的機械語言寫成的處理流程統整成1個程式的功能,在電腦發展的初期就已經被需要。有紀錄顯示(註)1947年John Mauchly(最早的數位電腦,ENIAC的計劃領導人),就已經有把從磁帶讀進的子程式做重新定位,統整成1個程式的程式。

就算在最早期的電腦,就希望汎用的子處理流程可以只寫1次,然後可以使用在各式各樣的程式中;而要做到這件事,就需要可以組合程式片斷生成可執行程式的連結器。在1947年,還沒有組合語言,是直接寫機械碼的年代,所以其實對程式設計師來說,連結器這個程式的需求比組合語言還要更為優先。

Linkers and Loaders, ISBN 978-1558604964, John R. Levine (1999) 1.2章

Perhaps surprisingly, these two basic linker functions — relocation and library search — appear to predate even assemblers, as Mauchly expected both the program and subprograms to be written in machine language.

Previous連結錯誤Next第8步:分割檔案與修改 Makefile

Last updated 5 years ago

Was this helpful?