C編譯器入門~想懂低階系統從自幹編譯器開始~
  • 譯者序
  • 前言
    • 符號與規範
    • 本書的開發環境
    • 關於作者
    • 結束前言之前
  • 機械語言與組譯器
    • CPU 與記憶體
    • 什麼是組譯器
    • C程式和所對應的組合語言
      • 簡單的範例
      • 包含呼叫函式的範例
    • 本章小結
  • 創造計算機等級的語言
    • 第1步:創造能編譯1個整數的語言
    • 第2步:製作可以算加減法的編譯器
    • 第3步:加入標記解析器(tokenizer)
    • 第4步:改良錯誤訊息
    • 文法的記法與遞迴下降分析法
      • 將文法結構表示為樹(tree)
      • 以生成規則定義文法
      • 以 BNF 描述生成規則
      • 簡單的生成規則
      • 以生成規則描述運算子的優先順序
      • 包含遞迴的生成規則
      • 遞迴下降語法分析
    • 堆疊機
      • 堆疊機的概念
      • 編譯成堆疊機指令
      • 以x86-64實作堆疊機的方法
    • 第5步:製作可進行四則運算的編譯器
    • 第6步:單項加與單項減
    • 第7步:比較運算子
      • 修改標記解析器
      • 新的文法
      • 產生組合語言指令
  • 分離編譯與連結
    • 分離編譯
      • 分離編譯與其必要性
      • 標頭檔的必要性與其內容
      • 連結錯誤
      • 全域變數的宣告與定義
    • 第8步:分割檔案與修改 Makefile
      • 分割檔案
      • 修改 Makefile
  • 函式與區域變數
    • 第9步:1個字的區域變數
      • 堆疊上的變數空間
      • 修改標記解析器
      • 修改分析器
      • 左邊值與右邊值
      • 從任意的記憶體位址取得其值
      • 修改指令產生器
      • 修改主函式
    • 第10步:複數文字的區域變數
    • 第11步:return
    • 1973年的C編譯器
Powered by GitBook
On this page

Was this helpful?

  1. 創造計算機等級的語言
  2. 文法的記法與遞迴下降分析法

將文法結構表示為樹(tree)

Previous文法的記法與遞迴下降分析法Next以生成規則定義文法

Last updated 5 years ago

Was this helpful?

實作程式語言的分析器時,輸入為扁平的標記列,而輸出為表示巢狀結構的樹式非常常見的作法。本書的構造也是如此。

C語言的if或while文法可以是巢狀的,也很適合用樹結構來表現此類架構。

算式中,有括號內必須先計算、先乘除後加減的結構。這樣的結構乍看之下可能不像樹結構,但是用樹來表示的話可以非常簡單地代表算式的結構。舉例來說 1*(2+3)可以想成用底下的樹來表示:

我們從最邊緣照順序開始計算的話,上述的樹,可以代表1乘上2+3的算式。也就是說,上述的樹是以樹的結構代表了 1*(2+3)的具體計算順序。

再用一個例子來說明。以下式表示7-3-3的樹:

上述的樹是以樹的結構表達「減法必須從左至右計算」規則的結果。也就是說,上述的樹是代表(7-3)-3 = 1而不是7-(3-3) = 7。如果是後者的話,其代表的樹應該是右邊會比較深,而不是左邊。

必須從左至右計算的運算子為「左結合」運算子,而必須從右邊開始計算的運算子叫作「右結合」運算子。在C裡,除了=(代入)之外,大部分的運算子都是左結合。

以樹來表達的話,加深樹的深度可以表達任意長度的算式。底下的樹為代表1*2+3*4*5的樹。

上述的樹叫作「語法樹」(syntax tree)。其中,去除分組用的括號等冗長的元素,儘可能精減的語法樹稱為「抽象語法樹」(abstract syntax tree, AST)。上述的語法樹都可以轉成抽象語法樹。

抽象語法樹是編譯器的內部結構,可以依據實作上的方便來定義。但像是加法或乘法等算術運算子都是定義為左邊和右邊兩邊計算,採用二分樹比較自然。但是,如函式引數等照順序執行、可以有任意長度的要素,則是用可以表示所有要素的扁平樹結構比較自然。

語法分析的目標就是建立抽象語法樹。編譯器首先會進行語法分析,把輸入的標記列轉換成抽象語法樹,再把抽象語法樹轉換成組合語言指令。

表示1*(2+3)的樹
表示7-3-3的樹
代表1*2+3*4*5的樹