C編譯器入門~想懂低階系統從自幹編譯器開始~
  • 譯者序
  • 前言
    • 符號與規範
    • 本書的開發環境
    • 關於作者
    • 結束前言之前
  • 機械語言與組譯器
    • CPU 與記憶體
    • 什麼是組譯器
    • C程式和所對應的組合語言
      • 簡單的範例
      • 包含呼叫函式的範例
    • 本章小結
  • 創造計算機等級的語言
    • 第1步:創造能編譯1個整數的語言
    • 第2步:製作可以算加減法的編譯器
    • 第3步:加入標記解析器(tokenizer)
    • 第4步:改良錯誤訊息
    • 文法的記法與遞迴下降分析法
      • 將文法結構表示為樹(tree)
      • 以生成規則定義文法
      • 以 BNF 描述生成規則
      • 簡單的生成規則
      • 以生成規則描述運算子的優先順序
      • 包含遞迴的生成規則
      • 遞迴下降語法分析
    • 堆疊機
      • 堆疊機的概念
      • 編譯成堆疊機指令
      • 以x86-64實作堆疊機的方法
    • 第5步:製作可進行四則運算的編譯器
    • 第6步:單項加與單項減
    • 第7步:比較運算子
      • 修改標記解析器
      • 新的文法
      • 產生組合語言指令
  • 分離編譯與連結
    • 分離編譯
      • 分離編譯與其必要性
      • 標頭檔的必要性與其內容
      • 連結錯誤
      • 全域變數的宣告與定義
    • 第8步:分割檔案與修改 Makefile
      • 分割檔案
      • 修改 Makefile
  • 函式與區域變數
    • 第9步:1個字的區域變數
      • 堆疊上的變數空間
      • 修改標記解析器
      • 修改分析器
      • 左邊值與右邊值
      • 從任意的記憶體位址取得其值
      • 修改指令產生器
      • 修改主函式
    • 第10步:複數文字的區域變數
    • 第11步:return
    • 1973年的C編譯器
Powered by GitBook
On this page

Was this helpful?

  1. 函式與區域變數
  2. 第9步:1個字的區域變數

修改標記解析器

在了解變數該如何實作之後,我們緊接著來實作吧。但是突然就要實作任意長的變數有點太難了,所以在這步我們把變數限定在小寫1個字,變數a為 RBP-8、變數b為 RBP-16、變數c為 RBP-24,讓所有的變數以常駐方式存在。因為英文字母有26個字,函式被呼叫時我們把 RSP 往下推26×8也就是208個 bytes,保留所有1個字的變數空間。

馬上來實作看看吧。首先從標記解析器著手,在至今為止文法的元素以外,讓其可以對1個字的變數作標記解析。為此,我們得追加新的標記型態。變數名稱可以從str讀入,所以不需要在Token型中增加新的成員。最終,Token型如下所示:

enum {
  TK_RESERVED, // 符號
  TK_IDENT,    // 識別符號
  TK_NUM,      // 整數標記
  TK_EOF,      // 代表輸入結束的標記
} TokenKind;

修改標記解析器,讓其可以對小寫英文字母建立TK_IDENT型的標記。只要對標記解析器加上如下的if敘述即可:

if ('a' <= *p && *p <= 'z') {
  cur = new_token(TK_IDENT, cur, p++);
  cur->len = 1;
  continue;
}
Previous堆疊上的變數空間Next修改分析器

Last updated 5 years ago

Was this helpful?