CPU 與記憶體

組成電腦的成員，大概可以分為 CPU 與記憶體。記憶體就是保存資料的裝置，而 CPU 則是讀寫那些記憶體的資料並一邊運算著什麼的裝置。概念上來說，CPU 把記憶體視為可隨處讀寫的一個巨大的、由位元組（byte）構成的陣列（array）。當 CPU 想要存取記憶體的時候，必須指定他想存取第幾個位元組的記憶體位置，這個「第幾個」的數值就是「記憶體位址（address）」。舉例來說，「從位置16開始讀取8個位元組」，用陣列的方式來看的話就是，「讀取記憶體第16個位元組開始讀8個位元組分的資料」的意思。同樣的意思也可以表達成「從16號開始讀8個位元組的資料」。（譯註：這邊「16號」是地址的門牌號碼的意思，原文是寫「16番地」，是日本地址的單位。讀者可以把記憶體位址想成就像是找尋地址的感覺。）

CPU 執行的程式與其所用到的資料，都放在記憶體裡。CPU 會將「現在執行中的指令的記憶體位址」記在 CPU 裡，再從該位址把指令讀出來並執行，然後再讀出下一行、再執行。執行中指令被稱為「程式計數器」（Program Counter，PC）或「指令位址指標」（Instruction Pointer，IP）。CPU 所執行的程式的格式則被稱為「機械語言」。

程式計數器不一定都是一直線往下找接下來的指令的。CPU 可以使用叫做「分支指令」的指令，讓程式計數器跳到下一個指令以外的任意指令。if 或是迴圈等程式語言的語法就是這樣時做出來的。設定程式計數器到下一個指令以外的操作被稱為「跳躍」（jump）或是「分支」（branch）。

CPU 除了程式計數器之外，還持有少數保存資料的空間。例如 Intel 或 AMD 的處理器，就有16個可以保存64位元長的整數資料的空間。這些空間被稱之為「暫存器」（register）。從 CPU 的角度來看，記憶體是外部裝置，存取起來稍嫌費時；暫存器則是在 CPU 內部，存取起來沒有延遲時間。

許多的 CPU 指令都是使用兩個暫存器保存的數值來進行某些運算，再把運算的結果寫回（譯註：其中一個）暫存器的格式。所以在執行程式的時候，CPU 會從記憶體將資料讀取到暫存器中，在暫存器之間進行運算之後，再把運算的結果寫回記憶體。

某個特定的機械語言的集合被叫做「指令集」（instruction set）。指令集不只一種，不同CPU可以自由設計。但是因為不能執行不相容機械語言的程式，所以指令集的種類並不多。PC 上，Intel 或是相容晶片設計廠商的 AMD 使用的指令集被稱為 x86-64。雖然 x86-64 是很主流的指令集，但也不是獨佔市場。像 iPhone 或 Android 就是使用叫做 ARM 的指令集。

小知識：x86-64 指令集的由來

x86-64 指令集又被稱作 AMD64、Intel 64 或 x64。之所以這一個指令集有這麼多名字，背後是有其歷史背景因素在的。

x86 指令集在1978年由 Intel 所制定，但是將其擴充為64位元的卻是 AMD。在2000年左右，64位元處理器處理器的需求與日俱增，當時 Intel 傾全公司之力推動 Itanium 這個全新的指令集，所以刻意不去採用可能會與之競爭的64位元版本 x86 指令集。AMD 則是抓住了這個機會制定並公開了64位元版的 x86 規格，那就是 x86-64 指令集。之後由於 AMD 的品牌行銷策略，把 x86-64 改名為 AMD64。

之後，Itanium 在市場上確定失敗之後，Intel 也只剩下製作64位元版 x86 的這一選項了。在當時 AMD 已經推出了一定數量的 x86-64 的晶片了，事到如今想要制定不一樣的指令集也很困難，Intel 只好採用與 AMD 相容的指令集。也有傳聞微軟在當時也為了保持相容性，施加了一些壓力。當時的 Intel 採用和 AMD64 幾乎一樣的指令集，命名為 IA-32e。之所以不是叫64而是 IA-32e（Intel Architecture 32 extensions）也可以看出 Intel 還是把 Itanium 放在64位元戰略的中心，不願意面對指令集失敗的事實。在Intel 完全放棄 Itanium 之後，便把 IA-32e 改成 Intel 64 這個比較正常的名字了。而微軟嫌 x86-64 太長，改以 x64 稱呼 x86-64 指令集。

上述種種理由，便是 x86-64 會有這麼多名字的原因。

在開源的世界裡，大家比較偏好沒有放進任一家公司名字的 x86-64 這個稱呼，本書也一律使用 x86-64 這個名字。

Previous機械語言與組譯器 Next什麼是組譯器

Last updated 6 years ago

hashtag小知識：x86-64 指令集的由來

小知識：x86-64 指令集的由來