以 BNF 描述生成規則
BNF(Backus–Naur form)和其延伸出來的 EBNF(Extended BNF)是用來簡潔清晰描述生成規則的一個方法。本書會使用 EBNF 來說明 C 的文法。本結會先說明 BNF,然後說明 EBNF 所延伸的部份。
BNF 以A = α₁α₂⋯
的形式來描述生成規則。這代表以把A
展開成為α₁α₂⋯
的意思。為0個以上的符號列,可以包含無法再展開的符號、和可以再展開(位於某條生成規則等號左邊)的符號。
無法再展開的符號就稱為「終端符號」(terminal symbol),可以再展開(位於某條生成規則等號左邊)的符號稱為「非終端符號」(nonterminal symbol)。像這樣以生成規則來定義的文法一般稱為「上下文無關文法」(context free grammar)。
非終端符號可以對應到複數條的生成規則。舉例來說有A = α₁
和A = α₂
兩條規則時,A可以展開成α₁
或α₂
都是正確的。
生成規則的右邊可以為空,這類的規則會把左邊的符號展開成長度為0的符號列。但是,省略右邊的話在字面上會顯的不好讀懂,所以一般 BNF 的規定這類情況會在右邊寫上代表什麼都沒有的符號ε
(epsilon)。本書也使用這個規定記法。
字串以雙引號寫成像"foo"
這樣。字串為終端符號。
以上就是基本的 BNF 規則。而 EBNF 則是在 BNF 的規則之上,使用以下符號來更簡潔地描述複雜的規則:
寫法 | 意思 |
| 重複0次以上 |
|
|
|
|
| 分組 |
舉例來說,A = ("fizz" | "buzz")*
中,A
為"fizz"
或"buzz"
重複0次以上的字串。也就是可以展開為:
""
"fizz"
"buzz"
"fizzfizz"
"fizzbuzz"
"buzzfizz"
"buzzbuzz"
"fizzfizzfizz"
"fizzfizzbuzz"
⋯⋯
的其中一個。
EBNF | 對應的BNF |
|
|
|
|
|
|
|
|
舉例來說使用A = αA
和A = ε
的生成規則從A
生成句子ααα
時,展開的順序為A → αA → ααA → αααA → ααα
。
像這樣,*
和?
這類寫法其實只是捷徑而已,但是越簡潔的寫法越好懂,一般來說,能寫得簡潔就不會用較長的寫法。
Last updated