BIG-5碼介紹

1.簡介

BIG-5碼,係由資策會於1984年策劃制定,宗旨原是儘量不使用到控制碼範圍,並配合國人自制的五大(BIG-5)套裝軟體。由於委託民間設計,導致初期的BIG-5碼並不能使用五大套裝軟體。雖然如此,市面上絕大多數的套裝軟體都是在BIG-5內碼系統發展出來的,因此目前市面上有2-3個BIG-5碼版本,對使用者來說很難明白其中差異,所以在2003年由財團法人中文數位化技術推廣基金會接受經濟部標準檢驗局委託,召集國內業者代表、專家和學者,就BIG-5編碼字元表原始版本和各主要業界版本予以重整之最新版本,其排列規則說明如下:

2.BIG-5碼的字集
BIG-5碼系統為兩位元組之內碼系統,共可定義19782個字碼,其高、低位元組的範圍如下:

高位元組 A1H ~ FEH (*126)
8EH ~ A0H
81H ~ 8DH
低位元組 40H ~ 7EH (*157)
A1H ~ FEH

在本系統中,我們在上述的範圍內,規劃出標準字、特殊符號及使用者造字的區域,分別說明如下:

☆標準字(STDFONT)
  使用範圍 字數 保留範圍 字數
常用字 A440~C67E 5401 C6A1~C8FE 408
次常用字 C940~F9D5 7652 F9D6~F9FE 41
合 計

13053

449

※標準字中:兀(A461、C94A[刪除])與 嗀(DCD1、DDFC[刪除]) 兩個字重碼
※BIG5-ETen 與CP950中的倚天字使用次常用字保留範圍共41字

☆特殊符號(SPCFONT、SPCFSUPP)

1.各種符號區(SPCFONT)

  使用範圍 字數 保留範圍 字數
標準字 A140~A3BF 408 --------- ---
控制碼 A3C0~A3E0 33 A3E1~A3FE 30
合 計

411

30

※CP950的歐元符號(€)使用控制碼保留範圍A3E1位置

2.罕用符號區(SPCFSUPP)

  使用範圍 字數 保留範圍 字數
標準字 C6A1~C8FE 408 --------- ---
合 計

408

※BIG5-ETen中的倚天擴充字使用罕用符號區C6A1~C8D3範圍,內容有日文假名、俄文等特殊符號
※BIG5-2003中取消 〃(C6DE)、仝(C6DF)以及BIG5-ETen中C7F3~C8D3範圍所定義的俄文與特殊符號

☆使用者造字(USRFONT)
  使用範圍 字數 保留範圍 字數
第一段 FA40~FEFE 785 --------- ---
第二段 8E40~A0FE 2983 --------- ---
第三段 8140~8DFE 2041 --------- ---
合 計

5809

 

3.各種BIG5碼的比較

台灣地區所使用的BIG5碼主要版本:

  說明
BIG5-1984 最早由資策會所定的版本
BIG5-ETen 倚天版本
CP950 微軟所使用的版本
BIG5-2003 2003年由財團法人中文數位化技術推廣基金會接受經濟部標準檢驗局委託,召集國內業者代表、專家和學者,就BIG-5編碼字元表原始版本和各主要業界版本予以重整之最新版本
BIG5-IBM IBM所使用的版本
BIG5-2003與各版本BIG5碼比較表:
版本 BIG5-2003 BIG5-1984 BIG5-ETen Microsoft-CP950 BIG5-IBM
使用者造字區
(8140 - A0FE)
符號區
(A140 - A2CE)
全形英文字母
(A2CF - A343)
全形希臘字母
(A344 - A373)
注音符號
(A374 - A3BF)
控制符號
(A3C0 - A3E0)
歐元符號
(A3E1)
保留
(A3E2 - A3FE)
常用字
(A440 - C67E)
數字符號
(C6A1 - C6BE)
部首
(C6BF - C6D7)
罕用符號
(C6D8 - C6E6)
日文平假名
(C6E7 - C77A)
日文片假名
(C77B - C7F2)
保留
(C7F3 - C8FE)

(C7F3-C8D3)

有*
次常用字
(C940 - F9D5)
七個倚天外字集的擴充字
(F9D6 - F9DC)
表格符號
(F9DD - F9FE)
使用者造字區和新常用字
(FA40 - FEFE)

*:僅編碼(C7F3 - C878)、(C8CD-C8D3)。

BIG-5碼使用範圍表

image

出處:全字庫 http://www.cns11643.gov.tw/AIDB/encodings.do

重要度:
文章分類:
電腦標籤:

發表新回應