標準解讀

《GB 18030-2022 信息技術 中文編碼字符集》與《GB 18030-2005 信息技術 中文編碼字符集》相比,在多個方面進行了更新和完善。具體變更包括但不限于以下幾個方面:

首先,新版標準對字符集進行了擴展,增加了更多的漢字和符號,以滿足現代信息技術發展對于中文信息處理的需求。新增加的內容不僅涵蓋了更多古籍文獻中使用的罕用字,也包含了部分少數民族文字以及一些專業領域內使用的特殊符號。

其次,《GB 18030-2022》調整了部分原有字符的位置或屬性定義,使得整個字符集結構更加合理、科學。比如,針對某些歷史遺留問題進行了修正,確保每個字符都有其唯一且正確的編碼位置。

此外,新版本還加強了與其他國際標準(如Unicode)之間的兼容性考慮。通過優化映射關系,提高了GB 18030與Unicode之間轉換時的數據一致性,便于跨平臺交流與共享。


如需獲取更多詳盡信息,請直接參考下方經官方授權發布的權威標準文檔。

....

查看全部

  • 現行
  • 正在執行有效
  • 2022-07-19 頒布
  • 2023-08-01 實施
?正版授權
GB 18030-2022信息技術中文編碼字符集_第1頁
GB 18030-2022信息技術中文編碼字符集_第2頁
GB 18030-2022信息技術中文編碼字符集_第3頁
GB 18030-2022信息技術中文編碼字符集_第4頁
免費預覽已結束,剩余800頁可下載查看

下載本文檔

GB 18030-2022信息技術中文編碼字符集-免費下載試讀頁

文檔簡介

ICS35040

CCSL.71

中華人民共和國國家標準

GB18030—2022

代替GB18030—2005

信息技術中文編碼字符集

Informationtechnology—Chinesecodedcharacterset

2022-07-19發布2023-08-01實施

國家市場監督管理總局發布

國家標準化管理委員會

GB18030—2022

目次

前言

…………………………Ⅰ

范圍

1………………………1

規范性引用文件

2…………………………1

術語和定義

3………………1

字匯

4………………………2

總體結構

5…………………2

字符的排列順序

6…………………………4

碼位分配

7…………………4

部分字符和代碼的說明

8…………………7

實現的級別

9………………7

附錄規范性雙字節字符表

A()…………9

附錄規范性表意文字描述符

B()………………………91

附錄規范性四字節字符表

C()…………92

附錄資料性部分字符和代碼的說明

D()……………546

附錄資料性通用規范漢字表漢字的代碼位置

E()《》………………549

參考文獻

……………………743

GB18030—2022

前言

本文件按照標準化工作導則第部分標準化文件的結構和起草規則的規定

GB/T1.1—2020《1:》

起草

。

本文件代替信息技術中文編碼字符集與相比除結構調整

GB18030—2005《》,GB18030—2005,

和編輯性改動外主要技術變化如下

,:

增加了本文件適用對象見第章

a)(1);

在雙字節編碼區更改了個豎排標點和個漢字構件所對應的代碼位置并刪

b)108GB/T13000,

除了個重復編碼的漢字構件和個重復編碼的漢字見附錄年版的附錄

69(D,2005A);

在四字節編碼區更改了個代碼位置見附錄年版的附錄

c)18GB/T13000(D,2005D);

在四字節編碼部分增加了統一漢字新增的個漢字見附錄

d)0x82358F33~0x82359636CJK66(C);

在四字節編碼部分增加了統一漢字擴充的個漢字

e)0x9835F738~0x98399E36CJKC4149

見附錄

(C);

在四字節編碼部分增加了統一漢字擴充的個漢字見

f)0x98399F38~0x9839B539CJKD222(

附錄

C);

在四字節編碼部分增加了統一漢字擴充的個漢字

g)0x9839B632~0x9933FE33CJKE5762

見附錄

(C);

在四字節編碼部分增加了統一漢字擴充的個漢字見

h)0x99348138~0x9939F730CJKF7473(

附錄

C);

在四字節編碼部分增加了康熙部首個見附錄

i)0x81398B32~0x8139A035214(C);

在四字節編碼部分增加了個西雙版納新傣文字符見附錄

j)0x8134F932~0x8135843783(C);

在四字節編碼部分增加了個西雙版納老傣文字符見附錄

k)0x81358B32~0x81359933127(C);

在四字節編碼部分增加了個傈僳文字符見附錄

l)0x82369535~0x82369A3248(C);

在四字節編碼部分增加了個蒙古文符號見附錄

m)0x9034C538~0x9034C73013BIRGA(C);

在四字節編碼部分增加了個滇東北苗文字符見附錄

n)0x9232C636~0x9232D635149(C);

刪除了附錄追加的漢字及部首部件見年版的附錄

o)“/”(2005C);

增加了實現的級別一章見第章

p)“”(9);

增加了資料性附錄通用規范漢字表漢字的代碼位置見附錄

q)“《》”(E)。

請注意本文件的某些內容可能涉及專利本文件的發布機構不承擔識別專利的責任

。。

本文件由中華人民共和國工業和信息化部提出并歸口

。

本文件及其所代替文件的歷次版本發布情況為

:

年首次發布為年第一次修訂

———2000GB18030—2000,2005;

本次為第二次修訂

———。

GB18030—2022

信息技術中文編碼字符集

1范圍

本文件規定了信息技術用的中文圖形字符及其二進制編碼的十六進制表示

本文件適用于中文和其他文字圖形字符信息的處理交換存儲傳輸顯現輸入和輸出

、、、、、。

本文件適用于為具備中文和其他文字圖形字符信息化處理及交換功能的技術類產品包括但不限

,

于以輸入法光學字符識別編輯校對機器翻譯語音合成文字轉寫智能寫作等為代表的軟

、(OCR)、、、、、

件產品以及以計算機通信終端設備電子書閱讀器學習機等為代表的硬件產品

,、、、。

2規范性引用文件

下列文件中的內容通過文中的規范性引用而構成本文件必不可少的條款其中注日期的引用文

。,

件僅該日期對應的版本適用于本文件不注日期的引用文件其最新版本包括所有的修改單適用于

,;,()

本文件

。

信息交換用漢字編碼字符集基本集

GB/T2312—1980

信息處理信息交換用八位代碼結構和編碼規則

溫馨提示

  • 1. 本站所提供的標準文本僅供個人學習、研究之用,未經授權,嚴禁復制、發行、匯編、翻譯或網絡傳播等,侵權必究。
  • 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打印),因數字商品的特殊性,一經售出,不提供退換貨服務。
  • 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質量問題。

評論

0/150

提交評論