



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
.3.4計算機中的信息編碼編碼的概念在日常生活中隨處可見,例如,學生證上的學號是一個編碼,每張人民幣紙幣上都有一個編碼。這兩個編碼中的前者是往往用十進制數表示,后者則是由十進制數和英文字母混合而成。下面詳細介紹各種不同類型的信息在計算機中采用二進制進行編碼的方法。西文字符的編碼在微機中對字符進行編碼,通常采用ASCII碼和Unicode編碼。(1)ASCII碼ASCII碼是AmericanStandardCodeforInformationInterchange(美國信息互換標準代碼)的簡稱,已經被國際標準化組織(ISO)指定為國際標準,稱為ISO646標準,適用于所有拉丁文字字母。標準ASCII碼采用7位二進制數來表示所有的大寫和小寫字母、數字0到9、標點符號,以及在美式英語中使用的特殊控制字符等128個字符。這128個字符可以分為95個可顯示/打印字符和33個控制字符兩類。在8個二進制位中,ASCII采用了7位(b0~b6)編碼,空閑最高位b7常用作奇偶校驗位。ASCII碼的字符編碼表共有24=16行,23=8列。低4位編碼b3b2b1b0用作行編碼,而高3位b6b5b4用作列編碼。標準ASCII碼字符集見表1。表1標準ASCII碼字符集低4位b3b2b1b0高3位b6b5b40000010100111001011101110000NULDLESP0@P`p0001SOHDC1!1AQaq0010STXDC2"2BRbr0011ETXDC3#3CScs0100EOTDC4$4DTdt0101ENQNAK%5EUeu0110ACKSYN&6FVfv0111BELETB'7GWgw1000BSCAN(8HXhx1001HTEM)9IYiy1010LFSUB*:JZjz1011VTESC+;K[k{1100FFFS,〈L\l|1101CRGS-=M]m}1110SORS.〉N^n~1111SIUS/?O_oDEL表1中的每個字符對應一個二進制編碼,每個編碼的數值稱為ASCII碼的值,例如,字母A的編碼為1000001B,即65D或41H。由于ASCII碼只有7位,在用一個字節保存一個字符的ASCII碼時,占該字節的低7位,最高位補0。可以看出,數字0~9的ASCII碼的值范圍是48~59,大寫字母的ASCII碼的值范圍是65~90,小寫字母的ASCII碼的值范圍是97~122,其順序與字母表中的順序是一樣的,并且同一個字母的大小寫ASCII碼的值相差32。(2)Unicode編碼擴展的ASCII碼所提供了256個字符,但用來表示世界各國的文字編碼顯然是遠遠不夠的,還需要表示更多的字符和意義,因此又出現了Unicode編碼。Unicode是國際組織制定的可以容納世界上所有文字和符號的字符編碼方案。它為每種語言中的每個字符設定了統一并且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本轉換、處理的要求。Unicode編碼自1994年公布以來已得到普及,廣泛應用于Windows操作系統、Office等軟件中。漢字的編碼漢字也是一種字符,也需要用二進制進行編碼才能被計算機接受。漢字是象形文字,有近60,000個左右的漢字,常用漢字就達7,000個左右。漢字的編碼處理較為復雜,需要對漢字信息進行轉換處理,主要經歷輸入、處理和輸出過程,具體處理的過程如圖3-6所示。首先是通過漢字輸入碼輸入漢字信息,計算機內部通過統一的編碼將輸入碼轉換為漢字的機內碼進行存儲和處理,最后通過字形碼將漢字輸出顯示。因此,對漢字信息的處理過程實際上是各種漢字編碼間的轉換過程,主要包括:漢字輸入碼、漢字機內碼、漢字地址碼、漢字字形碼。
圖1漢字信息處理系統的流程模型(1)漢字輸入碼漢字輸入碼是能通過鍵盤的字母、數字等直接把漢字輸入到計算機設計的編碼,常見的輸入編碼方式有數字編碼、拼音碼、字形編碼、混合編碼。數字編碼是用數字串代表一個漢字進行輸入,常用的是國際區位碼。區位碼是由區號(即行號)和位號(即列號)構成,我們用4位十進制數字表示一個區位碼,其中前2位表示區號,后2位表示位號。例如:“學”字的區號是49,位號是07,區位碼就是4907,用2個字節的二進制表示為:0011000100000111。拼音碼是以漢字拼音為基礎,以漢字的漢語拼音或其一定規則的縮寫形式為編碼元素的漢字輸入碼。常用的有QQ輸入法、搜狗拼音、智能全拼、微軟拼音、紫光拼音等。字型碼是用漢字的形狀進行編碼的漢字輸入碼。常見的有五筆輸入法。現在,為了提升輸入的速度,不斷涌現出很多新的輸入法,如語音輸入、手寫輸入和掃描輸入。(2)漢字機內碼漢字機內碼,我們又稱為漢字存儲碼或者內碼。當使用不同漢字輸入碼將漢字輸入到計算機內時,需要將漢字轉換為統一的漢字機內碼進行存儲、加工處理和傳輸。漢字機內碼是漢字最基本的編碼,都是由0和1表示的。常用的漢字機內碼的編碼方式有GB2312、BIG5、GBK、GB18030和國際標準字符集Unicode。(3)漢字地址碼
漢字地址碼是指漢字字庫中存儲漢字字形信息的邏輯地址碼。在漢字庫中,字形信息都是按一定順序連續存放的(一般按照標準漢字國標碼中漢字的排列順序進行存放),因此漢字地址碼絕大多數是連續有序的,且與漢字機內碼有對應關系,這樣漢字內碼到漢字地址碼的轉換也相對比較簡單。(4)漢字字形碼漢字字形碼又稱為漢字字模,是存放漢字的字形信息的編碼,它也與漢字內碼一一對應,用于漢字的輸出或顯示。每個漢字的字形碼都從預先存放在計算機的漢字庫中尋找得到。
漢字字形的描述有點陣字形和矢量表示法兩種。點陣字形法是把每個漢字都用一個16*16或24*24的點陣表示,通過每個排列的點的黑白顏色來描述一個漢字字型。矢量表示方式是通過曲線來描述漢字字形的輪廓特征,一般都采用數學方法描述漢字的輪廓曲線。數值編碼前面介紹了不同進制之間的轉換,對任何進制的數值,其絕對值都可以轉換成二進制數,這樣其他進制的數據就可以在計算機中表示了。在各種軟件編程語言中,數值型數據按存儲大小、表示形式與取值范圍的不同,又分為多種不同類型,比如數值型,浮點型(單精度型,雙精度型)和整型等。任何一個數在計算機內部都要被表示成二進制數,該二進制數叫作機器數,它是該數的真值。機器數有固定的位數,同時機器數是帶符號的,通常用最高位表示符號,0表示正,1表示負。在計算機內部,機器數的表示方法有原碼、反碼和補碼三種,最常用的是原碼和補碼兩種,原碼表示法比較直觀,補碼表示運算則比較簡單,在計算機中數值都是以補碼的方式存儲的。(1)原碼原碼表示法是在數值前面增加了一位表示符號位,符號位為0表示該數為正,符號位為1表示該數為負,正數該位為0,負數該位為1,其余位表示該數值的絕對值。如:真值為85和-85,其原碼為01010101和11010101。原碼表示法能比較直觀地表示機器數,但是原碼不能直接參加運算。當用原碼進行乘除操作時,可取其絕對值(尾數)直接運算,再按同號相乘除為正數,異號相乘除結果為負數的原則處理結果數的符號位即可,但對常用的加減運算操作,使用原碼表示卻極不方便,有可能會出錯,需要借助于補碼。(2)反碼反碼表示法是正數的反碼是其原碼本身,而負數的反碼是在原碼的基礎上,符號位不變,其余各位取反。在計算機內部使用反碼表示法可以化減為加,一般用于設置環境變量。真值為85和-85,其反碼分別是01010101和10101010。(3)補碼計算機內部,數值都是使用補碼來表示和存儲的。那什么是補碼呢?補碼表示法是正數的補碼是其原碼本身,而負數的補碼是在原碼的基礎上,符號位不變,其余各位取反,最后末位+1,即“反碼加1”。由此可以看出補碼是通
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蘭州工商學院《文本設計》2023-2024學年第二學期期末試卷
- 2025年江蘇省淮安市淮陰區高三第二輪復習測數學試題(文理)試卷含解析
- 2025年青島市高中學段校中考全國卷24省1月聯考丙卷物理試題含解析
- 吉林省長春市一五0中學2024-2025學年高三下學期第二次模擬考試歷史試題文試卷含解析
- 精神科護理核心制度
- 廣西南寧市第十四中學2025年高三下學期沖刺(二)英語試題含解析
- 西安健康工程職業學院《臨床聽力學實踐》2023-2024學年第二學期期末試卷
- 福建師范大學協和學院《全媒體運營》2023-2024學年第二學期期末試卷
- 2025年山西省高平市重點達標名校初三質量監測(四)物理試題含解析
- 崇左幼兒師范高等專科學校《資產評估實務與案例分析》2023-2024學年第一學期期末試卷
- 徐士良《計算機軟件技術基礎》(第4版)筆記和課后習題詳解
- 房屋建造過程課件
- 坯布檢驗標準及檢驗規范
- 帶壓堵漏、帶壓開孔作業安全管理制度
- (新教材)教科版二年級上冊科學 1.2 土壤 動植物的樂園 教學課件
- 采用冷卻塔變流量的中央空調冷卻水系統能效分解
- 航空航天技術概論
- 籃球比賽記錄表(上下半場)
- 畢業設計-太平哨水利樞紐引水式水電站設計
- 新云智能化管理系統運行管理標準
- 畢業設計(論文)-多功能平板道路清障車設計(拖拽車)
評論
0/150
提交評論