'中文操作系統——漢字操作系統概述'

"
"
中文操作系統——漢字操作系統概述

一、漢字操作系統產生的背景

漢字處理是國內包括稅務系統常規信息處理的重要內容。MS-DOS是西文操作系統,不具有輸入/輸出漢字的能力,因此,若要進行漢字處理,必須改造和擴充西文DOS的能力。 早在70年代,我國就開始對漢字信息處理技術進行研究並取得了一定成果。進入80年代後,由於微機的發展,促使漢字信息處理有了重大突破,並研製成功了第一個漢字操作系統,定名為CCDOS。這是由原電子工業部第六研究所在PC-DOS的基礎上為IBM-PC及其兼容機開發的操作系統。

隨著計算機的發展,漢字系統已經歷了三代,最早的CCDOS漢字系統,其基本滿足漢字信息處理的要求,但處理速度慢,點陣字模不美觀等。發展到第二代,出現了UCDOSSUPER-CCDOS 2.13等,它們在處理速度上有了很大提高,也有了較為精美的漢字字庫。到了第三代,漢字系統已能支持直接寫屏,如UCDOS 5.0、CXDOS 6.0、天匯 3.0等。這樣,對西文軟件無須漢化便能處理漢字了。另外,WINDOWS除了使用中文WINDOWS之外,也可用西文WINDOWS再在其上運行漢字系統解決漢字問題,如中文之星、四通立方RichWin for Windows系列等。這些漢字系統字庫更精美、更繁多,功能更強大,使中文信息處理更加迅捷便利。

二、 漢字操作系統如何處理漢字的輸入、存儲和輸出

1.漢字的輸入

要進行漢字輸入首先要解決漢字的編碼問題,主要是漢字在機內如何表示。通常每個西文字符只佔一個字節的存儲區。但由於漢字的數目眾多(屬於大字符集),因此需要採取不同的表示方法。

為統一標準,1981年我國公佈了《通信漢字字符集及其漢字交換標準》(GB2312-80)。在此方案中,共收錄了6763個常用漢字,其中較常用的3755個漢字組成一級字庫,按拼音順序排列;其餘3007個漢字組成二級字庫,按部首順序排列。有了這個基本集,就可對這一定數量漢字集內的每個漢字編成相應的一組英文或數字代碼,使其能直接使用西文鍵盤輸入漢字。

當前,漢字輸入編碼已經“出臺”的方案有上百種,實際使用的也有幾十種,根據編碼方案設計時所依據的不同漢字屬性,可將它們分成:形碼音碼音形碼區位碼

形碼:根據漢字的字形結構來編碼。它的優點是:碼長(所謂碼長是一個漢字編碼的字符個數)較短、重碼(所謂重碼是指同一編碼對應多個漢字)率低、直觀,不受操作者文化程度高低、是否識字和各地方言不同的影響,只要看到字形,就能按規則擊鍵輸入。缺點是:有一套漢字的拆分規則要掌握,字根(若干筆畫複合連接交叉,形成相對不變的結構)在鍵盤上的分佈規律要記憶。

音碼:根據漢字的讀音進行編碼。它的優點是:一般學過漢語拼音的人就可以輸入漢字,易學,直觀,不受字體變化的影響。缺點是:碼長較長,重碼率高,不會讀或發音不準確的字無法用拼音輸入。

音形碼:兼顧了漢字的字音、字形(或字義)而構成的漢字輸入編碼。優點是:吸取了音碼和形碼的長處,重碼率低。缺點是:編碼規則複雜難於學習和記憶。

區位碼:根據漢字在漢字集中的位置而進行編碼。優點是:漢字與碼組有嚴格的對應關係,不需進行二次選擇。缺點是難於記憶。

現在,我們常見的輸入法有。拼音輸入法自然碼輸入法表形碼輸入法五筆字形輸入法等。其方法各異,各有其特點。在眾多漢字輸入法中還廣泛採用了一些輔助手段,如:詞組輸入聯想輸入等,以提高漢字輸入的速度。

2.漢字的存儲

在實際漢字系統中,都是用兩個字節來表示一個漢字,也即一個漢字對應兩個字節的二進制碼,也就是說,用兩個字節對漢字進行編碼,這樣即可將我們採用的漢字編入標準漢字代碼中,輸入時,我們輸入進計算機的就是這兩個字節的漢字代碼,存儲亦然。

3.漢字的輸出

確定了漢字的機內碼僅僅決定了每個漢字在國標字符集中的位置,但並不能說明每個漢字的形狀。因此,要完成漢字的輸出任務還需要字型數據。在微機上,大多數的文字或圖形的形狀都是用“點”來描述的。存儲這些點由1和0來實現,輸出時,計算機把1解釋成“寫點”,把0解釋為“不寫點”。這樣,漢字的點陣數據就與屏幕上的圖形對應起來。為了能夠顯示漢字,在國標集中的每個漢字都需要事先確定其點陣形狀,然後點陣轉換成對應的數據,一般以文件形式存放到計算機中,就構成了漢字的字型庫或簡稱為字庫

漢字的顯示一般需要一系列的步驟。例如,首先將用戶從鍵盤輸入的漢字編碼(輸入碼)轉化成機內碼,然後根據內碼從字庫中查找到該字的字模數據,再將字模寫到屏幕或輸出到打印機。

"

相關推薦

推薦中...