'“漢語”計算機的關鍵障礙'

"

寫了“漢語”計算機的關鍵優勢,再說說障礙點在哪。

很多朋友大概沒有意識到,在操作系統之外,還有個“人機交互”的基礎環節存在。

我們都知道使用計算機系統是通過操作系統進行的,但是,操作系統也是被引導起來的,在系統啟動之後、操作系統被引導之前,計算機仍然是要運行的,也是要分析並運行指令的,也是能夠“理解”鍵盤輸入、進行屏幕顯示的。

其次,即便是操作系統運行起來之後,我們的鍵盤向主機輸出的是一個個的ASCII碼的二進制代碼,主機首先要解釋成ASCII碼,之後才有各種操作系統層面的代碼轉換、符號索引。

因此,在操作系統之外,在計算機的固件系統當中,有這樣一個ASCII碼的映射表的,CPU收到相應的鍵盤輸入時,能夠從中調取相應的ASCII碼,可以往屏幕上顯示相應字模。也就是說,我們每一次敲擊鍵盤形成一個輸出信號,和每一次屏幕反饋輸入信息,都有一個計算機底層固件的編碼解碼操作。

目前,這個底層的編碼映射表,只有256條記錄,也就是說,計算機物理層面上,只能識別ASCII碼,所有其它的符號和編碼,都只能由這256個ASCII碼在軟件層面上排列組合形成。這顯然是低效的。如果計算機固件當中直接可以實現更大範圍、更多編碼的編碼解碼,將大大提升人機交互的效率。

那麼,計算機固件當中的默認“字典”,為啥只是256個字符呢?這是受人力所限。就好像戰鬥機過載不能超過9G,不是戰鬥機本身的限制,而是人生理條件的限制。

人的記憶能力,記憶符號,可以數以萬計,但是記憶同一類別的、具有立體屬性、且互相之間存在邏輯關係的實體,普遍情況下大致最多就150個,再多就很難短時間記住並運用。像這種符號與二進制碼的對應關係,首先控制在128個,整好7位二進制數字的索引可以覆蓋。通過精心設計,實現了100個左右的鍵位,能夠基本覆蓋所需要的輸出。

而且,這個設計,令鍵盤大小也比較合適,最關鍵的是,由於鍵盤輸入和鍵盤向主機輸出的內容,需要即時反映到屏幕上讓人看到、以利進行校驗和修正,因此,純佈線的一鍵一碼方案,就成為最簡單但是最可靠的解決方案。這個方案中,每一個8位二進制的鍵盤信號,都會直接輸入主機,不能像漢字輸入法一樣,輸入一個鍵以後列出候選字列表,多敲一個就縮減列表,直到最後是唯一一個需要輸入的漢字。

但是,現在集成電路已經爛大街了呀。我們可以把鍵盤集成一個集成電路芯片,在固件層面固化一個能夠包括所有漢字(或者說包括全世界所有已知、已用符號都行)的映射表和符號字典,就相當於在固件層面集成了一個漢字輸入法。存儲空間上說,康熙字典不過4.7萬漢字,GBK一共有21003個漢字,2^16=65536,把漢字全包進去,剩下的空間也足夠把全世界現存的已知語言符號包括進去。這個芯片,如果集成了這種包括了全世界所有符號的集合,那麼所有語言體系都能夠很方便的建立自己的軟件體系,不需要通過ASCII轉碼,效率必然顯著提升。(Unicode,其實是包括了兩個職能模塊,一部分是人機符號的映射規則,一部分是程序數據本身的應用規則,混為一談並不是什麼好方案)。而漢字符號的引入,獲得了最充分的符號擴展,將獲得最大的增益。當然,其它符號體系,大致就相當於提升到原來的英語體系的水平就是了。

其實,實現起來並不困難,命令行窗口支持漢字也不是什麼新鮮事,無非就是一個鍵盤輸入不急著顯示,而顯示候選列表。當然,漢字之外的符號,不需要,仍然一鍵一碼就行。這些功能,無非是一個集成電路能夠解決的問題。甚至說,通過良好的設計,鍵盤上仍然可能不需要集成電路,一個鍵位觸發4位二進制碼,四個鍵位就能形成兩個字節的完整索引碼。

當然,這個碼錶的映射規則,可得好好規劃。我覺得得找個重碼少的形碼規則,充分利用偏旁部首規則,充分優化之後,就固定下來,作為標準教材從小訓練,像筷子一樣成為標準工具。這種規則顯然可以輔助記憶字形,省得提筆忘字。

"

相關推薦

推薦中...