??脫機漢字識別,簡(jiǎn)單來(lái)說(shuō)就是對一張紙 上已經(jīng)寫(xiě)好的漢字,或是前印刷的漢字進(jìn) 行識別有機玻璃字印刷。乍一看,這種識別與聯(lián)機手寫(xiě)漢字識別沒(méi)有什么區別,但是,這里的漢字可以 是手寫(xiě)或是印刷,而且脫機識別可對許多字 同時(shí)進(jìn)行識別。送對于將現有的大量印刷資料錄人電腦有著(zhù)巨大的意義。
??最簡(jiǎn)單的脫機識別應用的例子是超市的 收款機,它是一種將圖形信號轉化成光信號, 從而進(jìn)行自動(dòng)識別的裝置有機玻璃字印刷。脫機漢字識別的工作原理與超市的收款機的工作原理相同, 都是先把印在紙上或貨物上的符號變換為電圖像信號,再進(jìn)行識別。但是由于漢字的字 數多、結構復雜,因此識別系統更加復雜,困難較多。
??大家可能想當然地為,第一個(gè)研究漢 字識別系統的肯定是中國人,其實(shí),是美國人 最先開(kāi)始了對漢字識別系統的研究有機玻璃字印刷。他們早在1906年就說(shuō):"中國正在發(fā)展成為出版大 國之一。"他們認識到漢語(yǔ)資料數量的迅速增 長(cháng)心及漢語(yǔ)資料收集的重要性,所他們就開(kāi)始制定漢字自動(dòng)輸入與漢譯英自動(dòng)翻譯的 研究計劃。
??像他們這種有遠見(jiàn)和對基礎研究的重視,是值得中國的科研人員好好學(xué)習的有機玻璃字印刷。 當時(shí),是化學(xué)公司研究出了第一個(gè)巧刷漢字識別系統,能識別1000個(gè)漢字,每個(gè)字有20 個(gè)樣本。雖然能識別的字較少,但是它對漢 字識別系統的研究有著(zhù)非常重要的意義。由于日文當中也有漢字,而且日本的技 術(shù)發(fā)達,所他們對漢字識別的研究也比中 國早。
??1977年,東芝公司就研制出能夠識別 2000個(gè)漢字的漢字識別系統,而且還在不斷 地進(jìn)行改進(jìn)有機玻璃字印刷。中國雖然起步較晚,但是也在1986年11 月研制成功一個(gè)能夠識別6763個(gè)宋體漢字 的系統。雖然它只能識別宋體字,但是其識別字數達到6763個(gè),是當時(shí)識別字數最多 的,因此是中國漢字識別研究的第一次突破。
??從此,中國的印刷漢字識別技術(shù)得到了突飛 猛進(jìn)的發(fā)展,再加上電腦性能的不斷提高,使這種技術(shù)在復雜性、識別率、識別字數、識別 速度等方面都有了較大的提高,而且這項研究很快就投放市場(chǎng),獲得了巨大的經(jīng)濟效益有機玻璃字印刷。