脫機手寫漢字識別
一、漢字識別概述
漢字已有數(shù)千年的歷史,也是世界上使用人數(shù)最多的文字,對于中華民族燦爛文化的形成和發(fā)展有著不可磨滅的貢獻,并將繼續(xù)發(fā)揮重要的、其它文字形式難以取代的作用。然而,漢字是非字母化、非拼音化的文字,在當(dāng)今高度信息化的社會里,如何快速高效地將漢字輸入計算機,已成為影響人—機交流信息效率的一個重要瓶頸,也關(guān)系到計算機能否真正在我國得到普及應(yīng)用。
圍繞這一問題,人們提出了各種解決方案。目前,漢字輸入主要分為人工鍵盤輸入和機器自動識別輸入兩種。
|
自動識別輸入分為語音識別和字符識別兩種。漢字識別是模式識別的一個重要分支,也是文字識別領(lǐng)域最為困難的問題,它涉及模式識別、圖象處理、數(shù)字信號處理、自然語言理解、人工智能、模糊數(shù)學(xué)、信息論、計算機、中文信息處理等學(xué)科,是一門綜合性技術(shù),在中文信息處理、辦公室自動化、機器翻譯、人工智能等高技術(shù)領(lǐng)域,都有著重要的實用價值和理論意義。
漢字識別技術(shù)可分為印刷體漢字識別和手寫體漢字識別兩大類,后者又可分為聯(lián)機手寫漢字識別和脫機手寫漢字識別。
從識別的角度來看,手寫體識別難于印刷體識別,而脫機手寫識別又難于聯(lián)機手寫體識別。可喜的是,經(jīng)過科研人員的努力,我國已有印刷體漢字識別和聯(lián)機手寫漢字識別的商品出售,目前已形成百家爭鳴、百花齊放的局面,但是脫機手寫漢字識別還處于實驗室研究階段。在脫機手寫漢字識別領(lǐng)域,非特定人脫機手寫漢字識別又難于特定人手寫漢字識別。
二、 手寫漢字識別中存在的問題及困難
手寫漢字識別是一種重要的、適用于把手寫文稿隨時輸入計算機的方法,也是機器字符識別最為困難的一個課題,這些困難和問題表現(xiàn)在:
1、漢字類別多。僅《康熙字典》中就包含了49000多個漢字,而常用的漢字就有4000多個,因而漢字識別問題屬于大類別(或者稱為超多類)模式識別問題,在模式識別理論和方法研究方面有重大意義。
2、漢字字形結(jié)構(gòu)復(fù)雜。 漢字集合中相似字較多,有些漢字的差別僅為一點或一個筆畫,由于手寫變形的存在,使得手寫體中相似字的區(qū)分比印刷體要困難得多。因不同人書寫風(fēng)格的差異造成手寫漢字的變形很大,具體表現(xiàn)在以下幾個方面:
。1)基本筆畫變化。橫不平,豎不直,直筆變彎,折筆的拐角變成圓弧等。
(2)筆畫模糊,不規(guī)范,該連的不連,不該連的卻相連。
(3)筆畫與筆畫之間、部件與部件之間的位置發(fā)生變化。
(4)筆畫的傾斜角、筆畫的長短、部件的大小發(fā)生變化。
。5)對于脫機手寫漢字,不同人使用不同的書寫筆可能造成筆畫的粗細變化。
其中,手寫漢字字形的變化是最難以解決的問題。
一般認為,聯(lián)機手寫漢字識別比脫機手寫漢字識別相對容易些。聯(lián)機手寫漢字識別是一種人工實時地把漢字輸入計算機的方法,它利用書寫板把筆畫變?yōu)橐痪S電信號,輸入計算機的是以坐標(biāo)點序列表示的筆尖移動軌跡,因而被處理的是一維的線條(筆畫)串,這些線條串含有筆畫數(shù)目、筆畫走向、筆順和書寫速度等信息,而脫機手寫漢字識別處理的僅是二維的漢字點陣圖象,是漢字識別領(lǐng)域中最后一個十分困難的問題,目前仍然處于實驗室研究階段。
由此可見,對非特定人脫機手寫漢字識別而言,如果對手寫漢字的書寫不加任何限制(即為自由手寫體漢字),則識別難度相當(dāng)大?茖W(xué)研究中人們總是遵循從易到難的規(guī)律,從簡單的問題入手來尋求突破口。由于自由手寫漢字識別太難,人們提出了手寫印刷體漢字識別,這已成為目前脫機手寫漢字識別的主要研究對象。所謂手寫印刷體是指書寫工整的楷書手寫體,要求書寫者工整書寫,盡量少連筆。
三、展望
我們研究非特定人脫機手寫漢字識別的目的就是使識別系統(tǒng)能夠?qū)嵱没。由清華大學(xué)電子工程系圖象教研組 OCR(光學(xué)字符識別)實驗室研制的THOCR-97綜合集成漢字識別系統(tǒng)于1997年3月22日通過了由國家教委組織的鑒定并獲得了高度評價,其中的非特定人脫機手寫漢字文本識別子系統(tǒng),對于書寫較為工整的手寫漢字文本,正確識別率達95.8%,為該子系統(tǒng)走向?qū)嵱没於肆己玫幕A(chǔ)?梢詷酚^地預(yù)言,在今后的5年內(nèi),非特定人脫機手寫印刷體漢字識別文本系統(tǒng)將會有產(chǎn)品走向市場。然而,對于自由手寫體漢字識別而言,任重道遠,仍需要科研人員不懈的努力,但是我們不應(yīng)該就此悲觀,隨著計算機技術(shù)的突飛猛進和人腦功能的進一步揭示,可望在不遠的將來發(fā)現(xiàn)人腦的識字機理,建立在此基礎(chǔ)上的手寫漢字識別的理論和方法將會有質(zhì)的飛躍。
[上一頁] [下一頁]
|