該項(xiàng)目研究了高魯棒性、多文件印刷體文字識別、聯(lián)機(jī)和脫機(jī)手寫漢字識別的理論和方法,在漢字的模型描述、識別魯棒性問題,多文種混排切分問題和復(fù)雜報(bào)紙版面自動(dòng)版面分析、理解及復(fù)原等方面取得重要成果,推動(dòng)了漢字識別綜合理論及應(yīng)用的發(fā)展。研究成果已率為TH-OCR系列產(chǎn)品,包括THO-CR7.0/8.0/2000版,文通筆和通用表格數(shù)據(jù)識別系統(tǒng)軟件,居世界領(lǐng)先地位,為解決文字及相關(guān)信息的自動(dòng)識別輸入計(jì)算機(jī)問題...
|