該項(xiàng)研究提出了基于集成式架構(gòu)的文獻(xiàn)自動(dòng)輸入平臺(tái)技術(shù)方案,將印刷體字符識(shí)別、脫機(jī)手寫體漢字識(shí)別、印刷體表格處理、印刷體公式識(shí)別等工具集成于同一平臺(tái),提高了被識(shí)別對(duì)象的輸入效率。在脫機(jī)手寫體漢字識(shí)別中,提出了基于模糊隸屬度與k均值聚類的漢字分類切分方法,構(gòu)造分類模糊隸屬度函數(shù)對(duì)預(yù)切分結(jié)果進(jìn)行分類,通過(guò)對(duì)粘連漢字骨架像素進(jìn)行k均值聚類以判斷、分析粘連筆劃,確定最終的切分路徑。在印刷表格分析中,提...
|