該項(xiàng)研究針對(duì)大規(guī)模文本分類的降維問題,提出了采用迭代的CCIPCA和ICA算法,該算法在分詞和詞性標(biāo)注的基礎(chǔ)上,分析概念語義特征,并依次輸入文本向量,增量計(jì)算其主元,通過迭代的方法逐步收斂得到文本的特征向量。提出了基于搭配模式和統(tǒng)計(jì)特征的漢語短語詞自動(dòng)標(biāo)注方法。在分詞和詞性標(biāo)注的基礎(chǔ)上,分析漢語短語詞結(jié)構(gòu)、語用特征,利用搭配模式和統(tǒng)計(jì)特征實(shí)現(xiàn)短語詞的自動(dòng)標(biāo)注。提出了基于概念的漢語稱謂語自動(dòng)...
|