基于信息抽取技術(shù)的搜索引擎

2004年

應(yīng)用技術(shù)

成果簡介

該搜索引擎利用機(jī)器學(xué)習(xí)的方法，對含有同類信息且布局基本一致的HTML頁面樣本集進(jìn)行學(xué)習(xí)，從而得出對此類HTML頁面進(jìn)行信息抽取的規(guī)則。應(yīng)用這些規(guī)則，結(jié)合一個特定領(lǐng)域的搜索引擎，對網(wǎng)絡(luò)上的相關(guān)信息進(jìn)行大量的獲取，并從半自由的HTML文本中獲取結(jié)構(gòu)化的信息。通過訓(xùn)練和學(xué)習(xí)，調(diào)整規(guī)則數(shù)目和抽象程度，使其滿足精度要求，然后基于學(xué)習(xí)提煉后的規(guī)則集對樣本集以外的文本進(jìn)行信息提取。對用搜索引擎獲取的特定內(nèi)容的頁...

相關(guān)成果

1. 多信息塊Web頁面的信息抽取
2. 信息聚類搜索引擎
3. 基于結(jié)構(gòu)化小文本搜索引擎技術(shù)的產(chǎn)品應(yīng)用及推廣
4. 多語言信息抽取關(guān)鍵技術(shù)及其應(yīng)用
5. 基于有監(jiān)督流形學(xué)習(xí)的特征抽取方法研究及應(yīng)用
6. 基于本體的智能化XML搜索引擎研究
7. 沖孔信息抽取及自動化轉(zhuǎn)換數(shù)控沖裁文件技術(shù)
8. 面向競爭情報(bào)的信息抽取關(guān)鍵技術(shù)及應(yīng)用
9. 分布式海量信息搜索引擎軟件系統(tǒng)
10. 撓性線材抽取裝置
12. 基于.Net技術(shù)的煙葉行業(yè)信息集成系統(tǒng)
13. 基于Net技術(shù)的煙葉行業(yè)信息集成系統(tǒng)
14. 基于自動識別技術(shù)的物流公共信息
15. 基于XML解析技術(shù)的海信信息交互平臺
16. 基于語義的中文智能多媒體搜索引擎
17. 搜索引擎技術(shù)
18. 基于Internet的港航EDI信息增值技術(shù)的研究
19. 基于ATM技術(shù)和Internet技術(shù)的深圳信息網(wǎng)
20. 基于Internet的港航EDI信息增值技術(shù)的研究

精品福利一区二区三区免费视-精品福利一区二区三区免费视频-精品福利一区二区在线观看-精品高潮呻吟99AV无码-精品高潮呻吟AV久久无码-精品高精欧美囯产日韩一区

基于信息抽取技術(shù)的搜索引擎

標(biāo)簽云

猜您想要的成果

相關(guān)專家

相關(guān)機(jī)構(gòu)


	選擇導(dǎo)出文檔的格式關(guān)閉 PDF PDF RTF(word文檔) TXT(純文本)


	提示信息關(guān)閉發(fā)送短信成功


	提示信息關(guān)閉發(fā)送短信失敗


	提示信息關(guān)閉發(fā)送郵件失敗


	提示信息關(guān)閉郵件發(fā)送成功