垂直搜索引擎關(guān)鍵技術(shù)研究與應(yīng)用.doc
約108頁DOC格式手機打開展開
垂直搜索引擎關(guān)鍵技術(shù)研究與應(yīng)用,3.99萬字71頁包括外文翻譯,原創(chuàng)作品,通過查重系統(tǒng) 摘要搜索引擎作為人們獲取internet上信息的主要手段,是信息檢索領(lǐng)域研究的熱門課題。近年來,隨著網(wǎng)上資源的急劇攀升,人們所熟知的通用的全文搜索引擎已經(jīng)越來越不能滿足人們的需求了,所以垂直搜索引擎便成為了一個熱門研究領(lǐng)域。垂直搜索引...
內(nèi)容介紹
此文檔由會員 第二波打卡 發(fā)布
垂直搜索引擎關(guān)鍵技術(shù)研究與應(yīng)用
3.99萬字 71頁 包括外文翻譯,原創(chuàng)作品,通過查重系統(tǒng)
摘 要
搜索引擎作為人們獲取Internet上信息的主要手段,是信息檢索領(lǐng)域研究的熱門課題。近年來,隨著網(wǎng)上資源的急劇攀升,人們所熟知的通用的全文搜索引擎已經(jīng)越來越不能滿足人們的需求了,所以垂直搜索引擎便成為了一個熱門研究領(lǐng)域。垂直搜索引擎是針對某一特殊領(lǐng)域、特定人群使用的搜索引擎,具有很強的領(lǐng)域相關(guān)性,能夠?qū)崿F(xiàn)相關(guān)的、專業(yè)的、實時的搜索。
本文首先介紹了垂直搜索引擎的研究背景和研究現(xiàn)狀,同時介紹了垂直搜索引擎的概念以及它與通用搜索引擎的區(qū)別。
接下來,介紹了本體領(lǐng)域的基本知識,構(gòu)建本體的方法,并且選用protégé 4.3構(gòu)建了小麥領(lǐng)域本體。并對Web爬取、索引和檢索、查詢擴展中的相關(guān)技術(shù)和算法進行了介紹。主要包括多線程技術(shù)和HtmlParser解析;Lucene倒排索引及Lucene的評分系統(tǒng)。檢索模型中的TF-IDF權(quán)重以及Jena解析本體文件等內(nèi)容。
最后,本文設(shè)計和實現(xiàn)了一個針對小麥領(lǐng)域的垂直搜索系統(tǒng),將本體領(lǐng)域的相關(guān)知識以及在信息檢索方面的應(yīng)用來優(yōu)化垂直搜索引擎,以查詢拓展的方式來增強關(guān)鍵字搜索。系統(tǒng)完成后,進行了實驗和分析,得到了滿意的效果。
關(guān)鍵詞:垂直搜索引擎;本體;OWL;Lucene;Jena
3.99萬字 71頁 包括外文翻譯,原創(chuàng)作品,通過查重系統(tǒng)
摘 要
搜索引擎作為人們獲取Internet上信息的主要手段,是信息檢索領(lǐng)域研究的熱門課題。近年來,隨著網(wǎng)上資源的急劇攀升,人們所熟知的通用的全文搜索引擎已經(jīng)越來越不能滿足人們的需求了,所以垂直搜索引擎便成為了一個熱門研究領(lǐng)域。垂直搜索引擎是針對某一特殊領(lǐng)域、特定人群使用的搜索引擎,具有很強的領(lǐng)域相關(guān)性,能夠?qū)崿F(xiàn)相關(guān)的、專業(yè)的、實時的搜索。
本文首先介紹了垂直搜索引擎的研究背景和研究現(xiàn)狀,同時介紹了垂直搜索引擎的概念以及它與通用搜索引擎的區(qū)別。
接下來,介紹了本體領(lǐng)域的基本知識,構(gòu)建本體的方法,并且選用protégé 4.3構(gòu)建了小麥領(lǐng)域本體。并對Web爬取、索引和檢索、查詢擴展中的相關(guān)技術(shù)和算法進行了介紹。主要包括多線程技術(shù)和HtmlParser解析;Lucene倒排索引及Lucene的評分系統(tǒng)。檢索模型中的TF-IDF權(quán)重以及Jena解析本體文件等內(nèi)容。
最后,本文設(shè)計和實現(xiàn)了一個針對小麥領(lǐng)域的垂直搜索系統(tǒng),將本體領(lǐng)域的相關(guān)知識以及在信息檢索方面的應(yīng)用來優(yōu)化垂直搜索引擎,以查詢拓展的方式來增強關(guān)鍵字搜索。系統(tǒng)完成后,進行了實驗和分析,得到了滿意的效果。
關(guān)鍵詞:垂直搜索引擎;本體;OWL;Lucene;Jena