搜索引擎設(shè)計(jì).doc
約28頁DOC格式手機(jī)打開展開
搜索引擎設(shè)計(jì),1.8萬字28頁摘要搜索引擎按其工作方式主要可分為三種,分別是全文搜索引擎(full text search engine)、目錄索引類搜索引擎(search index/directory)和元搜索引擎(meta search engine)。全文搜索引擎是最廣泛也是用得最多的一種,一般所說的搜索引擎都指的是全文搜索...
內(nèi)容介紹
此文檔由會(huì)員 王蕓 發(fā)布
1.8萬字 28頁
摘要
搜索引擎按其工作方式主要可分為三種,分別是全文搜索引擎(Full Text Search Engine)、目錄索引類搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。全文搜索引擎是最廣泛也是用得最多的一種,一般所說的搜索引擎都指的是全文搜索引擎。
針對(duì)當(dāng)前搜索引擎的系統(tǒng)結(jié)構(gòu),在對(duì)目前大部分搜索引擎技術(shù)研究的基礎(chǔ)上,綜合其設(shè)計(jì)思路,給出了一個(gè)新的信息檢索系統(tǒng)的框架原型,它比現(xiàn)有搜索引擎更加優(yōu)化,是一種新的搜索引擎結(jié)構(gòu),也就是對(duì)網(wǎng)頁中的信息處理問題提取進(jìn)行了研究。根據(jù)HTLM的規(guī)則,對(duì)其進(jìn)行部分的提取,然后把其導(dǎo)入數(shù)據(jù)庫,從而能夠?qū)π畔⒄_、快速的提取。提取運(yùn)用的是正則表達(dá)式,盡管最初的正則表達(dá)式出現(xiàn)于理論計(jì)算機(jī)科學(xué)的自動(dòng)控制理論和形式語言理論中。在這些領(lǐng)域中有對(duì)計(jì)算(自動(dòng)控制)的模型和對(duì)形式語言描述與分類的研究?,F(xiàn)在它能廣泛的使用在很多領(lǐng)域,所以本次研究就是要運(yùn)用正則表達(dá)式來完成項(xiàng)目的開發(fā)。
目錄
前言
第一章 緒論
第二章 搜索引擎的概況與分析
2.1搜索引擎分類
2.1.1全文搜索引擎
2.1.2目錄索引
2.1.3元搜索引擎
2.2搜索引擎的結(jié)構(gòu)
2.2.1 Robot爬行程序
2.2.2索引模塊
2.2.3 搜索模塊
2.3垂直搜索引擎技術(shù)
2.3.1垂直搜索引擎
2.3.2 垂直搜索的劃分
2.3.3垂直搜索引擎的相關(guān)技術(shù)
2.4小結(jié)
第三章 正則表達(dá)式
第四章 系統(tǒng)的設(shè)計(jì)與開發(fā)
4.1 系統(tǒng)概述
4.2 有向ROBOT
4.2.1搜索Robot
4.2.2挖掘Robot
4.2.3收集Robot
4.3索引器
4.4 網(wǎng)頁的分析提取
4.4.1網(wǎng)頁內(nèi)容的提取
4.4.2網(wǎng)頁分析
4.5 數(shù)據(jù)表
4.6 交互界面
4.7 小結(jié)
結(jié)束語
參考文獻(xiàn)
致謝
摘要
搜索引擎按其工作方式主要可分為三種,分別是全文搜索引擎(Full Text Search Engine)、目錄索引類搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。全文搜索引擎是最廣泛也是用得最多的一種,一般所說的搜索引擎都指的是全文搜索引擎。
針對(duì)當(dāng)前搜索引擎的系統(tǒng)結(jié)構(gòu),在對(duì)目前大部分搜索引擎技術(shù)研究的基礎(chǔ)上,綜合其設(shè)計(jì)思路,給出了一個(gè)新的信息檢索系統(tǒng)的框架原型,它比現(xiàn)有搜索引擎更加優(yōu)化,是一種新的搜索引擎結(jié)構(gòu),也就是對(duì)網(wǎng)頁中的信息處理問題提取進(jìn)行了研究。根據(jù)HTLM的規(guī)則,對(duì)其進(jìn)行部分的提取,然后把其導(dǎo)入數(shù)據(jù)庫,從而能夠?qū)π畔⒄_、快速的提取。提取運(yùn)用的是正則表達(dá)式,盡管最初的正則表達(dá)式出現(xiàn)于理論計(jì)算機(jī)科學(xué)的自動(dòng)控制理論和形式語言理論中。在這些領(lǐng)域中有對(duì)計(jì)算(自動(dòng)控制)的模型和對(duì)形式語言描述與分類的研究?,F(xiàn)在它能廣泛的使用在很多領(lǐng)域,所以本次研究就是要運(yùn)用正則表達(dá)式來完成項(xiàng)目的開發(fā)。
目錄
前言
第一章 緒論
第二章 搜索引擎的概況與分析
2.1搜索引擎分類
2.1.1全文搜索引擎
2.1.2目錄索引
2.1.3元搜索引擎
2.2搜索引擎的結(jié)構(gòu)
2.2.1 Robot爬行程序
2.2.2索引模塊
2.2.3 搜索模塊
2.3垂直搜索引擎技術(shù)
2.3.1垂直搜索引擎
2.3.2 垂直搜索的劃分
2.3.3垂直搜索引擎的相關(guān)技術(shù)
2.4小結(jié)
第三章 正則表達(dá)式
第四章 系統(tǒng)的設(shè)計(jì)與開發(fā)
4.1 系統(tǒng)概述
4.2 有向ROBOT
4.2.1搜索Robot
4.2.2挖掘Robot
4.2.3收集Robot
4.3索引器
4.4 網(wǎng)頁的分析提取
4.4.1網(wǎng)頁內(nèi)容的提取
4.4.2網(wǎng)頁分析
4.5 數(shù)據(jù)表
4.6 交互界面
4.7 小結(jié)
結(jié)束語
參考文獻(xiàn)
致謝
TA們正在看...
- 2011年和2012年新疆醫(yī)科大學(xué)口腔真題.doc
- 2013年新疆醫(yī)科大學(xué)口腔真題.doc
- 2014年新疆醫(yī)科大學(xué)口腔綜合真題.doc
- 大連醫(yī)科大學(xué)口腔醫(yī)學(xué)考研初試題.doc
- 大連醫(yī)科大學(xué)口腔醫(yī)學(xué)考研復(fù)試題及經(jīng)驗(yàn).doc
- 大連醫(yī)科大學(xué)口腔考研重點(diǎn)筆記口內(nèi)1.doc
- 大連醫(yī)科大學(xué)口腔考研重點(diǎn)筆記口內(nèi)2.doc
- 大連醫(yī)科大學(xué)口腔考研重點(diǎn)筆記口外.doc
- 大連醫(yī)科大學(xué)口腔考研重點(diǎn)筆記修復(fù).doc
- 極坐標(biāo)與參數(shù)方程高考題的幾種常見題型學(xué)案.doc