個(gè)性化搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).doc
約28頁(yè)DOC格式手機(jī)打開展開
個(gè)性化搜索引擎的設(shè)計(jì)與實(shí)現(xiàn),28頁(yè)共計(jì)18268字摘 要隨著internet技術(shù)的迅速發(fā)展,網(wǎng)絡(luò)提供給人們的信息量越來(lái)越大。搜索引擎作為人們?cè)趙ww上查找、獲取信息的重要手段之一,在各個(gè)領(lǐng)域都已得到了廣泛的應(yīng)用。為了給用戶提供個(gè)性化的查詢服務(wù),個(gè)性化搜索引擎孕育而生。經(jīng)過(guò)眾多研究者的不懈努力,個(gè)性化搜索引擎技術(shù)已取得了一些進(jìn)展。本文針對(duì)目前搜索引...
內(nèi)容介紹
此文檔由會(huì)員 bfxqt 發(fā)布
28頁(yè)共計(jì)18268字
摘 要
隨著Internet技術(shù)的迅速發(fā)展,網(wǎng)絡(luò)提供給人們的信息量越來(lái)越大。搜索引擎作為人們?cè)赪WW上查找、獲取信息的重要手段之一,在各個(gè)領(lǐng)域都已得到了廣泛的應(yīng)用。為了給用戶提供個(gè)性化的查詢服務(wù),個(gè)性化搜索引擎孕育而生。經(jīng)過(guò)眾多研究者的不懈努力,個(gè)性化搜索引擎技術(shù)已取得了一些進(jìn)展。本文針對(duì)目前搜索引擎存在的不足以及當(dāng)前用戶個(gè)性化查詢的要求,在深入研究搜索引擎及相關(guān)技術(shù)的基礎(chǔ)上,設(shè)計(jì)了一個(gè)基于用戶興趣挖掘的個(gè)性化搜索引擎模型。本文的主要工作是:
(1)個(gè)性化模型的研究與實(shí)現(xiàn)本文深入分析了個(gè)性化搜索的特點(diǎn),研究了搜索引擎及相關(guān)技術(shù),設(shè)計(jì)了一個(gè)基于用戶興趣挖掘的個(gè)性化模型。該模型從用戶的歷史訪問(wèn)頁(yè)面中提取用戶的興趣特征,將興趣相同的頁(yè)面進(jìn)行歸類,并將用戶興趣按類管理;本文構(gòu)建了用戶興趣樹來(lái)動(dòng)態(tài)地存儲(chǔ)用戶興趣,并通過(guò)短期興趣和長(zhǎng)期興趣相結(jié)合的方式來(lái)描述用戶興趣特征;為了及時(shí)地反映用戶的興趣變化,本文采用了基于遺忘機(jī)制的興趣更新算法。
(2)個(gè)性化搜索引擎(除個(gè)性化模型外)其他模塊的研究與實(shí)現(xiàn)本文還研究了與個(gè)性化搜索引擎相關(guān)的其他模塊,包括:中文分詞、查詢擴(kuò)展、網(wǎng)絡(luò)蜘蛛、索引建立與更新以及結(jié)果排序。在綜合考慮了技術(shù)的實(shí)現(xiàn)難度和用戶個(gè)性化查詢要求的基礎(chǔ)上,本文給出了以上各模塊的實(shí)現(xiàn)算法。
(3)通過(guò)實(shí)驗(yàn)證明了本文設(shè)計(jì)的個(gè)性化搜索引擎的有效性。實(shí)驗(yàn)內(nèi)容包括兩方面:個(gè)性化模型的建立和個(gè)性化的搜索。
目 錄
摘 要 IV
關(guān)鍵詞 IV
ABSTRACT V
KEY WORDS V
1 前言 1
1.1 研究背景 1
1.2 個(gè)性化搜索引擎的意義 1
1.3 個(gè)性化搜索引擎主要的研究問(wèn)題 1
2 搜索引擎概述 2
2.1 個(gè)性化搜索引擎 2
2.2 搜索引擎工作原理 2
2.3 個(gè)性化搜索引擎系統(tǒng)模型 3
2.4 未來(lái)搜索引擎的發(fā)展趨勢(shì) 4
3 個(gè)性化搜索引擎相關(guān)技術(shù) 5
3.1 信息抽取技術(shù) 5
3.2 LUCENE檢索工具包 5
3.3 中文分詞技術(shù) 6
3.4 自動(dòng)聚類技術(shù) 6
3.5 用戶行為分析 7
4 個(gè)性化搜索引擎的總體設(shè)計(jì) 7
4.1 系統(tǒng)需求分析及總體設(shè)計(jì) 7
4.2 系統(tǒng)功能及架構(gòu)設(shè)計(jì) 8
4.3 系統(tǒng)流程設(shè)計(jì) 8
4.4 系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì) 12
5 個(gè)性化搜索引擎的具體實(shí)現(xiàn) 13
5.1 模塊設(shè)計(jì) 13
5.2 用戶界面模塊 14
5.3 搜索模塊 16
5.4 搜索結(jié)果優(yōu)化模塊 19
5.5 系統(tǒng)運(yùn)行結(jié)果及示例 21
6 總結(jié) 22
參考文獻(xiàn): 22
致 謝 23
關(guān)鍵詞
個(gè)性化模型,用戶興趣挖掘,用戶興趣樹
參考文獻(xiàn):
[2]李愛(ài)明.個(gè)性化搜索引擎用戶模型研究 武漢:華中師范大學(xué),2007.
[3]張波.個(gè)性化Web搜索系統(tǒng)研究 .秦皇島:燕山大學(xué),2006.
[4]龐杰.搜索引擎技術(shù)的研究與實(shí)現(xiàn) .上海:上海交通大學(xué),2006.
[5]李沛環(huán).基于Lucene的搜索引擎的設(shè)計(jì)和優(yōu)化 .吉林:吉林大學(xué),2008.
[6]種梅.元搜索引擎中的關(guān)鍵技術(shù)研究 .山東:山東師范大學(xué),2008
[7]霍長(zhǎng)青.個(gè)性化元搜索引擎研究與設(shè)計(jì) .山東:山東科技大學(xué),2006.
[8]許文.HTML網(wǎng)頁(yè)土題信息抽取方法研究 .北京:北京機(jī)械工業(yè)學(xué)院,2007.
[9]劉清.基于SVM的網(wǎng)絡(luò)文本分類問(wèn)題研究與應(yīng)用 .南昌:南昌大學(xué),2007.
[10]盧效峰,鄭權(quán).基于用戶行為分析的搜索引擎模型 .北方工業(yè)大學(xué)學(xué)報(bào),2004
[11]張恒,屈景輝,張亮.網(wǎng)頁(yè)文本信息提取及結(jié)果評(píng)價(jià) 微計(jì)算機(jī)應(yīng)用,2007.9.
[12]費(fèi)魏,黃如花.基于用戶行為分析的搜索引擎優(yōu)化策略 圖書情報(bào)工作,2005,10(49):75一77
[13]劉濤.用于文本分類和文本聚類的特征選擇田 .武漢:南開大學(xué),2004.
[14]馮剛.基于JZEE的多語(yǔ)種元搜索引擎的研究與實(shí)現(xiàn) 成都:電子科技大學(xué),
[16]王玲,穆志純,郭輝一種基于聚類的支持向量機(jī)增量學(xué)習(xí)算法.北京科技人學(xué)學(xué)報(bào),2007
[17]何世林.基于JAVA技術(shù)的搜索引擎研究與實(shí)現(xiàn) .成都:西南交通大學(xué),2006.
[18]張恒,屈景輝,張亮.網(wǎng)頁(yè)文本信息提取及結(jié)果評(píng)價(jià) .微計(jì)算機(jī)應(yīng)用,2007.9.
[19]PQi He,PKuiyuChang,Ee-peng Lim.Analyzing Feature Trajeetories for Event
Detection •Proeeedings of the 30th Annual International ACM SIGIR Conference on
Researeh and Development in Information Retrieval,2007.6:35一37.
[20]WangDeqing,ZhangHui,ZhaoLiPing A clustering algorithm of no-word-segmentation for
Chinese seareh engine results[C].3rd International Conference on Semantics,Knowledge,
And Grid,SKG2007,2007:258一261.
[21]KumarHarshit,Kang Sanggil.Another face of seareh engine[C].Web seareh API’s.Lecture
Notes in Computer Science,v5027LNAI,New Frontiers in Applied Artifieial Intelligence-
2lst International Conference on Industrial,Engineering and Other Applications of Applied
Intelligent Systems,IEA/AIE2008,Proceedings,2008:311一320.
[22]Yuanyu一Yu,LuoXue一Chao.A measurement method of search engine retrieve Performance
Based user Path mode[J].Tien Tzu Hsueh Pao/Acta Eleetronica Siniea,2008.5(36):969一973.
[23]Liu Chunshuang,Zhang Zhiqiang,Xie Xiaoqin,et al.Evaluation of meta-search engine
Merge algorithms[C].Proceedings ICICSE2008一2008 International Conference on Internet
Computing in Seience and Engineering,2008:9一14.
摘 要
隨著Internet技術(shù)的迅速發(fā)展,網(wǎng)絡(luò)提供給人們的信息量越來(lái)越大。搜索引擎作為人們?cè)赪WW上查找、獲取信息的重要手段之一,在各個(gè)領(lǐng)域都已得到了廣泛的應(yīng)用。為了給用戶提供個(gè)性化的查詢服務(wù),個(gè)性化搜索引擎孕育而生。經(jīng)過(guò)眾多研究者的不懈努力,個(gè)性化搜索引擎技術(shù)已取得了一些進(jìn)展。本文針對(duì)目前搜索引擎存在的不足以及當(dāng)前用戶個(gè)性化查詢的要求,在深入研究搜索引擎及相關(guān)技術(shù)的基礎(chǔ)上,設(shè)計(jì)了一個(gè)基于用戶興趣挖掘的個(gè)性化搜索引擎模型。本文的主要工作是:
(1)個(gè)性化模型的研究與實(shí)現(xiàn)本文深入分析了個(gè)性化搜索的特點(diǎn),研究了搜索引擎及相關(guān)技術(shù),設(shè)計(jì)了一個(gè)基于用戶興趣挖掘的個(gè)性化模型。該模型從用戶的歷史訪問(wèn)頁(yè)面中提取用戶的興趣特征,將興趣相同的頁(yè)面進(jìn)行歸類,并將用戶興趣按類管理;本文構(gòu)建了用戶興趣樹來(lái)動(dòng)態(tài)地存儲(chǔ)用戶興趣,并通過(guò)短期興趣和長(zhǎng)期興趣相結(jié)合的方式來(lái)描述用戶興趣特征;為了及時(shí)地反映用戶的興趣變化,本文采用了基于遺忘機(jī)制的興趣更新算法。
(2)個(gè)性化搜索引擎(除個(gè)性化模型外)其他模塊的研究與實(shí)現(xiàn)本文還研究了與個(gè)性化搜索引擎相關(guān)的其他模塊,包括:中文分詞、查詢擴(kuò)展、網(wǎng)絡(luò)蜘蛛、索引建立與更新以及結(jié)果排序。在綜合考慮了技術(shù)的實(shí)現(xiàn)難度和用戶個(gè)性化查詢要求的基礎(chǔ)上,本文給出了以上各模塊的實(shí)現(xiàn)算法。
(3)通過(guò)實(shí)驗(yàn)證明了本文設(shè)計(jì)的個(gè)性化搜索引擎的有效性。實(shí)驗(yàn)內(nèi)容包括兩方面:個(gè)性化模型的建立和個(gè)性化的搜索。
目 錄
摘 要 IV
關(guān)鍵詞 IV
ABSTRACT V
KEY WORDS V
1 前言 1
1.1 研究背景 1
1.2 個(gè)性化搜索引擎的意義 1
1.3 個(gè)性化搜索引擎主要的研究問(wèn)題 1
2 搜索引擎概述 2
2.1 個(gè)性化搜索引擎 2
2.2 搜索引擎工作原理 2
2.3 個(gè)性化搜索引擎系統(tǒng)模型 3
2.4 未來(lái)搜索引擎的發(fā)展趨勢(shì) 4
3 個(gè)性化搜索引擎相關(guān)技術(shù) 5
3.1 信息抽取技術(shù) 5
3.2 LUCENE檢索工具包 5
3.3 中文分詞技術(shù) 6
3.4 自動(dòng)聚類技術(shù) 6
3.5 用戶行為分析 7
4 個(gè)性化搜索引擎的總體設(shè)計(jì) 7
4.1 系統(tǒng)需求分析及總體設(shè)計(jì) 7
4.2 系統(tǒng)功能及架構(gòu)設(shè)計(jì) 8
4.3 系統(tǒng)流程設(shè)計(jì) 8
4.4 系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì) 12
5 個(gè)性化搜索引擎的具體實(shí)現(xiàn) 13
5.1 模塊設(shè)計(jì) 13
5.2 用戶界面模塊 14
5.3 搜索模塊 16
5.4 搜索結(jié)果優(yōu)化模塊 19
5.5 系統(tǒng)運(yùn)行結(jié)果及示例 21
6 總結(jié) 22
參考文獻(xiàn): 22
致 謝 23
關(guān)鍵詞
個(gè)性化模型,用戶興趣挖掘,用戶興趣樹
參考文獻(xiàn):
[2]李愛(ài)明.個(gè)性化搜索引擎用戶模型研究 武漢:華中師范大學(xué),2007.
[3]張波.個(gè)性化Web搜索系統(tǒng)研究 .秦皇島:燕山大學(xué),2006.
[4]龐杰.搜索引擎技術(shù)的研究與實(shí)現(xiàn) .上海:上海交通大學(xué),2006.
[5]李沛環(huán).基于Lucene的搜索引擎的設(shè)計(jì)和優(yōu)化 .吉林:吉林大學(xué),2008.
[6]種梅.元搜索引擎中的關(guān)鍵技術(shù)研究 .山東:山東師范大學(xué),2008
[7]霍長(zhǎng)青.個(gè)性化元搜索引擎研究與設(shè)計(jì) .山東:山東科技大學(xué),2006.
[8]許文.HTML網(wǎng)頁(yè)土題信息抽取方法研究 .北京:北京機(jī)械工業(yè)學(xué)院,2007.
[9]劉清.基于SVM的網(wǎng)絡(luò)文本分類問(wèn)題研究與應(yīng)用 .南昌:南昌大學(xué),2007.
[10]盧效峰,鄭權(quán).基于用戶行為分析的搜索引擎模型 .北方工業(yè)大學(xué)學(xué)報(bào),2004
[11]張恒,屈景輝,張亮.網(wǎng)頁(yè)文本信息提取及結(jié)果評(píng)價(jià) 微計(jì)算機(jī)應(yīng)用,2007.9.
[12]費(fèi)魏,黃如花.基于用戶行為分析的搜索引擎優(yōu)化策略 圖書情報(bào)工作,2005,10(49):75一77
[13]劉濤.用于文本分類和文本聚類的特征選擇田 .武漢:南開大學(xué),2004.
[14]馮剛.基于JZEE的多語(yǔ)種元搜索引擎的研究與實(shí)現(xiàn) 成都:電子科技大學(xué),
[16]王玲,穆志純,郭輝一種基于聚類的支持向量機(jī)增量學(xué)習(xí)算法.北京科技人學(xué)學(xué)報(bào),2007
[17]何世林.基于JAVA技術(shù)的搜索引擎研究與實(shí)現(xiàn) .成都:西南交通大學(xué),2006.
[18]張恒,屈景輝,張亮.網(wǎng)頁(yè)文本信息提取及結(jié)果評(píng)價(jià) .微計(jì)算機(jī)應(yīng)用,2007.9.
[19]PQi He,PKuiyuChang,Ee-peng Lim.Analyzing Feature Trajeetories for Event
Detection •Proeeedings of the 30th Annual International ACM SIGIR Conference on
Researeh and Development in Information Retrieval,2007.6:35一37.
[20]WangDeqing,ZhangHui,ZhaoLiPing A clustering algorithm of no-word-segmentation for
Chinese seareh engine results[C].3rd International Conference on Semantics,Knowledge,
And Grid,SKG2007,2007:258一261.
[21]KumarHarshit,Kang Sanggil.Another face of seareh engine[C].Web seareh API’s.Lecture
Notes in Computer Science,v5027LNAI,New Frontiers in Applied Artifieial Intelligence-
2lst International Conference on Industrial,Engineering and Other Applications of Applied
Intelligent Systems,IEA/AIE2008,Proceedings,2008:311一320.
[22]Yuanyu一Yu,LuoXue一Chao.A measurement method of search engine retrieve Performance
Based user Path mode[J].Tien Tzu Hsueh Pao/Acta Eleetronica Siniea,2008.5(36):969一973.
[23]Liu Chunshuang,Zhang Zhiqiang,Xie Xiaoqin,et al.Evaluation of meta-search engine
Merge algorithms[C].Proceedings ICICSE2008一2008 International Conference on Internet
Computing in Seience and Engineering,2008:9一14.
TA們正在看...
- 智能家庭防盜系統(tǒng)的設(shè)計(jì)-本科畢業(yè)論文.rar
- 2012年優(yōu)秀個(gè)人簡(jiǎn)歷模板集合.doc
- 自信演講訓(xùn)練.ppt
- 影響古代中國(guó)繪畫的政治因素探究.doc
- 毛概論文《鄧小平戰(zhàn)略思想與21世紀(jì)的中國(guó)戰(zhàn)略》讀...doc
- 數(shù)據(jù)庫(kù)課程設(shè)計(jì)《學(xué)籍管理系統(tǒng)》.zip
- 大學(xué)考試試卷《經(jīng)濟(jì)法》及答案3套.doc
- 某高層商住樓(3層轉(zhuǎn)換).rar
- 論我國(guó)鄉(xiāng)鎮(zhèn)政府選舉制度的現(xiàn)狀與改革方向.doc
- 水費(fèi)管理系統(tǒng).zip