西文自動(dòng)摘要軟件的開發(fā).doc
約36頁DOC格式手機(jī)打開展開
西文自動(dòng)摘要軟件的開發(fā),western autosummary software development1.2萬字 36頁 原創(chuàng)作品,已通過查重系統(tǒng)目錄第一章 緒 論71.1 課題背景與意義71.2 國內(nèi)外研究現(xiàn)狀81.3 主要研究內(nèi)容與特點(diǎn)81.4 論文的組織結(jié)構(gòu)9第二章 系統(tǒng)開發(fā)工具及關(guān)鍵技術(shù)92.1eclipse工...
內(nèi)容介紹
此文檔由會(huì)員 馬甲線女神 發(fā)布
西文自動(dòng)摘要軟件的開發(fā)
Western AutoSummary software development
1.2萬字 36頁 原創(chuàng)作品,已通過查重系統(tǒng)
目 錄
第一章 緒 論 7
1.1 課題背景與意義 7
1.2 國內(nèi)外研究現(xiàn)狀 8
1.3 主要研究內(nèi)容與特點(diǎn) 8
1.4 論文的組織結(jié)構(gòu) 9
第二章 系統(tǒng)開發(fā)工具及關(guān)鍵技術(shù) 9
2.1 Eclipse工具 9
2.2 java語言 10
2.3 Ik分詞器 10
2.4 TF-IDF算法 10
第三章 可行性分析 11
3.1 社會(huì)可行性 11
3.2 經(jīng)濟(jì)可行性 11
3.3 技術(shù)可行性 12
第四章 軟件需求分析 12
4.1 開發(fā)背景 12
4.2 設(shè)計(jì)目標(biāo)與原則 12
4.3 性能需求分析 13
4.4 技術(shù)難點(diǎn) 14
第五章 軟件設(shè)計(jì) 14
5.1 設(shè)計(jì)思想 14
5.2 模塊設(shè)計(jì) 14
5.2.1 預(yù)處理模塊 15
5.2.2 分詞模塊 15
5.2.3 統(tǒng)計(jì)模塊 15
5.2.4 提取摘要模塊 16
5.2.5 輸出摘要模塊 17
第六章 軟件實(shí)現(xiàn) 17
6.1 西文自動(dòng)摘要軟件流程 17
6.2 各功能模塊實(shí)現(xiàn) 17
6.2.1 預(yù)處理模塊 19
6.2.2 分詞模塊 22
6.2.3 統(tǒng)計(jì)模塊 24
6.2.4 提取摘要模塊 27
6.2.5 輸出摘要模塊 29
第七章 總結(jié)與展望 33
7.1 論文完成情況 33
7.2 以后要做的工作 33
致謝 34
參考文獻(xiàn) 35
摘 要 自動(dòng)摘要是計(jì)算機(jī)語言學(xué)和情報(bào)科學(xué)共同關(guān)注的課題其本質(zhì)是信息的挖掘和信息的濃縮。從理論上講對(duì)自動(dòng)摘要的研究將有助于探討人類理解、概括自然語言文本并從中獲取知識(shí)的認(rèn)識(shí)模型。自動(dòng)摘要被認(rèn)為是計(jì)算機(jī)實(shí)現(xiàn)自然語言理解的重要標(biāo)志之一。從應(yīng)用角度講在文獻(xiàn)電子化和工nternet迅速發(fā)展的今天自動(dòng)摘要軟件的使用將大幅度降低編制摘要的成本縮短文摘的出版周期為人們廉價(jià)、迅速和準(zhǔn)確地獲得所需要的信息提供方便。本文設(shè)計(jì)的西文自動(dòng)摘要軟件采用自動(dòng)摘錄原文中句子方法它將文本視為句子的線性序列將句子視為詞的線性序列。然后通過計(jì)算句子的權(quán)值對(duì)原文中的所有句子按權(quán)值高低降序排列權(quán)值最高的若干句子被確定為文摘句然后將所有文摘句按照它們?cè)谠闹械某霈F(xiàn)順序輸出。系統(tǒng)基于Eclipse平臺(tái)開發(fā)實(shí)現(xiàn)。該系統(tǒng)直接在計(jì)算機(jī)上進(jìn)行文章摘要的自動(dòng)生成要實(shí)現(xiàn)的功能就是給定一個(gè)文檔后經(jīng)過統(tǒng)計(jì)分析給出文檔的摘要句并依照原文順序依次輸出。系統(tǒng)力求摘要句抓住原文的核心內(nèi)容語句連貫不遺漏題。
關(guān)鍵詞:自動(dòng)摘要 線性序列 權(quán)值 文摘句
Western AutoSummary software development
1.2萬字 36頁 原創(chuàng)作品,已通過查重系統(tǒng)
目 錄
第一章 緒 論 7
1.1 課題背景與意義 7
1.2 國內(nèi)外研究現(xiàn)狀 8
1.3 主要研究內(nèi)容與特點(diǎn) 8
1.4 論文的組織結(jié)構(gòu) 9
第二章 系統(tǒng)開發(fā)工具及關(guān)鍵技術(shù) 9
2.1 Eclipse工具 9
2.2 java語言 10
2.3 Ik分詞器 10
2.4 TF-IDF算法 10
第三章 可行性分析 11
3.1 社會(huì)可行性 11
3.2 經(jīng)濟(jì)可行性 11
3.3 技術(shù)可行性 12
第四章 軟件需求分析 12
4.1 開發(fā)背景 12
4.2 設(shè)計(jì)目標(biāo)與原則 12
4.3 性能需求分析 13
4.4 技術(shù)難點(diǎn) 14
第五章 軟件設(shè)計(jì) 14
5.1 設(shè)計(jì)思想 14
5.2 模塊設(shè)計(jì) 14
5.2.1 預(yù)處理模塊 15
5.2.2 分詞模塊 15
5.2.3 統(tǒng)計(jì)模塊 15
5.2.4 提取摘要模塊 16
5.2.5 輸出摘要模塊 17
第六章 軟件實(shí)現(xiàn) 17
6.1 西文自動(dòng)摘要軟件流程 17
6.2 各功能模塊實(shí)現(xiàn) 17
6.2.1 預(yù)處理模塊 19
6.2.2 分詞模塊 22
6.2.3 統(tǒng)計(jì)模塊 24
6.2.4 提取摘要模塊 27
6.2.5 輸出摘要模塊 29
第七章 總結(jié)與展望 33
7.1 論文完成情況 33
7.2 以后要做的工作 33
致謝 34
參考文獻(xiàn) 35
摘 要 自動(dòng)摘要是計(jì)算機(jī)語言學(xué)和情報(bào)科學(xué)共同關(guān)注的課題其本質(zhì)是信息的挖掘和信息的濃縮。從理論上講對(duì)自動(dòng)摘要的研究將有助于探討人類理解、概括自然語言文本并從中獲取知識(shí)的認(rèn)識(shí)模型。自動(dòng)摘要被認(rèn)為是計(jì)算機(jī)實(shí)現(xiàn)自然語言理解的重要標(biāo)志之一。從應(yīng)用角度講在文獻(xiàn)電子化和工nternet迅速發(fā)展的今天自動(dòng)摘要軟件的使用將大幅度降低編制摘要的成本縮短文摘的出版周期為人們廉價(jià)、迅速和準(zhǔn)確地獲得所需要的信息提供方便。本文設(shè)計(jì)的西文自動(dòng)摘要軟件采用自動(dòng)摘錄原文中句子方法它將文本視為句子的線性序列將句子視為詞的線性序列。然后通過計(jì)算句子的權(quán)值對(duì)原文中的所有句子按權(quán)值高低降序排列權(quán)值最高的若干句子被確定為文摘句然后將所有文摘句按照它們?cè)谠闹械某霈F(xiàn)順序輸出。系統(tǒng)基于Eclipse平臺(tái)開發(fā)實(shí)現(xiàn)。該系統(tǒng)直接在計(jì)算機(jī)上進(jìn)行文章摘要的自動(dòng)生成要實(shí)現(xiàn)的功能就是給定一個(gè)文檔后經(jīng)過統(tǒng)計(jì)分析給出文檔的摘要句并依照原文順序依次輸出。系統(tǒng)力求摘要句抓住原文的核心內(nèi)容語句連貫不遺漏題。
關(guān)鍵詞:自動(dòng)摘要 線性序列 權(quán)值 文摘句
相關(guān)文檔
- 分布式多層數(shù)據(jù)庫系統(tǒng)的應(yīng)用.doc
- 教學(xué)網(wǎng)站的設(shè)計(jì)與開發(fā)(開題報(bào)告).doc
- 計(jì)算機(jī)專業(yè)畢業(yè)設(shè)計(jì):工資管理系統(tǒng).doc
- 實(shí)驗(yàn)室管理信息系統(tǒng)數(shù)據(jù)庫的設(shè)計(jì).rar
- java版物業(yè)管理系統(tǒng)論文+設(shè)計(jì)源碼.rar
- 《校園網(wǎng)的組建、管理與維護(hù)》畢業(yè)設(shè)計(jì).doc
- 培訓(xùn)信息管理系統(tǒng)設(shè)計(jì).doc