基于層次式凝聚聚類(lèi)的文本聚類(lèi)算法的實(shí)現(xiàn).docx


約34頁(yè)DOCX格式手機(jī)打開(kāi)展開(kāi)
基于層次式凝聚聚類(lèi)的文本聚類(lèi)算法的實(shí)現(xiàn),the implementation of text clustering algorithm based on hierarchical clustering algorithm1.76萬(wàn)字 34頁(yè)原創(chuàng)作品,已通過(guò)查重系統(tǒng)摘要 文本聚類(lèi)是數(shù)據(jù)挖掘的一個(gè)重要分支,是劃分文本與處理數(shù)...


內(nèi)容介紹
此文檔由會(huì)員 馬甲線(xiàn)女神 發(fā)布
基于層次式凝聚聚類(lèi)的文本聚類(lèi)算法的實(shí)現(xiàn)
The Implementation of text Clustering Algorithm based on
Hierarchical Clustering Algorithm
1.76萬(wàn)字 34頁(yè) 原創(chuàng)作品,已通過(guò)查重系統(tǒng)
摘要 文本聚類(lèi)是數(shù)據(jù)挖掘的一個(gè)重要分支,是劃分文本與處理數(shù)據(jù)的重要方法和手段,文本聚類(lèi)已經(jīng)在國(guó)內(nèi)外各領(lǐng)域取得了廣泛的應(yīng)用。文本聚類(lèi)算法主要分為基于層次的方法、基于網(wǎng)格的方法、基于模型的方法、基于密度的方法。凝聚的層次聚類(lèi)是一種自底向上的策略,首先將每個(gè)對(duì)象作為一個(gè)簇,然后合并這些原子簇為越來(lái)越大的簇,直到所有的對(duì)象都在一個(gè)簇中,或者某個(gè)終結(jié)條件被滿(mǎn)足。
論文主要研究了如何將文本集表示成為數(shù)學(xué)上可分析處理的形式,用中文分詞組件對(duì)文本信息進(jìn)行預(yù)處理(分詞、切詞、去除無(wú)用詞),用向量空間模型建立文本信息特征,最后基于Java實(shí)現(xiàn)了基于層次式凝聚類(lèi)文本聚類(lèi)的系統(tǒng)。
關(guān)鍵詞:文本聚類(lèi) 層次式凝聚類(lèi) AGENES 文本預(yù)處理 權(quán)重計(jì)算
The Implementation of text Clustering Algorithm ba
Hierarchical Clustering Algorithm
1.76萬(wàn)字 34頁(yè) 原創(chuàng)作品,已通過(guò)查重系統(tǒng)
摘要 文本聚類(lèi)是數(shù)據(jù)挖掘的一個(gè)重要分支,是劃分文本與處理數(shù)據(jù)的重要方法和手段,文本聚類(lèi)已經(jīng)在國(guó)內(nèi)外各領(lǐng)域取得了廣泛的應(yīng)用。文本聚類(lèi)算法主要分為基于層次的方法、基于網(wǎng)格的方法、基于模型的方法、基于密度的方法。凝聚的層次聚類(lèi)是一種自底向上的策略,首先將每個(gè)對(duì)象作為一個(gè)簇,然后合并這些原子簇為越來(lái)越大的簇,直到所有的對(duì)象都在一個(gè)簇中,或者某個(gè)終結(jié)條件被滿(mǎn)足。
論文主要研究了如何將文本集表示成為數(shù)學(xué)上可分析處理的形式,用中文分詞組件對(duì)文本信息進(jìn)行預(yù)處理(分詞、切詞、去除無(wú)用詞),用向量空間模型建立文本信息特征,最后基于Java實(shí)現(xiàn)了基于層次式凝聚類(lèi)文本聚類(lèi)的系統(tǒng)。
關(guān)鍵詞:文本聚類(lèi) 層次式凝聚類(lèi) AGENES 文本預(yù)處理 權(quán)重計(jì)算
TA們正在看...
- 高中數(shù)學(xué)必修2第一章空間幾何講義與習(xí)題及答案.doc
- 高中數(shù)學(xué)必修2解析幾何初步測(cè)試題及答案詳解.doc
- 高中數(shù)學(xué)必修2資料立體幾何知識(shí)點(diǎn)及解題思路.doc
- 高中數(shù)學(xué)必修3知識(shí)點(diǎn)總結(jié):第二章統(tǒng)計(jì).doc
- 高中數(shù)學(xué)必修4三角函數(shù)專(zhuān)題復(fù)習(xí)學(xué)生用資料.doc
- 高中數(shù)學(xué)必修4三角函數(shù)公式大全附帶練習(xí)題.doc
- 高中數(shù)學(xué)必修4三角恒等變換復(fù)習(xí)專(zhuān)題.doc
- 高中數(shù)學(xué)必修4習(xí)題和復(fù)習(xí)參考題及對(duì)應(yīng)答案.doc
- 高中數(shù)學(xué)必修4測(cè)試題及答案.doc
- 高中數(shù)學(xué)必修4知識(shí)點(diǎn)總結(jié):第二章平面向量.doc