基于weka數(shù)據挖掘工具的設計與開發(fā)--粗集分類算法的設計與實現(xiàn).doc
基于weka數(shù)據挖掘工具的設計與開發(fā)--粗集分類算法的設計與實現(xiàn),摘 要隨著大規(guī)模數(shù)據庫和數(shù)據倉庫的廣泛應用,如何從海量數(shù)據中獲取有用的知識成為研究的熱點問題。數(shù)據挖掘(data mining,dm)的任務就是在如此海量的數(shù)據中提取有用的數(shù)據,它在商業(yè)方面的成功應用使得各種dm工具接踵而至。weka(懷卡托智能分析系統(tǒng))是一種免費且開源的數(shù)據挖掘軟件,它由新西蘭懷卡托大學開發(fā),功能強...
內容介紹
此文檔由會員 li484167 發(fā)布摘 要
隨著大規(guī)模數(shù)據庫和數(shù)據倉庫的廣泛應用,如何從海量數(shù)據中獲取有用的知識成為研究的熱點問題。數(shù)據挖掘(Data Mining,DM)的任務就是在如此海量的數(shù)據中提取有用的數(shù)據,它在商業(yè)方面的成功應用使得各種DM工具接踵而至。Weka(懷卡托智能分析系統(tǒng))是一種免費且開源的數(shù)據挖掘軟件,它由新西蘭懷卡托大學開發(fā),功能強大、方便使用,本課題將對Weka工具進行擴充開發(fā)。分類是數(shù)據挖掘的重要分支之一,而粗集理論為處理具有模糊、不精確或不完全信息的分類問題提供了一種新的工具。目前粗集理論已被應用于機器學習、故障診斷、關系數(shù)據庫中知識獲取等各種應用領域,并取得了很大成功。
本文介紹了數(shù)據挖掘相關知識、技術和算法以及數(shù)據挖掘工具Weka的相關知識。主要學習了粗集理論分類方法的基礎,在理解粗集分類算法思想的基礎上,把粗集分類應用到數(shù)據挖掘中。將粗集分類算法集成到數(shù)據挖掘工具Weka上,擴充了Weka系統(tǒng)的功能。
關鍵詞:數(shù)據挖掘 分類 粗集 Weka
ABSTRACT
With the widespread use of large databases and data warehouse,How to acquire useful knowledge from large scale of data becomes study focus.The purpose of Data Mining(DM) is withdraw some useful information from a great deal of data,the successful of DM in the commercial application makes a lot of data mining tools emerged.Weka(Waikato Environment for Knowledge Analysis)is one kind of DM tool and we can get it free,it’s also an open-source tool.Weka was developed at the University of Waikato in New Zealand,it’s function is strong and you can easily using it,This assigment will extension develops Weka .classification is one of the important tasks in the field of data mining, Rough Set theory to deal with the fuzzy, inaccurate or incomplete information provided to the classification of a new tool.Now rough set theory has been used in machine learning, fault diagnosis, relational database access to knowledge and other areas of application,and achieved great success.
This dissertation introduces Knowledge of DM and its relative technology as well as its programs,and the related knowledge of the data mining tools of Weka. Study of rough set theory based on the classification method, Set in understanding the rough classification algorithm on the basis of ideology And Set the rough classification applied to the data mining.And set the Rough Set classification algorithm based on expanded the data mining tools of Weka,Weka expansion of the system.
Key Words: Data mining,Classification, Rough Set,Weka
目 錄
第一章 緒 論 - 1 -
1.1設計背景 - 1 -
1.2 數(shù)據挖掘工具在國內外應用及研究現(xiàn)狀 - 1 -
1.2.1 數(shù)據挖掘工具的簡述 - 1 -
1.2.2 國內外數(shù)據挖掘工具應用及研究現(xiàn)狀 - 3 -
1.3 本文內容 - 6 -
1.4 設計成果 - 7 -
第二章 數(shù)據挖掘及方法的簡介 - 8 -
2.1概述 - 8 -
2.2數(shù)據挖掘與知識發(fā)現(xiàn) - 8 -
2.2.1 數(shù)據挖掘的過程 - 8 -
2.2.2 數(shù)據挖掘的任務 - 10 -
2.2.3 數(shù)據挖掘方法和技術 - 11 -
2.3 數(shù)據挖掘技術的應用 - 12 -
2.4本章小結 - 14 -
第三章 數(shù)據挖掘中的分類技術 - 15 -
3.1概述 - 15 -
3.2數(shù)據挖掘分類技術 - 15 -
3.2.1分類的基本概念 - 15 -
3.2.2典型分類方法 - 16 -
3.3 本章小結 - 18 -
第四章 粗集理論在分類問題中的應用 - 19 -
4.1概述 - 19 -
4.2經典粗集理論 - 19 -
4.2.1粗集的基本概念 - 19 -
4.2.2知識的約簡與核 - 21 -
4.2.3知識的相對約簡與相對核 - 21 -
4.2.4知識的依賴性 - 22 -
4.3信息觀描述粗集 - 23 -
4.4粗集理論在分類問題中的應用 - 25 -
4.4.1數(shù)據集的粗集觀描述 - 25 -
4.4.2屬性約簡 - 26 -
4.4.3基于屬性重要性的啟發(fā)式約簡算法 - 26 -
4.4.4兩種約簡算法之比較 - 29 -
4.5基于粗集的分類方法 - 29 -
4.5.1基于屬性約簡和屬性值約簡的粗集分類方法 - 30 -
4.5.2另一種粗集分類方法 - 32 -
4.5.3兩種分類方法之比較 - 33 -
4.6 基于粗集理論改進經典決策樹算法 - 34 -
4.6.1經典的決策樹學習算法 - 34 -
4.6.2基于屬性重要性度量的多變量決策樹構造算法 - 35 -
4.7 本章小結 - 36 -
第五章 基于Weka的分類模型實現(xiàn) - 37 -
5.1概述 - 37 -
5.2基于Weka分類模型的設計 - 37 -
5.2.1 Weka系統(tǒng)簡介 - 37 -
5.2.2對Weka系統(tǒng)進行擴充 - 41 -
5.3基于Weka分類模型的測試 - 45 -
5.4小結 - 49 -
結束語 - 50 -
致 謝 - 51 -
參考文獻 - 52 -
TA們正在看...
- 01.1四時田園雜興課堂教學教案教學設計(部編版).doc
- 01.2稚子弄冰課堂教學教案教學設計(部編版).doc
- 01.3村晚課堂教學教案教學設計(部編版).doc
- 02冬陽·童年·駱駝隊公開課優(yōu)秀教案教學設計(五年...doc
- 02冬陽·童年·駱駝隊最新教研教案教學設計(部編版...doc
- 02冬陽·童年·駱駝隊課堂教學教案教學設計(部編版).doc
- 03祖父的園子公開課優(yōu)秀教案教學設計(五年級下冊).doc
- 03祖父的園子最新教研教案教學設計(部編版五年級下...doc
- 03祖父的園子課堂教學教案教學設計(部編版).doc
- 04草船借箭公開課優(yōu)秀教案教學設計(五年級下冊).doc