基于模式識別的手寫漢字識別.doc
基于模式識別的手寫漢字識別,摘要模式識別就是通過計算機用數(shù)學技術(shù)方法來研究模式的自動處理和識別。隨著計算機技術(shù)的發(fā)展,人類對模式識別技術(shù)提出了更高的要求。在我國如何將漢字方便、快速地輸入到計算機中已成為關(guān)系到計算機技術(shù)普及的關(guān)鍵問題。特別是對于大量己有的印刷資料和手稿,計算機自動識別輸入己成為必須研究的課題,所以漢字識別在文獻檢索、辦公自動化、郵...
data:image/s3,"s3://crabby-images/05190/05190677f8737516af6ab12ecf7bb4b863a7240f" alt=""
data:image/s3,"s3://crabby-images/433e3/433e32267c00804bd717422733a90d86dfb9b953" alt=""
內(nèi)容介紹
此文檔由會員 heshihuakai 發(fā)布摘要
模式識別就是通過計算機用數(shù)學技術(shù)方法來研究模式的自動處理和識別。隨著計算機技術(shù)的發(fā)展,人類對模式識別技術(shù)提出了更高的要求。在我國如何將漢字方便、快速地輸入到計算機中已成為關(guān)系到計算機技術(shù)普及的關(guān)鍵問題。特別是對于大量己有的印刷資料和手稿,計算機自動識別輸入己成為必須研究的課題,所以漢字識別在文獻檢索、辦公自動化、郵政系統(tǒng)、銀行票據(jù)處理等方面有著廣闊的應(yīng)用前景。
對手寫漢字進行識別,首先將漢字圖像進行處理,抽取主要表達特征并將特征與漢字的代碼存儲在計算機中,這一過程叫做“訓練”。識別過程就是將輸入的漢字圖像經(jīng)處理后與計算機中的所有字進行比較,找出最相近的字就是識別結(jié)果,這一過程叫做“匹配”。
本文主要介紹了模式識別的基本原理和手寫的10個漢字字符的識別系統(tǒng)的設(shè)計實現(xiàn)過程。第一章介紹了與模式識別有關(guān)的概念、描述方法、有關(guān)的數(shù)學運算和此學科的發(fā)展狀況。第二章分析了模式識別的過程、圖像文件的格式,并詳細介紹了BMP格式圖像的結(jié)構(gòu);由于本文設(shè)計的識別系統(tǒng)是在VC++環(huán)境下開發(fā)的,所以給出了CDib類的定義和功能介紹。第三章主要討論了分類器設(shè)計過程中的特征空間優(yōu)化設(shè)計問題、分類器設(shè)計準則、基本方法和判別函數(shù)的知識。第四章在前三章知識的基礎(chǔ)上,給出了模板匹配法識別圖像的原理,類GetFeature的功能及定義,識別系統(tǒng)設(shè)計的開發(fā)流程及實現(xiàn)過程,并對實驗結(jié)果做出簡單的分析。
關(guān)鍵詞:模式識別 BMP位圖 分類器 手寫漢字識別 模板匹配
I
ABSTRACT
The pattern recognition researches how to treat with and recognize pattern automatically through computer with math arithmetic. Along with the development of computer technology, human need more advanced pattern recognition technology. In our country it is a key problem for computer technology’s popularization that how to input Chinese characters into computer fleetly and conveniently. Especially for large numbers of printed data and manuscript, the automatic recognition and input of Chinese characters becomes a stringent task, therefore the Chinese character recognition will have a broad application prospect on literature retrieva l, office automation, postal service system, bank bill processing.
In order to recognize Chinese characters, the first task we have to do is feature extraction of a map, after that we have to store the feature in the computer. This process is called "the training". The second process is called “match”, This process compares the hand-written Chinese character’s feature and the stored features in the computer.
This paper mainly introduces the basic principles of pattern recognition and the design、 realization process of ten hand-written Chinese characters recognition system. The first chapter mainly introduces the concepts related to the pattern recognition, the description method, the mathematics operation and this discipline’s development condition. The second chapter introduces the pattern recognition’s process, the picture format, especially the BMP form which is used in this paper. This article designs the recognition system under the VC IDE, therefore we introduce a CDib class’s definition and the functions. The third chapter mainly introduces characteristic space optimization design, the classification’s design criterion, the essential method and the knowledge about knowledge function. The fourth chapter produces the principle of template match recognition arithmetic, the class GetFeature’s definition and the functions, the recognition system’s design flow and the realization’s process, finally we produce the experimental result and the simple analysis.
Kewords: Pattern Rocognition BMP Classification Template Match
Hand-written Chinese Characters Recognition
II
目 錄
第1章 緒 論 1
1.1模式識別中的一些基本概念 1
1.2模式的描述方法 1
1.3模式識別學科介紹及現(xiàn)狀 3
1.4論文的主要研究工作 3
第2章 模式識別系統(tǒng)及位圖基礎(chǔ) 4
2.1模式識別系統(tǒng)結(jié)構(gòu) 4
2.2圖像識別 5
2.2.1圖像識別簡介 5
2.2.2圖像識別過程 5
2.3位圖基礎(chǔ)知識 6
2.3.1圖像文件格式介紹 6
2.3.2 BMP文件結(jié)構(gòu) 8
2.3.3 CDib類的建立 10
第3章 分類器設(shè)計 12
3.1 特征空間優(yōu)化設(shè)計問題 12
3.2分類器設(shè)計準則 13
3.3類器設(shè)計基本方法 14
3.4 判別函數(shù) 14
3.5訓練與學習 16
第4章 模板匹配分類器識別漢字系統(tǒng)的實現(xiàn) 17
4.1系統(tǒng)的功能描述 17
4.2模板匹配法的理論基礎(chǔ) 17
4.3特征類的設(shè)計 18
4.4系統(tǒng)的設(shè)計流程及功能的具體實現(xiàn) 19
4.5實驗結(jié)果和分析 22
結(jié)束語 24
致謝詞 25
參考文獻 26
附錄 27