電子文檔處理系統(tǒng).doc
約45頁DOC格式手機打開展開
電子文檔處理系統(tǒng),頁數(shù):45 字數(shù):16612摘要: 作為信息的最重要載體,電子文檔處理的研究引起人們極大的興趣。在任何文檔處理系統(tǒng)中,預處理極為重要,其效果好壞會嚴重地影響其它模塊的工作。特別是灰度圖像二值化效果的好壞,對識別效果以及其后的一切處理都有相當大的影響。原因之一是,任何物理傳感輸入都是灰度圖像,文檔處理系統(tǒng)的大多數(shù)模塊卻僅...
內(nèi)容介紹
此文檔由會員 20023286 發(fā)布
頁數(shù):45 字數(shù):16612
摘要:
作為信息的最重要載體,電子文檔處理的研究引起人們極大的興趣。在任何文檔處理系統(tǒng)中,預處理極為重要,其效果好壞會嚴重地影響其它模塊的工作。特別是灰度圖像二值化效果的好壞,對識別效果以及其后的一切處理都有相當大的影響。原因之一是,任何物理傳感輸入都是灰度圖像,文檔處理系統(tǒng)的大多數(shù)模塊卻僅僅處理二值圖像,圖像二值化是必不可少的。此外,圖像二值化本身也是數(shù)字圖像處理中重要的基本問題。
本文首先介紹完整的文檔處理系統(tǒng)以及其預處理模塊,然后將重點放在二值化問題上,給出圖像閾值化方法的綜述,并對全局閾值化、局部動態(tài)閾值化等方法的優(yōu)點和缺點給出評價。本文尤其針對灰度變化比較復雜的文檔圖像,提出了一種改進的動態(tài)閾值化算法,并以仿真實驗與以往的全局方法進行了比較,證實所發(fā)展新方法的優(yōu)勢。本文對該新算法在具體應用中會遇到的問題也做了估計,并提出解決相應問題的基本原則。
目錄
摘要: 2
第一章 文檔圖像預處理概述 4
1.1 文檔圖像處理系統(tǒng)介紹 4
1.2 文檔圖像預處理 5
1.2.1 彩色圖像轉(zhuǎn)換為灰度圖像,以及灰度圖像的二值化 5
1.2.2 圖像方向的自動檢測與傾斜校正 6
1.2.3 版面結(jié)構(gòu)理解 7
參考文獻 9
第二章 傳統(tǒng)的圖像閾值化方法介紹 10
2.1 圖像分割與圖像閾值化概述 10
2.2 全局閾值選取方法 11
2.2.1 直方圖與直方圖變換方法 11
2.2.2 最大類間方差法(ostu方法) 13
2.2.3 最小誤差法 14
2.2.4 概率松弛法(Relaxation) 15
2.2.5 最大熵方法 16
2.2.5.1 Shannon關(guān)于熵的定義 17
2.2.5.2 Pun的最大熵方法 17
2.2.5.3 Kapur,Sahoo和Wong的方法 19
2.2.5.4 Abutaleb的二維熵算法 19
2.2.5.5 Pal和Bhandari的條件熵方法 21
2.3 局部閾值方法與動態(tài)閾值選取 24
2.3.1 Chow和Kaneko的方法 26
2.3.2 Yanowitz和Bruckstein的方法 26
2.3.3 Sauvola和Pietikäinen的方法 27
參考文獻 29
第三章 改進的算法:直接局域二值化方法 30
3.1 問題的提出 30
3.2 對問題的分析及解決方案的提出 32
3.3 直接局域二值化方法 32
3.3.1 將圖像劃分成為子區(qū)域 33
3.3.2 使用改進的條件熵方法進行閾值化 35
3.4 算法效果比較 41
參考文獻 44
第四章 總結(jié)與展望 45
關(guān)鍵詞:預處理,灰度圖像,二值化,閾值
參考文獻
[1] Pal,N.R.,Bhandari,D., “Image thresholding”. Signal Processing , 1993,33(2),pp.139-158
[2] C. K. Chow and T. Kaneko, "Automatic detection of the left ventricle from cineangiograms", Computers and Biomedical Research, , 1972,vol. 5, pp. 388—410
[3] J.Sauvola,M.Pietikäinen, “Adaptive document image binarization”, Pattern Recognition ,2000(33), pp. 225-236
摘要:
作為信息的最重要載體,電子文檔處理的研究引起人們極大的興趣。在任何文檔處理系統(tǒng)中,預處理極為重要,其效果好壞會嚴重地影響其它模塊的工作。特別是灰度圖像二值化效果的好壞,對識別效果以及其后的一切處理都有相當大的影響。原因之一是,任何物理傳感輸入都是灰度圖像,文檔處理系統(tǒng)的大多數(shù)模塊卻僅僅處理二值圖像,圖像二值化是必不可少的。此外,圖像二值化本身也是數(shù)字圖像處理中重要的基本問題。
本文首先介紹完整的文檔處理系統(tǒng)以及其預處理模塊,然后將重點放在二值化問題上,給出圖像閾值化方法的綜述,并對全局閾值化、局部動態(tài)閾值化等方法的優(yōu)點和缺點給出評價。本文尤其針對灰度變化比較復雜的文檔圖像,提出了一種改進的動態(tài)閾值化算法,并以仿真實驗與以往的全局方法進行了比較,證實所發(fā)展新方法的優(yōu)勢。本文對該新算法在具體應用中會遇到的問題也做了估計,并提出解決相應問題的基本原則。
目錄
摘要: 2
第一章 文檔圖像預處理概述 4
1.1 文檔圖像處理系統(tǒng)介紹 4
1.2 文檔圖像預處理 5
1.2.1 彩色圖像轉(zhuǎn)換為灰度圖像,以及灰度圖像的二值化 5
1.2.2 圖像方向的自動檢測與傾斜校正 6
1.2.3 版面結(jié)構(gòu)理解 7
參考文獻 9
第二章 傳統(tǒng)的圖像閾值化方法介紹 10
2.1 圖像分割與圖像閾值化概述 10
2.2 全局閾值選取方法 11
2.2.1 直方圖與直方圖變換方法 11
2.2.2 最大類間方差法(ostu方法) 13
2.2.3 最小誤差法 14
2.2.4 概率松弛法(Relaxation) 15
2.2.5 最大熵方法 16
2.2.5.1 Shannon關(guān)于熵的定義 17
2.2.5.2 Pun的最大熵方法 17
2.2.5.3 Kapur,Sahoo和Wong的方法 19
2.2.5.4 Abutaleb的二維熵算法 19
2.2.5.5 Pal和Bhandari的條件熵方法 21
2.3 局部閾值方法與動態(tài)閾值選取 24
2.3.1 Chow和Kaneko的方法 26
2.3.2 Yanowitz和Bruckstein的方法 26
2.3.3 Sauvola和Pietikäinen的方法 27
參考文獻 29
第三章 改進的算法:直接局域二值化方法 30
3.1 問題的提出 30
3.2 對問題的分析及解決方案的提出 32
3.3 直接局域二值化方法 32
3.3.1 將圖像劃分成為子區(qū)域 33
3.3.2 使用改進的條件熵方法進行閾值化 35
3.4 算法效果比較 41
參考文獻 44
第四章 總結(jié)與展望 45
關(guān)鍵詞:預處理,灰度圖像,二值化,閾值
參考文獻
[1] Pal,N.R.,Bhandari,D., “Image thresholding”. Signal Processing , 1993,33(2),pp.139-158
[2] C. K. Chow and T. Kaneko, "Automatic detection of the left ventricle from cineangiograms", Computers and Biomedical Research, , 1972,vol. 5, pp. 388—410
[3] J.Sauvola,M.Pietikäinen, “Adaptive document image binarization”, Pattern Recognition ,2000(33), pp. 225-236