時間:2023-03-23 15:17:56
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇圖像分析論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
英文名稱:Chinese Journal of Stereology and Image Analysis
主管單位:中國科學技術協會
主辦單位:中國體視學學會
出版周期:季刊
出版地址:北京市
語
種:中文
開
本:大16開
國際刊號:1007-1482
國內刊號:11-3739/R
郵發代號:
發行范圍:國內外統一發行
創刊時間:1996
期刊收錄:
核心期刊:
期刊榮譽:
Caj-cd規范獲獎期刊
聯系方式
關鍵詞:憎水性;模糊邏輯;閾值分割
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2012)10-2343-02
當今社會,輸電線路中有一種不可缺少的重要設備,這就是以硅橡膠復合絕緣子為主要選擇的絕緣子。這種絕緣子在輸電、發電、變電、配電等各個環節中的應用非常廣泛,它不僅量大面廣,而且種類繁多。硅橡膠表面不僅憎水性良好而且憎水遷移非常獨特。如果絕緣子表面一旦受潮,吸附的水分就會以不連續的并且孤立的小水珠形式性而存在,它并不會形成連續的水膜,這就大大地限制了表面泄漏的電流,從而提高了閃絡的電壓。相比于其它有機材料來說,硅橡膠是具有獨特的憎水遷移性的,也就是說硅橡膠表面被臟污后,硅橡膠能夠把自身的憎水性輕易地遷移到污穢物的表面,能讓污穢物表面也具有憎水性。為了能讓憎水性鑒定的結果體現出客觀性,國內外的一些學者已做過很多研究,為了能客觀地判斷絕緣子的憎水性,他們曾試著使用圖像分析法,實際上,他們確實取得了一些研究成果,但是這些方法不能很好地判決現場所獲污穢復合絕緣子的噴水圖像的等級效果。
因為圖像本身存在的不確定性,使得進行圖像分析和處理較為困難,圖像分割旨在把圖像劃分成各個特色的區域,它是一種基本的計算機視覺技術,利用圖像信息中的部分特征提取圖像中的目標進行技術分析,亦是進行圖像分析與描述研究的關鍵技術之一。本質上說,對圖像進行分割是在其屬性的基礎上對圖像像素進行分析的過程,由于圖像分割方法是面向具體問題的,故沒有通用的方法能夠對圖像分割進行描述,而諸多方法中的閾值分割法是最重要的圖像分割方法之一,為此該文提出了基于二維最大模糊熵的閾值分割法對圖像分割進行研究。
1模糊邏輯理論與圖像分割關系
1965年美國加州大學伯克利分校的自動控制專家和數學家L.A.Zadeh教授發表的論文中正式提出集合理論,首次把模糊引入技術文獻中,開創了一數學分支。所謂模糊邏輯理論的提出就是通過模擬人的各種模糊信息處理能力來處理實際問題的理論學科,模糊技術應用于圖像處理,因為模糊邏輯方法的引入,改變了人們對事物特征單純的版面的描述,使其參客體信息的表達更加合理,目標信息的利用更加充分,也將模糊問題轉化為確定性或者更加適合于計算機處理的問題,因此得到了廣泛的應用。
基于模糊邏輯理論的圖像分割技術,通常也簡稱之為圖像的模糊分割技術,就是用模糊概念來描述圖像的性質、特征和關系,用模糊集合與系統理論來理解、表示和處理分割過程的圖像處理方法。一幅圖像中往往包含灰度、空間結構等相關信息,這些信息是與具體的視覺和觀察者相關的,而這些信息是取決于先驗知識和經驗,在多數情況下是復雜的,不能夠用經典的精確的數學語言來描述的,所以這些信息一般是具有較強的模糊信息特性的。在圖像分割的理論中,如何選取圖像信息以及如何利用圖像信息是實現分割的關鍵所在,在圖像處理的過程中,由于模糊處理的信宿是人,所以在認識和處理圖像的過程中,應當對人的視覺特性以及圖像本身所具有的特點進行充分考慮。圖像本身具有模糊性,即存在許多不精確性和不確定性,這是由于圖像在成像過程中是多對一的映射過程所決定的。這種不精確性和不確定性主要是體現在幾何形狀的不確定性、圖像灰度的不確定性以及不確定性知識等形式,L.A.Zadeh教授提出用模糊理論來對這種不精確性和不確定性進行研究,從而提供了有效的處理技術來對智能信息進行處理。很多專家學者近幾年來都致力于把模糊理論應用到圖像處理中,并且取得了一些良好的效果。
2圖像分割的數學描述
從數學角度,圖像分割是按選定的一致性屬性準則P,將圖像I正確地劃分為互不交迭的區域非空子集S1,S2,....Sr,的過程。正確的區域劃分必須滿足下列四個條件:
(1)I=∪
3基于二維最大模糊熵的閾值分割法
識別絕緣表面噴水圖像中的水珠(水跡)極為困難,主要因為絕緣子的目標與背景之間的灰度差非常小,灰度差極小是由水珠的透明性和絕緣子所處環境的復雜性所導致的,還有一個重要的原因是水對光的反射以致于對光一側的邊界極為模糊,為了達到好的識別效果,必須選用好的圖像增強和圖像濾波方法?;谀:壿嫷臑V波的思想是對憎水性圖像進行圖像濾波時應用模糊知識,在此基礎上建立適當地隸屬函數,從而達到增強邊緣與去除噪聲的雙重效果。該文提出的算法是以圖像的模糊熵為依據,選取閾值的依據是最大熵原則,由于對模糊集的判斷的標準各式各樣,為了減少這種主觀性的誤差,引入錄入模糊熵的概念。
熵是用在信息論中進行描述概率分布的不確定性程度的一個重要的概念。將熵理論和模糊集理論進行結合,就可以得到模糊熵。顧名思義,用以描述一個模糊集的模糊程度叫做模糊熵。根據信息論,熵的定義為:H(x)=-∫-∞
p(x)lgp(x)dx
所謂灰度的一維熵最大,就是選擇一個閾值,使圖像用這個閾值分割出的兩部分的一階灰度統計的信息量最大。設nk為數字圖像中灰度級k的象素點數,pk為灰度級k出現的概率,則pk=nk/(N×N), k=1,2…L
圖像灰度直方圖如下圖1所示:圖1圖像灰度直方圖
O區概率分布為:pi/pt i =1,2…t
B區概率分布為:pi/(1-pt) i =t+ 1,t+2…L
其中:pt=∑i=1tpi
選取灰度圖像中4鄰域的4個像素點為研究區域,計算區域灰度均值,如此則對應于各像素點,設nij分別為N個灰度級的圖像的灰度為i的點以及所選區域中灰度均值為j的像素點的數量,而pij為點灰度區域灰度均值對應的(i,j)所發生的概率,則有
pij=nij/(N×N),
{pi,j}就定位是該圖像中關于點灰度-區域的灰度均值所得的二維直方圖。
假設一大小為M×N的憎水性灰度圖像R,像素(x,y)的灰度值用R(x,y)來表示,區間為[0,N-1],令:
pk=
其中,nk代表的是灰度值為k的像素的數量,設定合適的閾值門限,閾值的選取時閾值分割技術是關鍵,如果過高則過多的目標點會被誤歸為背景;如果閾值過低則會出現相反的情況,誤成為目標。要成功地將圖像分為背景和目標兩大類,就必須找到適當的閾值,利用該閾值就可以很好地對圖像進行分割,大于閾值的像素值為目標,少于閾值的像素值為背景。
4實驗結果與分析
用該文的算法進行圖像分割,該文采用了水珠的憎水性圖像進行了實驗測試,對HC1的低昂性的憎水性圖像進行圖像分割的處理,結果表明,對憎水性圖像進行基于二維最大模糊熵的圖像分割不僅可以很好地改善圖像的灰度分布,還能有明顯地圖像增強效果。基于二維最大模糊熵的圖像分割相對經典的圖像分割算法來說,可以更準確地提取出水珠的形狀信息,利用模糊濾波可以去除一些噪聲,將更方便于的圖像的邊緣檢測。采用該文算法能夠將憎水性等級判決的準確率提高,且采用預處理方法對憎水性圖像進行預處理,不僅可以對圖像進行簡單地去噪,而且能夠將憎水性等級判決的準確率提高,實驗仿真結果如圖所示。
5結束語
根據憎水性圖像的特點,該文采用了基于二維最大模糊熵閾值分割法對現有的憎水性圖像進行試驗性分割,實驗仿真結果表明該方法對圖像進行分割后可以使圖像更加清晰,同時也可以提高評定憎水性圖像等級的準確率。
參考文獻:
[1] Wei Zhang,qun li.An improved adaptive threshold image denoising algorithm based on wavelet[J].IEEE Transaction on image processing,
2002,35(19):1623-1629.
[2].周彬,孫毅,祁兵.硅橡膠復合絕緣子憎水性圖像分割算法[J].安徽電氣工程職業技術學院學報,2008(1)。
[3].婁聯堂,甘霞,林均.基于圖像分析絕緣子憎水性分級系統[J].鄂州大學學報,2007,(05).
[4].Sendur L, Selesnick I W. Bivariate shrinkage with local variance estimation.IEEE Signal Process. Lett, 2002, 9(12): 438-441.
[5].祁兵,唐良瑞,趙春輝.絕緣子憎水性圖像水珠/水跡形狀提取算法[J].電工技術學報,2008(6)。
醫學工程由于其學科的高度綜合交叉性,對學生創新能力的培養相對其它學科更為重要,也更具有探索性。關于醫學工程學生創新能力培養的論文已有很多[3-6],他們都從不同的角度闡述了醫學工程學生創新能力培養的途徑、方法與模式。具體從某一學術領域研究對醫學工程創新能力培養的文章還鮮見于文獻,本文嘗試從圖像分割領域入手,首先概述圖像分割的概念和基本算法,接著闡述圖像分割在醫學工程領域中的重要作用,最后結合實際應用重點研討醫學工程學生的創新能力培養。
1圖像分割及其基本算法
圖像分割是一種重要的圖像分析技術。在對圖像的研究和應用中,人們往往僅對圖像中的某些部分感興趣,這些部分常稱為目標或前景,而其他部分稱為背景,前景一般對應圖像定的、具有獨特性質的區域。為了辨識和分析圖像中的目標,需要將它們從圖像中分離提取出來,在此基礎上才有可能進一步對目標進行測量和對圖像進行處理。簡而言之,圖像分割就是指根據某種均勻性或一致性的原則將圖像分成若干個有意義的部分,使得每一部分都符合某種一致性的要求,而任意兩個相鄰部分的合并都會破壞這種一致性。圖像的分割在很多情況下可以歸結為圖像像素點的分類問題[7]。目前應用較多的圖像分割方法主要有兩種:基于區域的圖像分割方法和基于邊緣檢測的圖像分割方法。前者通過檢測同一區域內的均勻性是否一致來將圖像中的不同區域識別出來,主要包括閾值分割法、區域生長法、聚類分割法以及基于隨機場的方法等?;谶吘墮z測的分割法是通過邊緣檢測技術把不同區域分割開來,常用的方法包括微分算子法、形態學梯度法、曲面擬合法、邊界曲線擬合法,以及串行邊界查找等[8]。這些分割方法都有自己的優點和缺點,以及不同的應用范圍。經過對這些算法的改進以及重新組合,也有人提出了新的算法,盡管這些新的算法對一些圖像的分割能夠取得好的效果。但對于背景復雜的弱邊界醫學圖像分割效果不佳。近十年以來,針對傳統圖像分割方法的局限性,研究重點逐漸放在基于偏微分方程、借助曲線演化模型等數學建模方法的圖像分割,其中最具有代表性的就是水平集方法和活動輪廓模型[9]。盡管這類方法的分割效果與參數的選擇有關,但具有一定的規律,且只要參數選擇合理,對于邊界模糊、對比度低的醫學圖像分割,亦可達到理想的分割效果[10]。
2圖像分割在醫學工程中的重要作用
隨著醫學成像在臨床診斷和治療上的作用越來越顯著,醫學圖像分割就成為醫學圖像分析領域的一個重要的研究課題。由于手工分割很耗時,且主觀性強,因此,尋求在計算機的幫助下,從CT、MRI、PET以及其它模式醫學圖像中提取有關解剖結構的有用診斷信息成了我們的任務。盡管現代成像設備提供了對內部解剖結構的優越的觀察條件,使用計算機技術對內部解剖結構進行精確而有效的量化和分析仍然是有限的。醫學圖像分割可以提取出準確的、可重復的、量化的病理生理數據,滿足不同的生物醫學研究和臨床應用的需要。醫學圖像分割的目的是通過提取描述對象的特征,把感興趣對象從周圍環境中分離出來,分析和計算分割對象的解剖、病理、生理、物理等方面的信息。圖像分割過程是對醫學圖像進行對象提取、三維重建、體積顯示、圖像配準、臨床診斷、病理分析、手術計劃、治療方案、療效評估、影像信息處理、計算機輔助診斷等處理的一個必不可少的步驟。醫學臨床實踐和研究經常需要對人體某種組織和器官的形狀、邊界、截面面積以及體積進行測量,從而得出該組織病理或功能方面的重要信息。精確的測量對疾病的診斷和治療有重要的臨床意義。在一段時間內多次測量同一種與某種疾病相關的組織的體積,可以得到病情發展的信息或用作治療效果的監測手段[9]。如腫瘤學的臨床研究經常用腫瘤收縮的程度和時間來評估治療效果,將腫瘤大小的精確量化數值作為療效的測度;肝臟移植供體與受體的肝臟體積測量與脈管分析是肝臟移植術前最重要的預評估工作;視網膜血管的形狀、寬度、扭曲以及分叉等結構特征的變化可以直接反映各種眼科疾病對血管網絡形態結構的影響,這些特征的變化對某些眼底疾病的早期診斷有重要的意義[11]等等,這些都與圖像分割及其準確程度密切相關。此外,不同模式醫學圖像間的配準、血液細胞的識別和分類、血管造影圖像中冠狀動脈邊緣的監測、乳腺片中微鈣化點的檢測、放化治療、神經外科手術的計劃與圖像引導的手術等也都要求對組織成分的位置和大小精確定位和計算。對人體各種組織的正確分類不僅可以為臨床組織病變提供計算機輔助診斷依據,而且也是圖像三維重建和醫學圖像可視化的基礎。由于人體解剖的個體差異較大,臨床應用對醫學圖像分割的準確度和分類算法的速度要求又較高,目前雖然已有多種分割算法,但是遠未達到完善。因此,醫學圖像分割領域的研究仍然是當前醫學圖像處理和分析的熱點。
3圖像分割與醫學工程學生創新能力培養
圖像分割實踐是培養醫學工程學生創新能力非常有效的途徑。首先,由于醫學圖像實際獲取設備與條件的不同,引起測量上的不精確性和不確定性,造成醫學圖像數據非常復雜,這給醫學圖像分割帶來了極大的挑戰。其次,圖像分割方法靈活多樣,能否熟練地、有針對性地應用這些方法解決醫學圖像分割領域的具體問題,是檢查學生創新能力的非常有效的辦法。第三,圖像分割要求學生具有扎實的數學基礎,熟練的編程能力以及知識的綜合應用能力。現在的醫學成像設備,如CT、MRT成像設備,它們自帶的分割軟件一般使用閾值分割的方法,盡管這些設備尤其是國外設備使用閾值分割的精度很高,但因閾值分割只是簡單地根據圖像的灰度值進行分類,因此,這一方法對于具有復雜背景、形狀不規則的醫學圖像分割來說,具有自身的缺點。如對于肝臟CT圖像的分割與三維重建,由于肝臟與周圍器官的弱邊界問題,單獨應用閾值分割是很難解決問題的,因此,我們就要激發學生的創新思維,從模糊聚類、區域增長、數學形態學、水平集方法等角度加以思考。盡管如此,自動地分割某一個人的肝臟CT序列圖像,也會遇到困難,這是因為(1)肝臟相鄰器官或組織如腔靜脈、肌肉等的灰度值與肝臟很相近;(2)由于造影劑影響、CT設備不同模態的設定對不同供體的肝臟和其它組織呈現出不同的灰度值,甚至同一供體不同切片都會如此;(3)CT圖像不同切片的解剖結構不同,不同供體的肝臟形狀差異顯著,甚至會出現兩三個分散的肝臟區域出現在同一個切片中;(4)肝臟形狀是不規則的,它們延伸至腹部左側與脾臟相連,由于這兩個器官的灰度值范圍幾乎相同,即便人眼觀察,也無法確定二者邊界,因此,由于檢測不到脾臟和肝臟的邊界,一般算法無法完成分割。因此,我們可以啟發學生應用神經網絡的智能分割方法,根據上一切片的分割結果自動分割同一序列的下一切片圖像,這樣又會涉及到如何將肝臟的灰度信息、分塊信息,以及相鄰切片間的空間信息融合到一起,也就是說,如何構造神經網絡的特征向量[12]。在肝臟分割的過程中,還會涉及到肋脊椎骨與腎臟的分割,這些器官如果單純根據圖像分割的方法是很難解決問題的,必須借助于醫學解剖學知識,如對稱性、連續性等[13、14]。再如,對于醫生非常感興趣的肝靜脈與肝門靜脈的分割與三維重建,由于注射造影劑后它們的灰度與周圍的的肝臟區別明顯,因此,采用閾值分割的方法就很容易得到所需的結果,但由于這兩種血管灰度一致,因此,使用醫院CT設備自帶的軟件三維重建后,它們是交織在一起的,這就不便于醫生觀察,甚至會發生混淆,這個時候就要啟迪學生的醫學知識應用能力,結合解剖學知識并應用圖像分割方法解決這個問題。另外,通過對肝臟圖像的分割,學生還可以進一步將這些知識和理論應用到非醫學圖像領域的分割。如結合單閾值分割,可以引導學生進行多閾值分割,并提出改進的方法[15];結合CV模型與LBF模型,可以引導學生通過高斯核函數改進CV模型圖像擬合函數,得到加權形式的能檢測局部區域灰度不均勻的函數;并針對當CV模型在低對比度圖像中檢測不同灰度目標時出現的誤分割情況,提出一項全局約束函數,用于調控曲線在運動中兼顧檢測梯度幅值不為零的點,并將改善的方法用于復雜的紋理圖像分割[16]。
綜上所述,對于學生的創新能力培養,我們如果能結合實際應用就能挖掘學生的潛能,開闊學生的視野,激發學生的學習熱情,還可以提高學生理論與實踐相結合的能力。在以上肝臟CT圖像的分割例子中,可以看出,學生不僅需要一定的醫學知識與醫學影像基礎,還需要一定的圖像處理理論與智能模式識別理論,如模糊聚類、水平集方法、區域增長、數學形態學[17]、神經網絡等,而且,更重要的是,通過肝臟分割這一簡單的課題可以引申出一系列相關的課題,這些課題不僅具有內在的聯系,也是相對獨立的,而且層層深入,要求學生不僅要知識全面,尤其要能靈活運用,融會貫通。這對于學生的創新能力培養具有極大的價值,我們課題組的學生也通過這條途徑,結合國家級、省級與校級的創新課題,學到了很多書本上學不到的知識,包括他們的團隊協作能力和科研能力的提高,還發表了相應的學術論文[10,12-17]。
再比如,對于視網膜血管圖像的分割,現在的文獻中已有很多方法,包括傳統的Gabor小波方法,匹配濾波(MatchedFilter,MF)方法以及它的改進算法,基于知識引導的自適應閾值分割方法等等,盡管這些方法都比較新穎,也能取得較好的分割結果,但都對視網膜中微小血管的分割無能為力。如果能夠引導學生先對圖像進行直方圖增強,再經過二維Gabor小波的平滑處理,學生就會發現被“隱藏”的微小血管得到了呈現。由于水平集方法對較粗血管分割的優勢,以及區域增長方法對微小血管分割的優勢,學生自然就會找到最終的分割方法。盡管方法比較傳統,但效果比其他方法都好,這樣不僅加深了學生對以上各種圖像分割算法的進一步認識,更大大激發了學生的科研熱情,提高了學生的創新能力。還有,圖像分割往往離不開對分割結果的比較與評價,高水平學術論文中,分割結果的比較與評價往往是一件很重要的事情,也是一件比較困難的事情,并且一般占了大量的篇幅,因此,在圖像分割的學習與實踐中,有意識地培養學生這方面的能力,也是值得重視的。這不僅要求學生有一定的圖像分割知識積累,敏銳的思維,扎實的數學基礎,嫻熟的編程能力,更要有圖像分割結果評估這方面的意識,而且這往往是我們中國學生最容易忽視的,他們往往認為只要分割結果出來就完成任務而不去關注。
譬如,上面所提及的視網膜血管分割,因為已有的方法和我們改進的方法相比,往往相差無幾,甚至肉眼難以觀察,如果不加以定量比較,往往很難體現算法的優勢,或者沒有足夠的說服力,因此,這也是學生創新能力培養的一個重要領域,我們應該加以高度重視。值得一提的是,現在很多學生看了國際期刊上發表的醫學圖像分割領域的高水平論文之后,一般只關注它的算法和結果,甚至感慨論文水平并不怎么樣,為什么別人能發表,而自己卻不能發表。熟不知,別人論文的組織水平,知識體系的全面性,展開討論與結果評價的深入性往往比我們高出一籌。因此,對學生創新能力的培養應該是全方位的、多領域的,不僅要有意識地引導學生深入思考,也要注重對國內外優秀成果與經驗的吸收借鑒。
關鍵詞:結構化局部邊緣模式;文檔圖像;模式分類
目前,文檔圖像具有很多種模式形態,其分類方法也多種多樣。在過去,人們比較常用的分類方法是光學字符識別系統,該系統主要根據文本特征、結構特征、混合特征三種方法對文檔進行識別分類,但是該分類方法的分類速度比較慢,對所處理圖像解析度的要求比較高。因此,該方法逐漸被結構化局部邊緣模式分類方法所替代。
1 結構化局部邊緣模式下處理圖像分類的預備知識
文本管理工作主要包括:壓縮、管理、歸檔、文本分析等,在進行文檔工作處理的時候,相對準確的文檔類型信息能夠有效的提高文本檢索的速度以及工作人員的工作效率。文檔具有多種模式形態,每種形態都有自己的獨特性以及形態之間的相似性。結構化局部邊緣模式的使用,不僅可以實現對圖像分割模式的自由調節,還能夠有效的提高文檔圖像特征提取的準確性,在使用結構化局部邊緣模式進行文檔圖像特征提取的時候,采用的是圖像區塊之間重疊的方法,通過這種方式有效的確保圖像分割區域特征本身的連貫型性。
2 采用結構化局部邊緣模式下,文檔圖像分類特征的提取
本文在對結構化局部邊緣模式下文檔圖像分類處理的研究中,進行分類對比采用的是HOG。結構化局部邊緣系統通過LEP特征,根據圖像像素鄰域的邊緣方向進行了相關的編碼。文檔圖像本身特征就比較明顯,例如影像圖片的像素數值變化比較大;一般學術論文的格式比較規整且字數比較多;灰度圖像之相似性比較大,沒有明顯的規律可循;表格文件的特征性比較明顯,橫線和豎線比較多;PPT幻燈片的圖像、文字等變化性比較明顯,但是在排版方面具有一定的規律可以遵循,為了方便結構化局部邊緣模式在處理文檔圖像方面的研究工作,上述幾種圖像類型的邊緣信息都比較明顯。
3 結構化局部邊緣模式和HOG的主要特征
3.1 模式分類框架
文中在進行結構化局部邊緣模式下,文檔圖像的分類處理研究中,還沒有形成一一個完整通用的基準數據庫進行相關的實驗研究,并且受其它因素的限制也比較明顯。所以,本文在進行處理研究的時候,通過綜合對比研究選取了含有5000張圖像并具有四種文檔圖像類別,每種類型都包含1250張圖像,類型包括:影像圖片、學術論文、PPT幻燈影片以及含有表格的文件。另外,在進行文檔圖像處理研究時,圖片都是隨機獲取的。
3.2 結構化局部邊緣模式的特征描述
結構化局部邊緣模式主要是利用計算機模擬技術對對視覺、圖像等進行處理,在使用的過程中,根據圖片中重復出現的不同pixel,并將其按照不同的方向延伸成九宮格的形狀作為參考的重點。在模式計算的過程中,首先要獲取到原始的邊緣圖像,并建立一個3*3的鄰域窗口,在這一過程中,文本會被分為比較小的空間區塊,其計算方式為:結構化局部邊緣模式(SLEP)=Ni/N,i=0,1,2,…31,其中結構化邊緣模式的變化范圍是在0到31之間,Ni中的i代表的是pixel的數目,n代表的是piexl的總數目。
3.3 HOG的特征描述
HOG特征是目前人們比較常用的圖像特征提取方法,該方法在計算的時候選取的是320*256的圖像區域,在此基礎上,把區塊的大小劃分為32*32,其中九宮格的大小為16*16,將九宮格的每一格作為最基本地計算單元,然后進行相關的串聯計算。方法步驟如下。第一,可以對圖像進行卷積處理,目的是了解圖像中像素的梯度以及方向變化,一般將范圍值控制在[-1,0,1]或者是[1,0,-1]。第二,對每個格子進行量化處理,角度量化的范圍值是[0,180],然后根據每個像素的模建立九維方向角直方圖。第三,把區塊內部各格子之間的直方圖進行串聯處理,然后組成36維直方圖的特征向量。第四,把所有的特征向量串聯在一起,就會形成最后的直方圖特征向量。
4 結構化局部邊緣模式的處理分析
在對上述四種類型的圖像特征進行信息提取研究以后,了解到在進行圖像分析的過程中,圖像的解析度分別為:80*64,160*128,這組數據說明和HOG相比,結構化局部邊緣模式在運用過程中性能效果比較好,分辨率也比較高。這說明結構化局部邊緣系統在不適用OCR系統的條件下,也具有高質量的文檔圖像分辨率。當圖像大小為80*64,文檔圖像的類別為影像照片以及規范化的學術論文的時候,SLEP測試效果要比HOG高0.1到1.6個百分點,但是當進行表格文件處理的時候,百分點就會比HOG的百分點低,當進行PPT幻燈片測試的時候,百分點又會比HOG高,這表明,結構化局部邊緣模式在文檔圖像處理的時候,使用整體效能比較高。當圖像大小逐漸變大的時候,除表格文件的測試百分點比較低之外,其余也呈現逐漸增高的現象。上述研究表明,當圖像文檔比較混亂的時候,梯度方向呈現混亂的狀態,進行文檔圖像、影片特征分類會比較方便,但是在進行表格文檔處理的時候,使用HOG取得的效果會更加的明顯。
[參考文獻]
論文摘要:目的:探討早期腦缺血病變在非增強CT掃描的成像表現。方法:采用回顧性分析的方法,對21例發病時間小于24h,臨床懷疑有早期腦缺血,經過CT灌注掃描、CT和MRI隨訪檢查確診為腦缺血的患者,利用AlbertaStrokeProgramEarlyCTScore(ASPECTS)評分標準分析其非增強CT(NoncontrastCT,NCCT)的影像學表現特征,和CT灌注掃描以及CT和MRI隨訪結果對比,研究CT平掃在早期腦缺血診斷中的作用。結果:21例經過CTP和(或)MRI隨訪檢查確診為早期腦缺血患者中,缺血核區CBF和CBV均較正常腦組織明顯下降(P<0.05)。經NCCT掃描發現腦缺血病變的患者11例,其中8例主要表現為患側密度降低,3例主要表現為患側腦組織水腫、腦溝變淺,ASPECTS評分分析的26個異常區域中,有19個區域表現為密度降低,7個表現為腦組織腫脹。結論:早期腦缺血患者中,NCCT所見的低密度區大致和缺血核區域相符,腦組織腫脹區域大致和半暗帶區相符。雖然平掃CT不能準確判斷半暗帶和缺血核區,但是對早期腦缺血性疾病能提供很多有用的信息。
急性缺血性腦血管病占腦卒中患者的50%~80%,致殘和致死率高,成功的治療取決于能否在早期及時診斷和治療,建立再灌注,搶救半暗帶腦組織。目前公認的治療方法是早期溶栓治療,由于受到3h治療時間窗的限制,早期診斷對治療有決定性的意義。隨著CT和MRI灌注技術以及PET技術的發展,對早期腦缺血的診斷提供了非常有用的影像學診斷手段,由于CT灌注掃描(CTPerfusion,CTP)可以分析腦血流情況,顯示腦血流發生改變的區域,CTP掃描越來越多的應用于臨床腦缺血疾病的早期診斷。目前早期腦缺血患者的首選影像學檢查仍然為非增強CT(NoncontrastCT,NCCT)掃描[1],并且由于各種條件的限制,有一些患者不適合行CTP和MRI檢查,NCCT可能是唯一的影像學檢查方法,因此研究NCCT表現特點對臨床腦缺血性疾病的診斷有重要的價值。本研究通過CTP和MRI掃描,回顧性分析NCCT的表現特點,提高早期NCCT診斷的水平。
1資料與方法
1.1病例選擇
選擇21例根據臨床表現懷疑腦缺血的患者,主要臨床表現為:一側或者患側肢體運動障礙,一側肢體無力或者肌肉張力下降,部分患者言語不清、構音不良、鼻唇溝變淺,主要體征為一側Babinski,Gordon,Hoffman征陽性等。所有患者都行NCCT和CTP掃描,1~2周內復查CT或(和)MRI,確診為缺血性腦梗死。
1.2CT掃描方案
1.2.1NCCT檢查患者仰臥位行常規CT掃描(His2peedZX/i,GeneralElectricMedicalSystems),自顱底區向上掃描至顱頂,層厚為10mm,層距為10mm,重建距陣為512×512,標準算法,顯示野為24cm,管電壓為120kV,管電流為自動毫安控制。
1.2.2CTP檢查根據栓塞的部位和平掃后CT表現確定病變區和掃描層面。經前臂靜脈使用高壓注射器注入非離子型造影劑50ml(Iohexol,300mgI/ml),注射流率為3ml/s,注射開始后7s進行cine方式掃描,連續掃描45s,1層/s,掃描層厚10mm,管電壓80kV,管電流120mA,重建距陣為512×512,使用標準算法。
1.2.3CTP圖像處理將cine方式掃描后得到的軸位圖像傳送到獨立工作站(GEAdvantageWorkstation4.02)進行處理。應用CTP軟件(GeneralElectricMedicalSystems)使用精確方法分別計算出下列參數圖像:腦血容量(cerebralbloodvolume,CBV),腦血流量(cerebralbloodflow,CBF),血流平均通過時間(meantransittime,MTT)和最大峰值時間(timetopeak,TTP)。
1.3后期分析
1.3.1NCCT圖像分析5名放射科中高年資醫生,在不知道臨床表現的情況下,按照AlbertaStrokeProgramEarlyCTScore(ASPECTS)標準,進行大腦中動脈供血區分析。ASPECTS分區的每個區域分別按照影像學表現分為正常區、腦質密度降低區和水腫區。
1.3.2CTP圖像分析早期CBV、CBF同時下降區域定義為缺血核區,其余CBF下降而CBV不下降的區域定義為半暗帶區。
2結果
2.1所有21例最后確診為腦缺血的患者中,NCCT發現異常改變11例,陽性率為52%。
2.2NCCT掃描后,利用ASPECTS評分分析方法發現的26個異常區域中,有19個表現為密度降低,7個表現為腫脹。19個NCCT表現為密度降低的區域,經過CTP掃描發現所有區域CBF和CBV均顯著降低(P<0.01),并且隨訪確診為腦梗死區;7個NCCT表現為腫脹的區域中,5個CBV正?;蛘呱栽龈?,隨訪沒有發現該區明確梗死灶形成,另外2個區域隨訪發現梗死灶形成。
2.3CTP掃描:腦缺血核區和半暗帶區平均CBF(ml/100g/min)為缺血核區25.1±9.5,缺血邊緣區39.3±12.1,血流正常區59.5±18.3,P<0.05。腦缺血區CBV和正常區域平均CBV:缺血區(2.4±0.8ml/100g),正常腦組織(3.9±0.9ml/100g),P<0.05。
3討論
腦缺血后治療的關鍵是搶救半暗帶,半暗帶是指腦缺血性疾病發生后,缺血核心區域以外腦血流量降低的區域。這些區域如果能及時干預治療,半暗帶腦組織將不至于發生壞死,因此半暗帶又可以稱為可挽救的腦缺血區[2]。很多學者的研究表明,CT灌注可以預測半暗帶的范圍。一般認為,CT灌注成像顯示的腦血流量(CerebralBloodFlow,CBF)和腦血流容積(CerebralBloodVolume,CBV)都明顯降低的區域提示為缺血核區域,CBF輕度下降而CBV不下降或者輕度升高的區域提示為半暗帶區[3]。本組病例的CT灌注結果和以往的經驗相符,兩組數據均可見顯著差異(P<0.01)。
本研究21例最后確診為腦缺血的患者中,NCCT發現異常改變的有11例,陽性率為52%。該數據表明,有腦缺血臨床表現的患者,早期NCCT檢查有約一半的患者可出現陽性表現。AlbertaStrokeProgramEarlyCTScore(ASPECTS)標準[4]是主要針對大腦中動脈供血區腦缺血的評分標準,在腦部CT掃描的兩個標準層面,把大腦中動脈供血區分成10個區域。本實驗采用相同的分區法,評價大腦中動脈缺血后的影像學表現。NCCT掃描后,利用ASPECTS評分分析方法發現的26個異常區域中,有19個表現為密度降低,7個表現為腫脹。19個NCCT表現為密度降低的區域,經過CTP掃描發現CBF和CBV均顯著降低(P<0.01)并且隨訪確診為腦梗死區;7個NCCT表現為腫脹的區域中,5個區域為CBV正?;蛘呱栽龈?,隨訪沒有發現該區明確梗死灶形成,另外2個區域隨訪發現梗死灶形成。本研究表明,在NCCT掃描圖像上所見的低密度區符合腦梗死區域,而腦水腫區則和半暗帶區大致相符。其機理可能是腦缺血后早期,缺血核區域由于腦組織缺血流量降低并且發生細胞壞死為主,密度降低;而半暗帶區域腦組織血流量降低程度較輕,細胞以腫脹為主[5],因此主要表現為腦組織腫脹。
雖然隨著CTP、MRI和SPECT等技術的發展,提高了早期腦缺血性疾病的診斷率,CTP掃描檢查對半暗帶的判斷非常有價值。大部分患者就診后首先進行的影像學檢查是NCCT掃描,雖然其影像學表現特點不能作為準確判斷半暗帶和缺血核的標準,但是對早期腦缺血性疾病能提供很多有用的信息。提高對NCCT掃描圖像的認識,對患者的早期診斷非常有幫助。
參考文獻:
[1]KHRMANNM,JUTTLERE,HUTTNERHB,etal.Acutestrokeimagingforthrombolytictherapy-anupdate[J].CerebrovascDis,2007,24(2-3):161-169.
[2]高培毅,林燕.腦梗死前期腦局部低灌注的CT灌注成像表現及分析[J].中華放射學雜志,2003,37(10):882-886.
[3]陳涓,劉銀紅,趙斌,等.超急性期腦梗死的多層螺旋CT灌注成像與腦卒中評分及預后相關性的研究[J].中華放射學雜志,2005,39(4):413-417.
關鍵詞:圖像拼接 SURF ROI 漸入漸出法
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1007-9416(2016)12-0133-01
圖像拼接技術是當前圖像處理的研究熱點,被廣泛應用于計算機視覺、遙感圖像繪制、醫學圖像分析、智能視頻監控和虛擬現實等領域。圖像配準是圖像拼接的基礎,目前配準效果最好的是SURF算法。SURF(Speeded Up Robust Features)是一種具有魯棒性的局部特征檢測算法,SURF算法來源于SIFT[1](Scale Inviariant Feature Transform)。文獻[2]與文獻[3]中對SIFT和SURF算法進行了綜合對比,在執行速度上,SURF算法是SIFT算法的三倍多,當圖像存在旋轉、模糊、光照、尺度和視角變換下,SURF與SIFT都表現出了較好的穩定性。因此本文采用SURF算法實現圖像的配準。文獻[4]提出了在感興趣區域尋優搜索的策略,將特征配準算法縮減到重疊區域,提高了圖像配準的效率,同時減少了特征的誤匹配,提高了圖像配準精度。圖像融合是圖像拼接另一個關鍵部分,漸入漸出法在速度上具有較好的體現,但是當圖像質量不高和曝光不一致的情況下會出現明顯的斷裂和拼接痕跡。為解決普通監控攝像頭圖像質量不高以及視差引起的拼接質量問題,本文提出基于ROI與SURF算法的圖像拼接方法,并采用RANSAC[5]算法求取最佳單應變換矩陣,最后通過改進的漸入漸出法[6][7]融合圖像,有效解決了圖像融合過程中的拼接痕跡,使融合區域過渡更自然。
1 系統流程
基于SURF和改進漸入漸出法的圖像拼接思路如下:
(1)首先輸入兩張具有重疊區域的圖像;
(2)大致估算重疊區域的大??;
(3)對ROI區域尋找特征點,進行特征匹配,并通過比值提純、對稱性提純以及RANSAC提純選出優質匹配,然后利用RANSAC計算最佳單應性矩陣;
(4)采用改進的漸入漸出法進行圖像融合;
(5)輸出圖像。
2 圖像配準
圖像拼接要求重疊區域占圖像的20%至30%,特征點的尋找與匹配只針對重疊區域,重疊區域外的特征點檢測和匹配,增加了算法的耗時,同時會帶來不必要的誤匹配,降低了圖像配準的精度。本文通過估算重疊區域的大致范圍,然后在ROI區域內檢測特征點并進行匹配。
3 圖像融合
4 實驗結果及分析
測試的實驗平臺為Intel 酷睿2 T6600@2.20 GHz CPU,內存為2GB,軟件開發環境為VS2010及opencv2.4.9,圖像為普通USB攝像頭所拍攝,分辨率為640X480。
本文在該平臺上實現了使用ROI區域的SURF算法進行圖像配準,與直接使用SURF算法對比,對特征點數與程序耗時的統計如表1所示。對特定區域提取后的SURF算法比原SURF算法快了大約2倍。使用漸入漸出法融合后的圖像過渡區域會出現斷裂以及不自然的現象。使用改進算法融合后的圖像拼接效果更接近原圖像,沒有明顯的拼接痕跡。
5 結語
本文基于提取ROI與SURF算法快速找到特征點對并進行圖像配準,然后利用改進的漸入漸出算法實現了圖像的拼接,消除了拼接痕跡,改善了拼接質量。
參考文獻
[1]David G Lowe.Distinctive Image Features from Scale-Invariant Keypoints[J].International Journal of Computer Vision.2004,60(60):91-110.
[2]索春寶,楊東清.多種角度比較SIFT、SURF、BRISK、ORB、FREAK算法[J].北京測繪,2014,4,23-26.
[3]張銳娟,張建奇,楊翠.基于SURF的圖像配準方法研究[J].紅外與激光工程,2009,38(1):160-165.
[4]王勇,何曉川,劉清華等.一種感興趣區域尋優搜索的全自動圖像拼接算法[J].電子與信息學報.2009, 31(2):261-264.
[5]楊云濤,馮瑩,曹毓.基于SURF的序列D像快速拼接方法[J].計算機技術與發展,2011,21(3):6.
關鍵詞:數字圖像取證;圖像區域復制粘貼篡改
中圖分類號:TP391.41文獻標識碼:A文章編號:1007-9599 (2011) 16-0000-01
Comparative Study of Ddigital Image Copy Paste Tamper Forensics Technology
Han Min,Sun Jinguo
(Chinese People's Public Security University,Beijing102623,China)
Abstract:This article describes several algorithms aiming at a common copy-paste forgery in the research field of digital image forensics,compared?the performance of?various methods.Different of kinds of tamper detection methods have been analyzed and discussed.It also prospects the future of copy-paste forgery in the research field of digital image forensics.
Keywords:Digital image forensics;Image area copy paste tamper
一、引言
近年來隨著電子技術的發展傳統的“膠卷相機”已經幾乎被數碼相機所代替,這為人們省去了很多傳統相機使用上的不變,但伴隨著數字圖像處理軟件的發展,數字圖像的非法篡改給人們的生活以及社會帶來很多負面的影響,數字媒體的信息安全無法得到保障。復制粘貼篡改是一種常見的篡改手法,它利用同幅圖片內各種統計參數比較相近,從一個區域復制一個圖塊粘貼到另一區域上,以達到掩蓋圖像真實內容的目的。
二、數字圖像被動取證技術
數字圖像被動取證技術,要求只給出待檢測圖像就可以鑒別真偽,即在不依賴任何預簽名提取或預嵌入信息的前提下,對圖像內容的真偽和來源進行鑒別和取證的技術,因此這類取證技術也叫數字圖像盲取證技術。
數字圖像被動取證技術實現的可行性基于這樣一個事實:任何來源的數字圖像都有自身的統計特征,而任何對數字圖像的篡改都會不可避免地引起圖像統計特征上的變化。因此,可以通過檢測圖像統計特征的變化,來判斷圖像的原始性、真實性和完整性。
三、取證算法
目前的取證算法大體上可以分為兩類,即基于單個像素的窮舉搜索和基于圖像塊的檢測方法。塊匹配算法共同的特點就是對輸入的圖像數據進行分塊處理。得到這些塊之后,從這些塊中提取相應的特征值構成特征向量,不同的基于塊匹配的算法的實質區別就在于選取的特征值各不相同。下面就各種方法進行比較:
(一)窮舉搜索。基于單個像素點的窮舉法原理很簡單,但計算復雜度很高,將之應用于大幅圖像的篡改檢測顯然是不可行的,與此同時,此算法也不能夠抵抗外來的一些干擾操作,如加噪、模糊等。算法本身受條件的約束性較強。一般我們只用于對較小尺寸的篡改圖像的檢測。
(二)簡單塊匹配。最基本的塊匹配檢測算法是將得到的b2大小的塊展開,每個方形塊按行優先順序被展為一行,存入一個矩陣中,這樣所有的行向量組成了一個二維矩陣X,其中列數為b2,行數為(Mb+1)(Nb+1)。為了減少算法的計算量,按照字典排序的方法對X陣中的行進行排列。最后根據判斷是否存在等同的行向量來確定篡改結果。這種算法在圖像遭到了復制粘貼篡改后沒用進行其他篡改的情況下顯示出了良好的性能,但是當篡改圖像經過如壓縮等后續操作時,檢測的正確率明顯降低,這是由于塊與塊之間不再是精確的相似,檢測效果大打折扣。
Fridrich等人對此進行了改進,先對圖像進行塊離散余弦變換(BDCT)變換,采取經過量化后各塊的BDCT系數進行對比分析。由于是在DCT域上做分析,算法具有一定的魯棒性。但是當處理的圖像比較大時,由于計算量太大,往往需要很長的時間來實現篡改定位,這個時間很可能無法令人接受。
駱偉祺等人提出了一種魯棒的檢測算法,這種算法也是基于圖像塊匹配的。假定問題圖像為彩色圖像(大小為MxN),首先對其進行分塊處理,分塊的方式同前面一樣,在得到了(M-b+1)x(N-b+1)個圖像塊之后,對每個圖像塊提取可以代表其內容的七個特征值,并以向量的形式來表示,前三個分量a1、a2、a3分別是b2大小的彩色圖像塊RGB通道的均值。若為灰度圖,只需記錄像素點的灰度值即可,a4、a5、a6、a7則是由圖像塊內各像素點的亮度分量Y組成的陣列經過四種分解方式整合處理后得到的特征。此算法具有一定的魯棒性能,能夠抵抗一定程度的后處理操作,如模糊、壓縮等。但如果被復制的區域發生了形變,則容易造成誤判,甚至失效。
(三)基于不變矩的檢測算法。不變矩方法是一種經典的特征提取方法,目前已經廣泛應用于圖像分析與模式識別領域中。Hu提出的7個矩不變量,不但具有平移不變性,而且還具有旋轉不變性,適合用于表示圖像的特征。但Hu矩的方法對模糊和加噪操作沒有明顯效果。
Zernike矩是一組正交矩,也具有旋轉不變性,即旋轉目標并不改變其模值。由于Zernike矩能構造出任意高階矩,而高階矩包含更多的圖像信息,所以Zernike矩的識別效果優于其他方法。何坤等人提出了一種方法,將尺寸較大的篡改圖像運用小波變換得到低頻子圖像,再把低頻子圖像分割為圖像子塊,對其子塊序列圖像分別進行Zernike矩分析判斷是否存在復制篡改,該方法克服了噪聲和幾何變換對取證的影響。
(四)基于SVD的檢測算法。奇異值分解(SVD),是一種圖像特征分析方法。它的目的在于消除圖像數據各分量間相關性,是基于信號二階統計特性的一種方法。國防科技大學吳瓊等人提出了一種基于SVD的圖像復制區域檢測算法。利用奇異值分解變換來處理圖像塊數據,并對圖像塊進行相似性匹配檢驗。這種方法對圖像羽化或邊緣模糊等處理具有魯棒性。
四、結語
目前主流算法對于相對簡單的復制粘貼篡改檢測效果較好,但偽造者為了使篡改圖像更加可信,除了采用簡單的平移、旋轉外,還可能會根據實際情況對篡改內容進行縮放、模糊等操作,這樣傳統的塊匹配算法將會失效。因此,在保證算法健壯性與檢測準確率的前提下,我們要設計出能夠同時抵抗平移、旋轉、縮放、模糊等各種操作的取證算法,這是我們今后努力的方向。
參考文獻:
[1]周琳娜.王東明數字圖像取證技術[M].北京:北京郵電大學出版社,2008:69-70
[2]駱偉祺,黃繼武,丘國平.魯棒的區域復制圖像篡改檢測技術[J].計算機學報,2007,11