• <input id="zdukh"></input>
  • <b id="zdukh"><bdo id="zdukh"></bdo></b>
      <b id="zdukh"><bdo id="zdukh"></bdo></b>
    1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

      <wbr id="zdukh"><table id="zdukh"></table></wbr>

      1. <input id="zdukh"></input>
        <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
        <sub id="zdukh"></sub>
        公務員期刊網 精選范文 卷積神經網絡的優點范文

        卷積神經網絡的優點精選(九篇)

        前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的卷積神經網絡的優點主題范文,僅供參考,歡迎閱讀并收藏。

        卷積神經網絡的優點

        第1篇:卷積神經網絡的優點范文

        (江蘇科技大學電子信息學院,江蘇鎮江212003)

        摘要:在實際交通環境中,由于運動模糊、背景干擾、天氣條件以及拍攝視角等因素,所采集的交通標志的圖像質量往往不高,這就對交通標志自動識別的準確性、魯棒性和實時性提出了很高的要求。針對這一情況,提出一種基于深層卷積神經網絡的交通標志識別方法。該方法采用深層卷積神經網絡的有監督學習模型,直接將采集的交通標志圖像經二值化后作為輸入,通過卷積和池采樣的多層處理,來模擬人腦感知視覺信號的層次結構,自動地提取交通標志圖像的特征,最后再利用一個全連接的網絡實現交通標志的識別。實驗結果表明,該方法利用卷積神經網絡的深度學習能力,自動地提取交通標志的特征,避免了傳統的人工特征提取,有效地提高了交通標志識別的效率,具有良好的泛化能力和適應范圍。

        關鍵詞 :交通標志;識別;卷積神經網絡;深度學習

        中圖分類號:TN911.73?34;TP391.41 文獻標識碼:A 文章編號:1004?373X(2015)13?0101?06

        收稿日期:2015?01?09

        基金項目:國家自然科學基金面上項目(61371114)

        0 引言

        隨著智能汽車的發展,道路交通標志的自動識別[1?3]作為智能汽車的基本技術之一,受到人們的高度關注。道路交通標志識別主要包括兩個基本環節:首先是交通標志的檢測,包括交通標志的定位、提取及必要的預處理;其次是交通標志的識別,包括交通標志的特征提取和分類。

        如今,交通標志的識別方法大多數都采用人工智能技術,主要有下述兩類形式[4]。一種是采用“人工特征+機器學習”的識別方法,如基于淺層神經網絡、支持向量機的特征識別等。在這種方法中,主要依靠先驗知識,人工設計特征,機器學習模型僅負責特征的分類或識別,因此特征設計的好壞直接影響到整個系統性能的性能,而要發現一個好的特征,則依賴于研究人員對待解決的問題的深入理解。另一種形式是近幾年發展起來的深度學習模型[5],如基于限制波爾茲曼機和基于自編碼器的深度學習模型以及卷積神經網絡等。在這種方法中,無需構造任何的人工特征,而是直接將圖像的像素作為輸入,通過構建含有多個隱層的機器學習模型,模擬人腦認知的多層結構,逐層地進行信息特征抽取,最終形成更具推廣性和表達力的特征,從而提升識別的準確性。

        卷積神經網絡作為深度學習模型之一,是一種多層的監督學習神經網絡,它利用一系列的卷積層、池化層以及一個全連接輸出層構建一個多層的網絡,來模仿人腦感知視覺信號的逐層處理機制,以實現視覺特征信號的自動提取與識別。本文將深層卷積神經網絡應用于道路交通標志的識別,通過構建一個由二維卷積和池化處理交替組成的6層網絡來逐層地提取交通標志圖像的特征,所形成的特征矢量由一個全連接輸出層來實現特征的分類和識別。實驗中將加入高斯噪聲、經過位移、縮放和旋轉處理的交通標志圖像以及實際道路采集交通標志圖像分別構成訓練集和測試集,實驗結果表明,本文所采用的方法具有良好的識別率和魯棒性。

        1 卷積神經網絡的基本結構及原理

        1.1 深度學習

        神經科學研究表明,哺乳動物大腦皮層對信號的處理沒有一個顯示的過程[5],而是通過信號在大腦皮層復雜的層次結構中的遞進傳播,逐層地對信號進行提取和表述,最終達到感知世界的目的。這些研究成果促進了深度學習這一新興研究領域的迅速發展。

        深度學習[4,6?7]的目的就是試圖模仿人腦感知視覺信號的機制,通過構建含有多個隱層的多層網絡來逐層地對信號特征進行新的提取和空間變換,以自動學習到更加有效的特征表述,最終實現視覺功能。目前深度學習已成功地應用到語音識別、圖像識別和語言處理等領域。在不同學習框架下構建的深度學習結構是不同的,如卷積神經網絡就是一種深度的監督學習下的機器學習模型。

        1.2 卷積神經網絡的基本結構及原理

        卷積神經網絡受視覺系統的結構啟發而產生,第一個卷積神經網絡計算模型是在Fukushima 的神經認知機中提出的[8],基于神經元之間的局部連接和分層組織圖像轉換,將有相同參數的神經元應用于前一層神經網絡的不同位置,得到一種平移不變神經網絡結構形式。后來,LeCun 等人在該思想的基礎上,用誤差梯度設計并訓練卷積神經網絡[9?10],在一些模式識別任務上得到優越的性能。

        卷積神經網絡本質上是一種有監督的深度學習算法,無需事先知道輸入與輸出之間精確的數學表達式,只要用已知的模式對卷積神經網絡加以訓練,就可以學習到輸入與輸出之間的一種多層的非線性關系,這是非深度學習算法不能做到的。卷積神經網絡的基本結構是由一系列的卷積和池化層以及一個全連接的輸出層組成,可以采用梯度下降法極小化誤差函數對網絡中的權值和閾值參數逐層反向調節,以得到網絡權值和閾值的最優解,并可以通過增加迭代次數來提高網絡訓練的精度。

        1.2.1 前向傳播

        在卷積神經網絡的前向傳播中,輸入的原始圖像經過逐層的卷積和池化處理后,提取出若干特征子圖并轉換成一維特征矢量,最后由全連接的輸出層進行分類識別。

        在卷積層中,每個卷積層都可以表示為對前一層輸入圖像的二維卷積和非線性激勵函數,其表達式可用式(1)表示:

        式中:Yj 表示輸出層中第j 個輸出;Y l + 1i 是前一層(l + 1層)

        的輸出特征(全連接的特征向量);n 是輸出特征向量的長度;Wij 表示輸出層的權值,連接輸入i 和輸出j ;bj表示輸出層第j 個輸出的閾值;f (?) 是輸出層的非線性

        1.2.2 反向傳播

        在反向傳播過程中,卷積神經網絡的訓練方法采用類似于BP神經網絡的梯度最速下降法,即按極小化誤差的方法反向傳播調整權值和閾值。網絡反向傳播回來的誤差是每個神經元的基的靈敏度[12],也就是誤差對基的變化率,即導數。下面將分別求出輸出層、池采樣層和卷積層的神經元的靈敏度。

        (1)輸出層的靈敏度

        對于誤差函數式(6)來說,輸出層神經元的靈敏度可表示為:

        在前向傳播過程中,得到網絡的實際輸出,進而求出實際輸出與目標輸出之間的誤差;在反向傳播過程中,利用誤差反向傳播,采用式(17)~式(20)來調整網絡的權值和閾值,極小化誤差;這樣,前向傳播和反向傳播兩個過程反復交替,直到達到收斂的要求為止。

        2 深層卷積神經網絡的交通標志識別方法

        2.1 應用原理

        交通標志是一種人為設計的具有特殊顏色(如紅、黃、白、藍、黑等)和特殊形狀或圖形的公共標志。我國的交通標志主要有警告、禁令、指示和指路等類型,一般采用顏色來區分不同的類型,用形狀或圖形來標示具體的信息。從交通標志設計的角度來看,屬于不同類型(不同顏色)的交通標志在形狀或圖形上有較大的差異;屬于相同類型(相同顏色)的標志中同類的指示信息標志在形狀或圖形上比較接近,如警告標志中的平面交叉路口標志等。因此,從機器視覺的角度來分析,同類型中同類指示信息的標志之間會比不同類型的標志之間更易引起識別錯誤。換句話說,相比于顏色,形狀或圖形是正確識別交通標志的關鍵因素。

        因此,在應用卷積神經網絡識別交通標志時,從提高算法效率和降低錯誤率綜合考慮,將交通標志轉換為灰度圖像并作二值化處理后作為卷積神經網絡的輸入圖像信息。圖2給出了應用卷積神經網絡識別交通標志的原理圖。該網絡采用了6層交替的卷積層和池采樣層來逐層提取交通標志的特征,形成的特征矢量由一個全連接的輸出層進行識別。圖中:W1i(i=1,2,…,m1),W1(j j=1,2,…,m2),…,W1k(k=1,2,…,m(n?1))分別表示卷積層L1,L3,…,Ln - 1 的卷積核;Input表示輸入的交通標志圖像;

        Pool表示每個池采樣層的采樣池;map表示逐層提取的特征子圖;Y 是最終的全連接輸出。

        交通標志識別的判別準則為:對于輸入交通標志圖像Input,網絡的輸出矢量Y = [y1,y2 ,…,yC ],有yj = Max{y1,y2 ,…,yC},則Input ∈ j,即判定輸入的交通標志圖像Input為第j 類交通標志。

        2.2 交通標志識別的基本步驟

        深層神經網絡識別交通標志主要包括交通標志的訓練與識別,所以將交通標志識別歸納為以下4個步驟:(1) 圖像預處理:利用公式Gray= 0.299R +0.587G + 0.114B 將彩色交通標志圖像轉換為灰度圖像,再利用鄰近插值法將交通標志圖像規格化,最后利用最大類間方差將交通標志圖像二值化。

        (2)網絡權值和閾值的初始化:利用隨機分布函數將權值W 初始化為-1~1之間的隨機數;而將閾值b 初始化為0。

        (3)網絡的訓練:利用經過預處理的交通標志圖像構成訓練集,對卷積神經網絡進行訓練,通過網絡前向傳播和反向傳播的反復交替處理,直到滿足識別收斂條件或達到要求的訓練次數為止。

        (4)交通標志的識別:將實際采集的交通標志圖像經過預處理后,送入訓練好的卷積神經網絡中進行交通標志特征的提取,然后通過一個全連接的網絡進行特征分類與識別,得到識別結果。

        3 實驗結果與分析

        實驗主要選取了我國道路交通標志的警告標志、指示標志和禁令標志三類中較常見的50幅圖像。考慮到在實際道路中采集到的交通標志圖像會含有噪聲和出現幾何失真以及背景干擾等現象,因此在構造網絡訓練集時,除了理想的交通標志以外,還增加了加入高斯噪聲、經過位移、旋轉和縮放處理和實際采集到的交通標志圖像,因此最終的訓練樣本為72個。其中,加入的高斯噪聲為均值為0,方差分別為0.1,0.2,0.3,圖像的位移、旋轉、縮放的參數分別隨機的分布在±10,±5°,0.9~1.1的范圍內。圖3給出了訓練集中的交通標志圖像的示例。圖4是在實際道路中采集的交通標志圖像構成的測試集的示例。

        在實驗中構造了一個輸入為48×48個神經元、輸出為50 個神經元的9 層網絡。網絡的輸入是像素為48 × 48 的規格化的交通標志圖像,輸出對應于上述的50種交通標志的判別結果。網絡的激活函數采用S型函數,如式(2)所示,其輸出范圍限制在0~1之間。

        圖6是交通標志的訓練總誤差EN 曲線。在訓練開始的1 500次,誤差能迅速地下降,在迭代2 000次以后是一個平穩的收斂過程,當迭代到10萬次時,總誤差EN可以達到0.188 2。

        在交通標志的測試實驗中,為了全面檢驗卷積神經網絡的識別性能,分別針對理想的交通標志,加入高斯噪聲、經過位移、旋轉和比例縮放以及采集的交通標志圖像進行實驗,將以上測試樣本分別送入到網絡中識別,表2給出了測試實驗結果。

        綜合分析上述實驗結果,可以得到以下結論:(1)在卷積神經網絡的訓練學習過程中,整個網絡的誤差曲線快速平穩的下降,體現出卷積神經網絡的訓練學習具有良好的收斂性。

        (2)經逐層卷積和池采樣所提取的特征具有比例縮放和旋轉不變性,因此對于旋轉和比例縮放后的交通標志能達到100%的識別率。

        (3)與傳統的BP網絡識別方法[11]相比較,卷積神經網絡能夠達到更深的學習深度,即在交通標志識別時能夠得到更高的所屬類別概率(更接近于1),識別效果更好。

        (4)卷積神經網絡對實際采集的交通標志圖像的識別率尚不能達到令人滿意的結果,主要原因是實際道路中采集的交通標志圖像中存在著較嚴重的背景干擾,解決的辦法是增加實際采集的交通標志訓練樣本數,通過網絡的深度學習,提高網絡的識別率和魯棒性。

        4 結論

        本文將深層卷積神經網絡應用于道路交通標志的識別,利用卷積神經網絡的深層結構來模仿人腦感知視覺信號的機制,自動地提取交通標志圖像的視覺特征并進行分類識別。實驗表明,應用深層卷積神經網絡識別交通標志取得了良好的識別效果。

        在具體實現中,從我國交通標志的設計特點考慮,本文將經過預處理二值化的圖像作為網絡的輸入,主要是利用了交通標志的形狀信息,而基本略去了顏色信息,其優點是在保證識別率的基礎上,可以簡化網絡的結構,降低網絡的計算量。在實際道路交通標志識別中,將形狀信息和顏色信息相結合,以進一步提高識別率和對道路環境的魯棒性,是值得進一步研究的內容。

        此外,本文的研究沒有涉及到道路交通標志的動態檢測,這也是今后可以進一步研究的內容。

        參考文獻

        [1] 劉平華,李建民,胡曉林,等.動態場景下的交通標識檢測與識別研究進展[J].中國圖象圖形學報,2013,18(5):493?503.

        [2] SAHA S K,DULAL C M,BHUIYAN A A. Neural networkbased sign recognition [J]. International Journal of ComputerApplication,2012,50(10):35?41.

        [3] STALLKAMP J,SCHLIOSING M,SALMENA J,et al. Man vs.computer:benchmarking machine learning algorithms for traf?fic sign recognition [J]. Neural Network,2012,32(2):323?332.

        [4] 中國計算機學會.深度學習:推進人工智能夢想[EB/OL].[2013?06?10].http://ccg.org.cn.

        [5] 鄭胤,陳權崎,章毓晉.深度學習及其在目標和行為識別中的新進展[J].中國圖象圖形學報,2014,19(2):175?184.

        [6] FUKUSHIMA K. Neocognition:a self ? organizing neural net?work model for a mechanism of pattern recognition unaffectedby shift in position [J]. Biological Cybernetics,1980,36(4):193?202.

        [7] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient ? basedlearning applied to document recognition [J]. IEEE Journal andMagazines,1989,86(11):2278?2324.

        [8] LECUN Y,BOTTOU L,BENGIO Y,et al. Backpropagationapplied to handwritten zip code recognition [J]. Neural Compu?tation,1989,1(4):541?551.

        [9] CIRESAN D,MEIER U,MAsci J,et al. Multi?column deepneural network for traffic sign classification [J]. Neural Net?works,2012,32(2):333?338.

        [10] NAGI J,DUCATELLE F,CARO D,et al. Max?pooling con?volution neural network for vision?based hand gesture recogni?tion [C]// 2011 IEEE International Conference on Signal andImage Processing Application. Kuala Lumpur:IEEE,2011,342?347.

        [11] 楊斐,王坤明,馬欣,等.應用BP神經網絡分類器識別交通標志[J].計算機工程,2003,29(10):120?121.

        [12] BUVRIE J. Notes on convolutional neural networks [EB/OL].[2006?11?12]. http://cogprints.org/5869/.

        [13] 周開利,康耀紅.神經網絡模型及其Matlab 仿真設計[M].北京:清華大學出版社,2005.

        [14] 孫志軍,薛磊,許陽明,等.深度學習研究綜述[J].計算機應用研究,2012,29(8):2806?2810.

        [15] 劉建偉,劉媛,羅雄麟.深度學習研究進展[J].計算機應用研究,2014(7):1921?1930.

        第2篇:卷積神經網絡的優點范文

        摘要:

        針對帶鋼表面缺陷檢測系統的速度滯后,精度偏低等問題,在分析成像理論和圖像檢測理論的基礎上,設計并實現了一種帶鋼表面缺陷高速高精度在線檢測系統.該系統首先采用大功率半導體均勻發光激光器技術、高速線掃描成像技術和基于圖形處理器的Gabor紋理濾波技術實現了高速高分辨率的圖像采集和處理,然后采用基于嵌套循環的K-折交叉驗證、信息增益率和BP神經網絡方法構建了高準確率的分類器,以達到對帶鋼表面缺陷高速高精度在線檢測.實驗結果表明,該系統滿足了現有帶鋼生產速度的要求,具有較高的精度和準確率.

        關鍵詞:

        圖像采集和處理;圖像檢測;Gabor紋理濾波;神經網絡

        0引言

        鋼鐵企業為了提高競爭力,對帶鋼的生產提出了新的要求,也對帶鋼表面檢測系統提出了更高的要求,既要有更高的檢測速度還要有更加準確的檢測精度[1].而與此同時,跟隨機器視覺技術的發展,帶鋼表面檢測系統也得到了廣泛的研究與應用[2].主要研究包括:①光源技術.由于帶鋼檢測對光源要求頻度高、體積小,這限制了傳統光源在其應用[3],激光具有方向性好、亮度高、體積小等優點,被廣泛應用于帶鋼檢測應用中,國內的徐科等[4]提出熱軋鋼檢測中用綠光作為激光光源,但激光照明需解決均勻性問題.②掃描技術.由于電荷耦合元件能夠實現實時檢測,成為目前研究和應用的主流技術[5].但是,CCD電荷耦合器需在同步時鐘的控制下,以行為單位一位一位地輸出信息,速度較慢,而互補金屬氧化物半導體光電傳感器采集光信號的同時就可以取出電信號,還能同時處理各單元的圖像信息,速度比CCD電荷耦合器快很多[6].③圖像處理算法.受限于帶鋼加工過程的特性,帶鋼表面呈現出隨機紋理的特點,對于隨機紋理圖像的處理分析,目前常用的方法有共生矩陣法、頻域濾波法、分形法等.作為頻域濾波法的代表,二維Gabor濾波器有著與生物視覺系統相近的特點[7],廣泛應用于紋理圖像的處理分析.但是,CPU很難滿足現在的帶鋼檢測的實時要求[8].④分類算法.特征選擇的主流算法是主成分分析和信息增益.主成分分析存在特征向量方向不一致的問題,而且如何確定主成分存在主觀性[9].信息增益可以衡量特征的優劣,利用它可對特征進行排序,方便后面的特征選擇,但信息增益適用于離散特征,信息增益率既適用于離散特征也適用于連續特征[10],被廣泛應用于特征選擇的過程中.圖像分類算法主流算法包括支持向量機和BP神經網絡.支持向量機不適用于大樣本的分類問題[11].BP神經網絡方法具有能夠解決非線性分類問題,對噪聲不敏感等優點,被廣泛應用于帶鋼檢測中,如王成明等[12]提出的基于BP神經網絡的帶鋼表面質量檢測方法等,但是BP神經網絡的超參的設定往往具有隨機性,這嚴重影響了分類效果[13].本文首先介紹了帶鋼表面缺陷高速高分辨率成像系統的設計,針對光源的不均勻性、圖像處理速度慢等問題,提出改進方法,然后介紹了分類器的構建,針對樣本劃分的隨機性、特征選擇的隨機性以及BP神經網絡超參設定的隨機性問題,做出改進,最后介紹試驗結果.

        1帶鋼表面缺陷高速高分辨率的成像系統的設計

        1)大功率半導體均勻發光激光器技術.激光能夠保證帶鋼表面缺陷的檢出率[14],本系統選用808nm半導體激光器作為照明源,出光功率可達30W,亮度可達1500流明.激光照明需解決均勻性的問題,本文采用了基于鮑威爾棱鏡的激光線發生辦法,解決了激光照明的均勻性問題,其光路如圖1所示.該方法首先在激光聚焦位置放置圓形球面透鏡,負責將發散的激光束匯聚成準平行光,同時控制光柱的粗細,然后,利用鮑威爾棱鏡的擴散效果對圓柱的一個方向進行擴束,最終形成激光線.為保證亮度及寬度的適應性,激光器出光口距離圓透鏡、鮑威爾棱鏡的距離可以精密調整.為了降低反射亮度損失,在透鏡表面鍍上808±5nm的T≥99%的增透膜.

        2)基于GPU的Gabor紋理濾波技術.二維Ga-bor濾波器具有易于調諧方向、徑向頻率帶寬及中心頻率等特征,本文采用該方法來進行圖像處理,二維Gabor函數為guv(x,y)=k2σ2exp-N2(x2+y2)2σ[]2×expi(k•()xy[])-exp-σ2{()}2(1)其中:k=kxk()y=kvcosψμkvsinψ()μ;kv=2-v+22π;ψμ=μπN;v的取值決定了Gabor濾波的波長;μ的取值表示Gabor核函數的方向;N為總的方向數.設f(x,y)為圖像函數,guv(x,y)為卷積函數,則卷積輸出N(u,v)可表示為N(u,v)=f(x,y)*guv(x,y)(2)二維Gabor濾波算法計算量較大,為了保證了帶鋼表面缺陷檢測的實時性,采用基于GPU的并行處理架構,其計算流程如圖2所示.GPU的算法分為兩個流程:訓練過程主要針對無缺陷圖像進行,通過訓練完成紋理圖像的背景建模,一方面消除背景變化帶來的干擾,另一方面形成有效的Gabor卷積參數,以便在檢測過程中得到最優的檢出效果.檢測過程對實際拍攝的缺陷圖像進行分析,首先按照GPU的核心數和緩存大小對圖像進行分解,本文所有GPU的核心數為1024,顯存2G,因此將原始圖像分解為1000塊,分別加載到1000個核心中,同時并發運行卷積運算.最后將各個窗口的卷積結果合并到一起,得到完成的濾波結果,最后借助于背景模式,將背景的干擾消除,得到干凈的缺陷區域.

        3)成像系統.根據缺陷檢測的精度要求(1800m/min的檢測速度,0.25mm的精度),帶鋼的規格要求(1900mm規格),對帶鋼進行成像系統設計.基于互補金屬氧化物半導體(CMOS)的成像芯片具有速度快,用電低等優勢.選用兩個4K線掃描CMOS相機作為成像核心器件,選用CameraLinkFull接口作為數據輸出.兩個4K掃描中間重疊100mm作為圖像拼接區.兩組線激光光源與線掃描組成系統的主要成像模塊.成像系統結構如圖3所示.

        2構建分類器

        檢測缺陷類別及其特征描述如表1所示.

        1)訓練集和樣本集劃分.主要缺陷類別有5個,每個類別收集樣本7000,共計35000個樣本.為了避免訓練集和樣本集劃分的盲目性,采用10-折交叉驗證的方式劃分訓練集和測試集,即將樣本集分成10份,從中選1份為測試集,剩下的為訓練集,如圖4所示,究竟選擇哪一份作為測試集,需在后面的嵌套循環中實現.

        2)特征選擇.缺陷區域的長度、寬度、面積、區域對比度等共計138個特征形成初始特征集合,利用信息增益率來對各個特征排序.設樣本集T的某個特征子集S中,相異值構成集合A,集合A把特征子集S劃分為多個子集{S1,S2,Sv,…},|Sv|、|S|為集和大小,信息增益率的公式為Gainration(S,A)=Gain(S,A)Intrinsiclnfo(S,A)(3)式中Gain(S,A)為信息增益,是分裂前的信息減去分裂后的信息,公式為Gain(S,A)=InfoBefore(S)-InfoAfter(S)=Entropy(S)-∑v∈Values(A)|Sv||S|Entropy(Sv)(4)式中Entropy(S)為集合S的熵,公式為Entropy(S)=Entropy(p1,p2,…,pm)=-∑mi=1pilogpi(5)式中pi為第i個類別的概率.式(3)中,Intrinsiclnfo(S,A)為內在信息,公式為Intrinsiclnfo(S,A)=∑v∈Values(A)|Sv||S|log(|Sv||S|)(6)利用信息增益率對特征進行排序,再利用循環(從1到138循環)實現最優的特征個數的確定.

        3)BP神經網絡隱含層節點數的確定.BP神經網絡應用到帶鋼表面質量檢測上具有很多優勢,但也存在一些問題,主要體現在隱含層節點數選取的盲目性和初始權值選取的隨機性.對于隱含層節點數確定問題,利用隱含層節點數常用計算公式[15](2(m+n)+1,n+槡m+a,log2n,n為輸入層節點數,m為輸出層節點數,a為的[1,10]常數)求得節點數的可能取值集合n1,求得該集合最大值n1-max和最小值n1-min,從n1-min開始到n1-max,利用循環,節點數逐個增加,確定最優的隱含層節點數[16];

        4)BP神經網絡初始權值的選取.當隱含層節點數確定后,需要確定輸入層和隱含層之間、隱含層和輸出層之間的初始權值.首先生成10組隨機數數組,利用循環確定最優的隨機數數組.

        5)判別標準和嵌套循環.上述各循環中,分類效果好與壞的判別標準是分類的總體精度,公式為OA=∑niin(7)式中:nii為樣本被預測為類別i,n為樣本個數.上述各循環組合在一起就是一個嵌套循環,其N-S盒圖如圖5所示,最外層是測試集和訓練集的10折交叉驗證,第1層是確定最優的特征數,第3層是確定最優的隱含層節點數,第4、5層是確定最優的輸入層和隱含層、隱含層和輸出層的初始權值[17-20].經以上循環,確定D3作為測試集,最優特征數為23個,最優的隱含層節點數是46個,同時也確定了最優的初始權值,對應的3層BP神經網絡的網絡模型如圖6所示.

        3實驗結果

        1)鮑威爾棱鏡與柱透鏡進行對比在實際工作距離1.5m處,采用0.1m為間隔使用光功率計測試光源功率,如圖7所示,橫軸為測試點,縱軸為測試點的光功率.實驗表明,鮑威爾棱鏡均勻性優于柱透鏡.

        2)Gabor濾波方法與其他方法比較將動態閾值法+Blob分析法(方法A)和灰度共生矩陣紋理背景消除法(方法B)兩種方法與Gabor濾波方法進行比較,如圖8所示.由于缺陷與背景灰度相近(圖(a)),致使方法A缺陷丟失(圖(b)),由于缺陷與背景紋理相近(圖(d)),致使方法B產生噪聲(圖(e)),Gabor方法取得了不錯的效果(圖(e)、(圖(f))).

        3)GPU與CPU比較以4096×4096的圖像為例,選10幅有代表性圖像,利用CPU(最新的inteli7-2600處理器,4核8線程,2.6GHz,內存8G)和GPU(nVidiaGTX970,4G緩存顯卡)進行Ga-bor運算,計算時間如表2所示,GPU計算效率明顯優于CPU,其中CPU的平均耗時為290.4ms,而GPU的平均耗時為31.7ms.

        4)檢測效果在產線速度為1775m/min,最小檢測缺陷的尺寸為0.25mm的檢測系統中,對帶鋼的主要4種類型缺陷進行檢測統計,檢測結果如表3所示.可計算出整體檢出率99.9%,檢測準確率99.4%.

        4結論

        本文提出將基于鮑威爾棱鏡的大功率激光器應用到光源的設計中,保證光源光照的均勻性;提出了新的帶鋼表面缺陷檢測系統的成像系統結構設計,保證了快速、高精度的生成圖像;提出了基于GPU的二維Gabor濾波圖像處理的算法,滿足了實時處理的要求;提出了基于嵌套循環的分類器擇優算法,避免了樣本集選擇、特征選擇和BP神經網絡參數設定的盲目性.借助上述技術,系統實現了較好的效果,滿足當前帶鋼生產的檢測需求.

        參考文獻:

        [1]張長富.中國鋼鐵工業運行情況和發展展望[J].中國鋼鐵業,2013(4):5-8.

        [2]劉彩章.基于機器視覺的帶鋼表面缺陷成像系統理論與實驗研究[D].武漢:武漢科技大學,2012:2-4.

        [3]高瑀含,安志勇,李娜娜等.高斯光束整形系統的光學設計[J].光學精密工程,2011,19(7):1464-1471.

        [4]徐科,楊朝霖,周鵬.熱軋帶鋼表面缺陷在線檢測的方法與工業應用[J].機械工程學報,2009,45(4):111-114.

        [5]李霞.基于CCD的鋼板測寬儀系統設計[D].秦皇島:燕山大學,2014:5-10.

        [6]石東新,傅新宇,張遠.CMOS與CCD性能及高清應用比較[J].通訊技術,2010,43(12):174-179.

        [7]高梓瑞.Gabor濾波器在紋理分析中的應用研究[D].武漢:武漢理工大學,2012:6-10.

        [8]王成順.表面缺陷檢測GPU并行圖像處理技術[D].合肥:合肥工業大學,2012:3-6.

        [9]徐永智,華慧川.對主成分分析三點不足的改進[J].科技管理研究,2009(6):128-130.

        [10]李佳龍,閻威武,白曉慧,等.基于數據驅動與信息增益率多指標決策模型的生活飲用水水質評估[J].大連理工大學學報,2016,56(1):92-96.

        [11]張曉雷.支持向量機若干問題的研究[D].北京:清華大學,2012:1-20.

        [12]王成明,顏云輝,李駿,等.基于BP神經網絡的冷軋帶鋼表面質量檢測研究[J].機械設計與制造,2007(6):106-108.

        [13]高正中,張曉燕,龔群英.基于BP神經網絡的超聲波流量計的設計[J].現代電子技術,2016,39(16):6-9.

        [14]周洋,何平安,蔣千年等.激光束整形光學系統的設計與研究[J].光學與光電技術,2006,4(2):26-28.

        [15]飛思科技產品研發中心.神經網絡理論與Matlab7實現[M].北京:電子工業出版社,2005.

        [16]沈花玉,王兆霞,高成耀等.BP神經網絡隱含層單元數的確定[J].天津理工大學學報,2008,24(5):13-15.

        [17]文冬林.BP神經網絡中一種逃離局部極小點的方法研究[D].貴陽:貴州大學,2008.

        [18]甘勝豐.帶鋼表面缺陷圖像檢測與分類方法研究[D].北京:中國地質大學,2013:3-20.

        [19]吳彬彬.機器視覺方法在帶鋼表面缺陷檢測中的應用研究[D].武漢:武漢科技大學,2015:4-50.

        第3篇:卷積神經網絡的優點范文

        基于圖像理解的汽車牌照自動識別系統是智能交通系統一個重要分支,有著非常廣泛的應用前景,而把汽車牌照從復雜的汽車圖像中分割出來是汽車牌照自動識別系統必須解決的關鍵問題。在過去的十幾年中,各國的科研人員提出了不少提取汽車牌照的方法。Choi和Kim提出利用Hough變換尋找垂直邊緣提取汽車牌照的方法,此方法由于許多汽車前部散熱器產生的垂直邊緣和某些牌照邊框的扭曲或某些汽車牌照沒有邊框而魯棒性較差。S.K.Kim和H.J.Kim提出的基于遺傳算法分割提取汽車牌照的方法,最大缺點是耗時長,難以進行實時處理。S.H.Park提出的一種基于神經網絡提取汽車牌照的方法,使用二個時延神經網絡在水平和垂直方向對輸入圖像進行濾波,得到牌照的候選區域,然后利用牌照的長寬比、面積、面積與周長比來區分真正的牌照區域與類牌照區域。此方法要求圖像中的牌照尺寸基本不變,一旦圖像中的牌照尺寸發生了較大的變化,必須對神經網絡重新進行訓練。T.R.Crimmins提出了一種數字形態學方法,此方法用不同尺寸的每個可能字符作為結構元素,采用擊中擊不中方法先提取輸入圖像中的字符,再根據牌照字符的語法得到汽車牌照,這種方法計算量非常大且易受噪聲影響。C.H.Poon提出了一種灰值形態學方法,它通過檢測字符中的直線段和字符間的空間來提取牌照,這種方法耗時較多,且沒有利用版照的尺寸信息。C.M.Hwang提出了空間頻率方法,它利用牌照區域內空間頻率變化大的特性,對圖像進行一階差分。差分圖在牌照區域內形成多個峰,然后利用峰的幅度、寬度和密度區分真正的牌照區域與類牌照區域。這種方法具耗時少、抗噪能力強的優點。本文提出的灰值形態學方法僅利用了牌照區域內空間頻率變化大的特性而且利用了牌照區域字符筆劃具有高曲的特性,因而比單純的空間頻率方法更加有效。通過建立牌照與卷積算子形態學結構元素尺寸的相互關系。本文提出的方法對不同尺寸牌照具有很好的魯棒性。

        1 數字形態學

        數字形態學是一種重要的數字圖像處理方法和理論。在數字形態學中,兩種最基本的變換或運算是腐蝕和膨脹,其它形態學變換都可通過它們來定義。下面列出了一些灰值形態學變換的定義。

        圖像f(x,y)平移(a,b)定義為:

        f(a,b)(x,y)=f(x-a,y-b)

        圖像f(x,y)相對于原點的反射為:

        f^(x,y)=f(-x,-y)

        二幅圖像f(x,y)和g(x,y)的最小記為(f∧g)(x,y)。

        當(x,y)位于圖像f的定義域D(f)和圖像g的定義域D(g)的交集D(f)∩D(g)內時:

        (f∧g)(x,y)=min{f(x,y),g(x,y)}

        否則:

        (f∧g)(x,y)=0

        二幅圖像f(x,y)和g(x,y)的最大記為(f∨g)(x,y)。

        當(x,y)位于圖像f的定義域D(f)和圖像g的定義域D(g)的交集D(f)∩D(g)內時:

        (f∨g)(x,y)=max{f(x,y),g(x,y)}

        當(x,y)∈D(f)且(x,y)∈D(g)時

        (f∨g)(x,y)=f(x,y)

        當(x,y)∈D(g)且(x,y)∈D(f)時

        (f∨g)(x,y)=g(x,y)

        f(x,y)被g(x,y)膨脹定義為:

        (fg)(x,y)=max{f(x-a,y-b)+g(a,b)}

        (a,b)∈D(g)

        f(x,y)被g(x,y)腐蝕定義為:

        (fg)(x,y)=max{f(x-a,y-b)-g(a,b)}

        (a,b)∈D(g)

        開運算定義:

        fog=(fg)g

        閉運算定義:

        f·g=(fg)g

        Top-Hat變換定義:

        Hat(f,g)=f-fog

        與Top-Hat變換相對的是波谷檢測器(Valley變換),其定義為:

        Valley(f,g)=(f·g)-f

        形態學梯度有下面三種形式:

        Grad(f)=f-(fg)

        Grad(f)=(fg)-f

        Grad(f)={[(fg)-(fg)]}/2

        2 牌照提取算法

        在牌照提取算法中,需要用到卷積、模板卷積和卷積投影等概念。下面對它們進行定義。

        對于圖像[aij]m×n,i=0...m-1,j=0...n-1,模板[aij]p×q。p<m,q<n,其卷積、模板卷積和卷積投影都是一維數組。

        水平模板卷積

        垂直模板卷積投影vmp:

        水平模板卷積投影hmp:

        圖1中牌照區域的長為173象素、高為36象素。從左到右、從上到下的8條曲線依次為牌照區域灰度圖第10~17條水平方向的灰度值。通過觀察發現,在牌照區域的水平方向不令空間頻率變化大,而且具有許多陡峭的峰(欲)和高曲率點。而灰值形態學的梯度變換可以對圖像進行高通濾波,灰值形態學的Top-Hat變換和Valley變換可以撮高曲率點、波峰和波谷。

        進行形態學變換,需要考慮二個因素:結構元素和變換類型。變換類型準備采用灰值形態學的梯度變換、Top-Hat變換和Valley變換。結果元素采用n×1的維水平結構,以提取水平方向上的高頻分量、波峰和波谷。結構元素的大小n對Top-Hat變換和Valley變換的結果結構元素的大小n對Top-Hat變換和Valley變換的結果有著很大的影響,因此問題的關鍵是怎樣確定n。

            分析圖1中水平方向的灰度曲線,發現在穿過字符的水平線上,灰度曲線波峰的寬度與字符垂直筆劃的寬度存在著某種線性關系。根據中國汽車牌照的一般規范,牌照上字符的垂直筆劃寬度與牌照的寬度也存在著某種線性關系。結構元素的尺寸n與灰度曲線波峰的寬度又可建立一種線性關系。因此可建立n與牌照寬度w的一種近似線性的關系:

        n=Integer{(w/k)+b}

        式中的Integer()表示對括號內的值取整。w、b都為整數。根據經驗令w、b分別為25和0,則:

        n=Integer(w/25)

        由上式可知,當牌照的寬度w變化25個象素時,結構元素的大小n才變化1個單位,也就是說n對w不是很敏感。

        牌照區域提取算法包括以下幾步:

        (1)縮小圖像:對輸入的灰值汽車圖像進行隔行隔列抽樣,得到一幅大小為四分之一原因的新圖像。接下列抽樣,得到一幅大小為四分之一原圖的新圖像。接下來的處理均在新圖像上進行,這樣可以大大減少處理時間,提高算法的效率。根據形態學的尺度變換兼容性原理,對圖像縮小(放大)后再進行形態學變換,只要對結構元素做相應的變換,結果不變。

        (2)水平分割:對汽車圖像進行水平分割,得到幾個可能含牌照的水平區域。

        (3)垂直分割:對第(2)步所得到的每一個水平區域進行垂直分割,得到一些牌照的候選區域。

        (4)牌照區域甄別:分析各個候選區域得出真正的牌照區域。

            2.1 水平分割

        分別對汽車圖像進行灰值形態學的梯度變換、Top-Hat變換和Valley變換,如圖2。一般來說,在大多數汽車車牌照自動識別系統應用中,CCD攝取的汽車圖像中牌照的大致寬度和高度是已知的。如果牌照的寬度為w∈(a,b),則取水平模板m×1,其中m=(a+b)/2。用模板分別對圖像的梯度圖、Top-Hat變換圖和Valley變換圖進行水平模板卷積。對每幀變換圖取每一行模板水平卷積的最大值,得到1個一維數組,3幅變換圖共得到3個一維數組g1,ti和vi,其中i大于等于1,而小于等于圖像的高度,其曲線如圖2的b、c、d。觀察圖2可以發現,由于受車體上其它字符和車前燈等因素的影響,僅僅依靠梯度圖較難對牌照進行水平定位,而結合Top-Hat變換圖和Valley變換圖,能更好地對牌照進行水平定位。據此,構成了1個一維數組pi。

        pi=gi×ti×vi

        其曲線如圖3。取圖3中最高峰的位置作為牌照的水平中線,為了確保不會出錯,把次高峰也作為牌照的另一備選位置。了高峰和次高峰的位置,分割出2個寬為汽車圖像寬度,高為牌照的最大可能高度b的區域,如圖4中的a和b。

        2.2 垂直分割

        對圖4中的a和b二個區域分別進行灰值形態學的梯度變換、Top-Hat變換和Valley變換,并在垂直方向對變換圖進行卷積得到3個一維數組gi、ti和vi,其中i大于等于1,而小于等于圖像的寬度w,其曲線如圖5和圖6。qi=gi×ti×vi

        的曲線如圖7。利用下面的公式分別對圖4中的a和b進行垂直分割。

        {(m,n)|qi>kT,i=m...n,n-m+1∈(a,b)}

        其中:T=Max(qi),k為一經驗值,(a,b)為牌照的寬度范圍。

        i=l...w

        分割結果如圖8所示。

        2.3 牌照區域甄別

        第4篇:卷積神經網絡的優點范文

         

        AI從誕生到現在已經有60年的時間,期間經歷兩輪起落,呈階梯式進化,走到今天進入第三個黃金期。如果按照其智能科技水平劃分,今天的人工智能尚處在狹義智能向廣義智能進階的階段,還是一名不折不扣的“少年”,未來擁有無限的可能和巨大的上升空間。

         

        AI是一門交叉的學科:人工智能由不同的技術領域組成,如機器學習、語言識別、圖像識別、自然語言處理等。而同時,它也是一門交叉學科,屬于自然科學和社會科學的交叉,涉及到哲學和認知科學、數學、神經生理學、心理學、計算機科學、信息論、控制論、不定性論等學科。人工智能領域的技術壁壘是比較高的,并且會涉及到多學科協作的問題,對任何公司來說,想做好人工智能將是一門大工程。未來不大可能出現一個公司能包攬整個人工智能產業每一個部分的工作,更可能的模式將是一個公司專注于一個相對細分的領域,通過模塊化協作的形式實現人工智能領域的不同應用。

         

        進化史呈階梯狀,以階段突破式為成長模式:人工智能的發展經歷了兩次黃金和低谷期,

         

        現在正經歷著第三個黃金期。1956年,麥卡賽、明斯基、羅切斯特和申農等年輕科學家在達特茅斯一起聚會,并首次提出了“人工智能”這一術語,標志著人工智能的誕生。第二年,由 Rosenblatt 提出 Perceptron 感知機,標志著第一款神經網絡誕生。1970年,因為計算能力沒能突破完成大規模數據訓練,人工智能的第一個黃金期到此結束。

         

        后直到1982年德普霍爾德神經網絡的提出,人工智能進入第二個黃金期,之后BP算法的出現使大規模神經網絡訓練成為可能,人工智能的發展又一次進入。1990年,因為人工智能計算機和DARPA沒能實現,政府撤資,人工智能又一次進入低估。2006年,隨著“深度學習”神經網絡取得突破性進展,人工智能又一次進入黃金時期。

         

        AI將由狹義智能向廣義智能進化,雖然人工智能的誕生已經有60年的時間但如果把它比喻成一個人的話,當前的他應該還未成年。按照人工智能的“智能”程度,可以將其分成狹義智能、廣義智能、超級智能三個大的發展階段,現階段的圖像與語音識別水平標志著人類已經基本實現狹義智能,正在向廣義智能的階段邁進。

         

        狹義智能:即當前的技術已經實現的智能水平,包括計算智能與感知智能兩個子階段,計算智能指的機器開始具備計算與傳遞信息的功能,感知智能指機器開始具備“眼睛”和“耳朵”,即具備圖像識別與語音識別的能力,并能以此為判斷采取一些行動。

         

        廣義智能:指的是機器開始具備認知能力,能像人類一樣獲取信息后主動思考并主動采取行動。在這個階段,機器可以全面輔助或代替人類工作。

         

        超級智能:這個階段的機器幾乎在所有領域都比人類聰明,包括科學創新、通識和社交技能等。這個階段目前離我們還比較遙遠,到時候人類的文明進步和跨越或許將有賴于機器,而機器人意識的倫理問題也許將在這個階段成為主要問題。

         

        推薦引擎及協同過濾可以分析更多的數據

         

        智能助手并不只局限于Siri等手機語音助手。微軟率先在win10 系統中加入個人智能助理Cortana,標志著個人PC端智能助理的出現;圖靈機器人以云服務的方式進入海爾智能家居、博世mySPIN車載系統,預示著多場景人工智能解決方案的潮流。初步實現人機交互的智能助手系統,已經被應用于智能客服、聊天機器人、家用機器人、微信管理平臺、車載系統、智能家居系統、智能手機助理等多個軟硬件領域。

         

        垂直類網站及社交平臺可以借助智能助手系統打造高專業度的“在線專家”以提升平臺價值;企業可以借助以“語義識別”為基礎的智能助手系統,打造智能客服,效率遠高于傳統的以“關鍵詞對應”為技術支持的客服系統。

         

        推薦引擎,是主動發現用戶當前或潛在需求,并主動推送信息給用戶的信息網絡。挖掘用戶的喜好和需求,主動向用戶推薦其感興趣或者需要的對象。傳統推薦引擎通常利用用戶在平臺上的歷史記錄進行推薦,效率低、匹配度不高。目前隨著大數據和深度學習技術的推進,推薦引擎及協同過濾可以分析更多的數據,乃至全網數據,并模擬用戶的需求,真正達到按需推薦。全球最大的正版流媒體音樂服務平臺Spotify也利用卷積神經網絡參與建設其音樂推薦引擎;谷歌也提出利用深度學習方法來學習標簽進行推薦建設。出品紙牌屋的全球最大在線影片租賃公司Netflix 也利用深度學習網絡分析客戶消費的大數據,還計劃構建一個在AWS云上的以GPU為基礎的神經網絡。

         

        “餐廳推薦引擎”Nara,便是一個利用AI技術的推薦引擎。在上線之初,Nara 就取得了400萬美元的投資。Nara 的數據庫中有超過100000家餐廳的信息,并利用特有的“Nara神經網絡”,學習使用者的偏好,最終達到“電腦幫你點餐”的目的。

         

        而今年3月22日,國內AI領軍企業阿里巴巴旗下的阿里云數加啟動“個性化推薦”引擎對外公測,該引擎用于幫助創業者可以快速獲得媲美淘寶天貓的個性化服務能力。阿里云數加上的推薦引擎能夠以更低的成本完成開發,節省程序量達到90%,推薦引擎的搭建時間將由幾個月縮短到幾天。

         

        對于不了解算法的人,只能實現標簽規則類的推薦,但如果要做成機械化、類似協同過濾的算法,創業公司需要配置大量的算法工程師,人力成本很高。現在用了數加的推薦引擎,商家只需要做數據的ETL加工,推薦的結果集、訓練集都不用處理,只需要調整參加即可得到推薦結果。

         

        AI帶給人們新的視覺???

         

        醫療:為健康診斷和藥品研發插上高飛的翅膀

         

        健康診斷有望迎來新紀元,海量的病歷數據和醫學界的新研究成果,單靠人工很難及時篩選并利用,而引入人工智能技術將充分發揮這些信息的價值。例如著名的個人健康管理產品公司Welltok將 IBM的Watson功能融入旗下產品 CafeWell Concierge APP中,借助 Watson 的認知計算能力理解人類語言,實現與用戶溝通的能力,從大量數據中進行分析并為用戶提供健康管理相關的答案和建議,實現健康管理、慢病恢復訓練、健康食譜等功能,這一領域的良好前景使 Wellltok公司近年的融資額連創新高。另外,2015年IBM斥資10億美元收購醫療影像與臨床系統提供商Merge,將研究如何實現 Watson的“辨讀”醫學影像功能。此外,AI 還可以從醫療中心獲得的健康數據,通過大數據分析,實現根據分析患者行為來制定個性化治療方案的功能。

         

        智能家居:天花板尚遠,AI有望成為核心

         

        行業天花板尚遠,增速有望保持在 50%左右, 《鋼鐵俠》中的“Jarvis”作為智能管家,除了起到鋼鐵俠的小秘書的作用,還幫主人打理著日常生活,向我們展示了一個理想中的智能家居系統。雖然我們目前可能離那個無所不能的智能管家還很遙遠,但智能家居對我們生活的變革確實已經開始了。根據《2012-2020 年中國智能家居市場發展趨勢及投資機會分析報告》的預測,我國智能家居市場在 2016年將達到605.7億的規模,同比增長50.15%,到2020年市場規模將達到3294億,年均增速將保持在50%左右,具備充足的向上延伸空間。而智能家居想達到“Jarvis”般的終極效果,必然需要引入AI技術,實現家居的感應式控制甚至自我學習能力。

         

        AI有望成為智能家居的核心,實現家居自我學習與控制。按照智能家居的發展進度,大致可以分為四個階段:手機控制、多控制結合、感應式控制、系統自我學習。當前的發展水平還處在手機控制向多控制結合的過度階段。而從多控制結合向感應式控制甚至自我學習階段進化時,AI將發揮主要功能。到今天為止,家居的實體功能已經較為全面,未來的發展重點可能在于如何使之升級改造,實現家居的自我行為及協作,因此未來AI在智能家居領域的應用有望成為其核心價值。AI對智能家居的重構可以深入到方方面面,包括:控制主機、照明系統、影音系統、環境監控、防盜監控、門窗控制、能源管理、空調系統、花草澆灌、寵物看管等等。

         

        無人駕駛:政策漸萌芽,AI決定可靠性

         

        優點多、動機足、政策漸萌芽。據麥肯錫的調查顯示,如果能解放駕駛員的雙手,一輛無人駕駛汽車內的乘客通過移動互聯網使用數字媒體服務的時間多一分鐘,每年全球數字媒體業務產生的利潤將增加 50億歐元。此外,由于自動泊車無須為乘客下車預留開門空間,使得停車位空間可縮減至少15%。

         

        如果無人駕駛汽車以及ADAS系統能夠將事故發生率降低90%,即可挽回全美每年的損失約1千900億美金。可以說諸多的優點使得無人駕駛技術的研發動機還是相當充分的,因此未來無人駕駛推行的力度應該還會保持在一個比較高的水平。美國勒克斯研究公司曾預計無人駕駛汽車的市場規模在2030年將達到870億美元。

         

        到目前為止,各國政府對于無人駕駛技術在政策上的支持正逐步放開,美國政府在年初剛剛宣布了40億美元的資助計劃;英國目前已經不需要獲得額外批準和履約保證即可進行實際道路的無人駕駛汽車測試;而德國也在去年宣布將計劃設立無人駕駛汽車測試路段,供安裝有駕駛輔助系統或全自動駕駛系統車輛行駛;歐盟總部正在就如何修改現行有關駕駛的法律法規從而支持自動駕駛的發展展開討論和研究工作;日本也提出要在2020年之前實現自動駕駛汽車方面的立法,并將自動駕駛作為 2016年9月七國集團交通部長會議的議題。

         

        “無人汽車大腦”AI的智能程度決定了無人駕駛的可靠性。由于無人駕駛完全交由汽車的內置程序負責,因此AI就是無人汽車的大腦,而測距儀、雷達、傳感器、GPS等。設備都是AI的“眼睛”。AI的智能程度直接決定了無人駕駛汽車在不同的路況、不同的天氣、甚至一些探測設備出現故障的突況下能否及時做出正確的判斷并靈活調整行駛策略,最終決定了無人駕駛汽車當前最亟待突破的可靠性。

         

        NVIDIA 在2016年的 CES大會上了“Drive PX 2”車載計算機,以及一套與之搭配的具有學習功能的自動駕駛系統。該系統的亮點在于“自我學習”,通過讓車輛自行分析路面狀況,而不是在數據庫中尋找預先儲存的策略實現自動駕駛,系統背后連接著名為NVIDIA DIGITS的深度學習訓練平臺,最終連接到NVIDIA DRIVENET神經網絡,為車輛的自我學習和完善提供支持。并且由于它是通過判斷物體的行進軌跡而不是物體本身去計算路徑,因此在駕駛時受天氣影響較小。

         

        AI 成必爭之地

         

        目前全球AI主戰場依舊在歐美。Venture Scanner的統計顯示,根據從事 AI相關業務的公司數量來看,目前全球 AI的主戰場還是集中在北美和西歐地區。美國數量最多,達到450家左右的水平。而中國從事相關業務的公司數量還比較少,和俄羅斯、澳洲、部分歐洲國家及非洲南部國家水平接近,相比起歐美國家的AI公司數量,還有很大的提高空間。

         

        Google:投資未來的人工智能帝國

         

        建立Alphabet帝國,具備品牌背書效應。2015年,谷歌成立母公司 Alphabet, 搜索、廣告、地圖、App、Youtube、安卓以及與之相關的技術基礎部門”仍屬于谷歌,而Calico、Nest、Google Fiber、Google Venture、Google Capital 及 Google X 都將獨立出來,成為 Alphabet 旗下的獨立公司。通過建立 Alphabet集團,谷歌將不同業務的研發獨立出來,以子公司的形式進行業務開展,保留在Google這個品牌下的基本都是原有的傳統強勢業務。

         

        而其它公司負責在各自的領域“打頭陣”,一旦業務研發成功,母公司連帶著google這個品牌都可以受益,而如果研發失敗,也不會公司的品牌造成多大的不良影響,建立了良好的品牌背書效應。將機器學習技術應用到所有產品之中,我們不難發現,谷歌近年幾乎將人工智能滲透到了旗下的各類產品中,可謂是全線鋪開。正應了谷歌 CEO的那句話:“我們將小心謹慎地將機器學習技術應用到我們所有的產品之中。”根據當前Alphabet 的集團架構,我們將涉及到AI應用的子公司情況以及相應的業務開展情況羅列如下:

         

        Nest:從事智能家居生態系統建設。2014 年谷歌以32億美元收購 Nest。Nest 生產智能恒溫器,它能夠學習用戶的行為習慣,并且根據他們的喜好去調節溫度。同時,Nest 也提供火警探測器和家庭安全攝像頭等智能家居。

         

        Google X:谷歌各類創新技術的“孵化池”。Google X開展的與AI有關的項目有:無人駕駛汽車、Project Wing 無人機送貨項目、對抗帕金森氏癥的 Liftware“反抖”湯匙、用于疾病預警和健康監控的可穿戴設備、Project Titan 太陽能無人機項目、以及 Replicant 團隊負責的機器人項目等。

         

        Verily:從事生命科學業務,即原來的 Google Life Science。代表產品有可以收集佩戴者體溫和血液酒精含量等生物數據的智能隱形眼鏡,以及監控血液中納米粒子的智能腕表。

         

        DeepMind:深度學習算法公司。2014年谷歌以4億美元收購了DeepMind。

         

        DeepMind的算法源于兩種機器學習方法的結合:第一種是深度學習,是受人腦啟發的一種結構。深度學習系統能夠從大量的非結構數據中獲取復雜信息。第二種是增強學習,靈感源自動物大腦中的神經遞質多巴胺獎勵系統,算法不斷通過試錯來進行學習。目前,DeepMind在深度學習上面的研究成果已經開始用在谷歌的機器人項目中。

        第5篇:卷積神經網絡的優點范文

        關鍵詞:諧波電流;電力系統;檢測

        一、引言

        近年來,隨著電力電子技術的迅速發展,各種新型電力電子器件相繼進入市場,隨之而來的諧波污染日益嚴重,由電網諧波引起的電能質量問題也日益受到重視,采用有源電力濾波器已成為諧波補償的一種重要趨勢。其基本原理是從補償對象中檢測出諧波電流,由補償裝置產生一個與該諧波電流大小相等,極性相反的補償電流與其相抵消,其中,諧波電流的正確檢測是決定補償效果的重要環節。下面就分別論述一下目前這幾種諧波電流檢測方法。

        二、諧波電流的檢測方法

        (一)模擬濾波器

        模擬濾波器的實現方法是:當信號不含低于基頻的次諧波時采用低通濾波器,當信號含有次諧波時采用帶通濾波器來獲得基波分量,用減法從信號中減去基波分量就得到分量。該方法具有簡單快速的優點,但是這種檢測方式有很多缺陷:對環境的依賴較高,當,電網頻率波動或濾波器的元件參數變化時效果變差:無法分離出基波中的有功與無功分量;當諧波頻率與基波接近時,濾波器的歸一化截止頻率很小,波動特性很差;特別是當基波頻率不固定而在較大范圍波動時,濾波器設計非常困難。

        (二)Fryze有功電流檢測

        其原理是將負載電流分解為與電壓波形一致的分量,將其余分量為廣義無功電流(包括諧波電流)。它的缺點是:因為Fryze的功率定義是建立在平均功率基礎上的,需要一個周期的積分,有至少一個周期的延時,不適于負載變化頻繁的場合。而且只能同時檢測出諧波及無功電流,不能只檢測諧波電流或只檢測無功電流,有很大的局限性。

        (三)基于FFT的諧波電流檢測

        離散傅立葉變換DFT(DiscreteFourierTransform)在實際中非常重要,利用它可以計算信號的頻譜、功率譜和線性卷積等。但是當N很大時,DFT的計算量太大,這樣使DFT的應用受到限制。1965年J.W.Colley和J.W.Tukey提出快速傅立葉變換,大大減少了計算量。FFT并不是DFT的另一種變換,而是為了減少DFT計算次數的一種有效的快速算法。基于FFTDE 的諧波電流檢測,是一種建立在傅立葉分析基礎上的數字化分析方法。其工作原理如圖1—2所示。其中i1表示負載電流,ic表示檢測所的諧波電流。

        圖1的工作原理是:在同步脈沖作用下將模擬信號進行離散化處理,通過模擬轉換器變為數字量,再用數字分析的方法,快速傅立葉變換(FFT)進行處理,最后得到各次諧波幅值和相位系數,經過低通濾波器(LPF)檢測出所需要的信號,對于檢測出的信號作FFT反變換即得補償電流信號。如果需要得到其模擬量,需要用到

        數摸轉換器再把數字量轉化為模擬量。采用這種方法需要有高精度的數摸轉換器,同時要求輸入信號有較高的信噪比。基于傅立葉的數學化分析方法,要求被補償的波形是周期變化,否則會帶來較大的誤差。這種方法的優點是可以選擇擬消除的諧波次數,缺點是具有較長的時間延遲,實時性差,存在柵欄效應和泄漏現象,使得算出的信號參數:頻率、幅值和相位不準,尤其是相位誤差很大,無法滿足準確的諧波測量要求。

        (四)同步檢測法

        對于同步檢測法用于不平衡三相系統中無功和諧波電流的補償,其基本思想是分別考慮各相情況,并把補償分量分配到三相中,統一確定各相補償電流。但是由于該檢測法實現根據總平均功率確定補償后電流,再計算出補償指令電流,而在計算補償后電流時,不僅需要知道三相電路的平均功率,還需要知道每個相電壓的幅值,因此檢測過程中的延遲較大,也僅適用于三相電壓均為正弦波的情況,若電壓波形存在畸變,必將影響檢測精度。

        (五)基于瞬時無功補償理論的檢測方法

        (1)瞬時無功功率的基礎理論。三相電路瞬時無功功率理論首次于1983年由赤木泰文提出,以后該理論經過不斷研究逐漸完善。赤木泰文最初提出的理論亦稱pq理論,是以瞬時實功率p和瞬時虛功率q的定義為基礎,其主要一點不足是未對有關的電流量進行定義。下面介紹以瞬時電流ip和iq為基礎的理論體系。設三相電路各相電壓和電流的瞬時值分別為 va、vb、vc和ia、ib、ic。分別為分析問題方便,把它們變換到α-β兩相正交的坐標系上研究。由下面的變換可以得到α、β兩相瞬時電壓vα、vβ和α、β兩相瞬時電流iα、iβ。嚴格地講,基于瞬時無功功率理論的諧波電流檢測法僅適用于三相三線制、電源電壓為三相對稱無畸變、三相負荷平衡的負載諧波電流的檢測。所以,在有源電力諧波濾波器設計中必須針對具體電網和負載的特點采取相應措施來消除或減小各種不利因數的影響:①變流器盡可能采用三相三線制接法的橋式電路,從而避免零序電流的存在。②如果只需要諧波電流的檢測,則只要一組與電源同頻率的三相對稱正弦電壓,此電壓不必是負荷的實際供電電源電壓。因此,為了避免變流器網側電源電壓波形畸變嚴重,可采取下列措施之一:A、三相電源電壓經過低通濾波器濾除高次諧波后再參與諧波電流的檢測運算,此時要求三相所用的低通濾波器特性一致;B、運用鎖相技術產生三相正弦電壓,再參與瞬時諧波電流的檢測運算。

        二、結語

        本文從理論上對有源電力濾波器的實現技術和控制策略進行研究,提出了以上幾種有源電力濾波器諧波電流的檢測方法。由于這幾種檢測方法在應用中都有其局限性,因此,針對有源電力濾波器的檢測技術和控制策略還需要做進一步的探索。隨著計算機運算速度的提高和高速微處理器(DSP)的出現,為控制系統的數字化奠定了基礎。有源電力濾波器要求其控制電路必須能完成實時檢測、計算并做出決策,這就為計算機開辟了嶄新的應用領域,必將為有源電力濾波器的實用化發揮越來越重要的作用。

        參考文獻:

        [1] 吳競昌.供電系統諧波.北京: 中國電力出版社,1998

        [2] IEC1000-3-2, Electromagnetic Compatibility-Part 3: Linits-section 2:Limits for harmonic crrentemissions (equipmentinputcurrent <16A per phase)[s].March,1995

        [3] 中國國家標準GB/T14549-93. 電能質量公用電網諧波 . 中國標準出版社 ,1994

        [4] 肖國春等. 電能質量控制技術的發展. 江蘇機械制造與自動化,2001年第1期

        第6篇:卷積神經網絡的優點范文

            可以看出,krisch算子的運算量比較大。其次在邊緣檢測中邊緣定位能力和噪聲抑制能力方面,有的算子邊緣定位能力強,有的抗噪聲能力比較好:roberts算子利用局部差分算子尋找邊緣,邊緣定位精度較高,但容易丟失一部分邊緣,同時由于沒經過圖像平滑計算,不能抑制噪聲。該算子對具有陡峭的低噪聲圖像響應最好;sobel算子和prewitt算子都是對圖像進行差分和濾波運算,差別只是平滑部分的權值有些差異,對噪聲具有一定的抑制能力,不能完全排除檢測結果中出現偽邊緣。這兩個算子的邊緣定位比較準確和完整,但容易出現邊緣多像素寬。對灰度漸變和具有噪聲的圖像處理的較好;krisch算子對8個方向邊緣信息進行檢測,因此有較好的邊緣定位能力,并且對噪聲有一定的抑制作用,該算子的邊緣定位能力和抗噪聲能力比較理想;laplacian算子是二階微分算子,對圖像中的階躍型邊緣點定位準確且具有旋轉不變性即無方向性。但該算子容易丟失一部分邊緣的方向信息,造成不連續的檢測邊緣,同時抗噪聲能力比較差,比較適用于屋脊型邊緣檢測(將在第3節中討論)。 2.2  最優算子     最優算子又可以分為馬爾算子(log濾波算子)、坎尼(canny)邊緣檢測、曲面擬合法。 torre和poggio[5]提出高斯函數是接近最優的平滑函數,marr和hildreth應用gaussian函數先對圖像進行平滑,然后采用拉氏算子根據二階導數過零點來檢測圖像邊緣,稱為log算子。對于log算子數學上已經證明[6],它是按照零交叉檢測階躍邊緣的最佳算子。但在實際圖像當中,高斯濾波的零交叉點不一定全部是邊緣點,還需要進一步確定真偽[7];坎尼把邊緣檢測問題轉換為檢測單位函數極大值問題,根據邊緣檢測的有效性和定位的可靠性,研究了最優邊緣檢測器所需的特性,推導出最優邊緣檢測器的數學表達式。與坎尼密切相關的還有deriche算子和沈俊算子,它們在廣泛的意義下是統一的;曲面擬合的基本思想是用一個平滑的曲面與待測點周圍某鄰域內像素的灰度值進行擬合,然后計算此曲面的一階或二階導數。該方法依賴于基函數的選擇,實際應用中往往采用低階多項式。 2.3  多尺度方法     早期邊緣檢測的主要目的是為了處理好尺度上的檢測和定位之間的矛盾,忽略了在實際圖像中存在的多種干擾邊緣,往往影響到邊緣的正確檢測和定位。     rosenfeld等[8]首先提出要把多個尺寸的算子檢測到的邊緣加以組合;marr倡導同時使用多個尺度不同的算子,并提出了一些啟發性的組合規則。這一思想后來經witkin等發展成了尺度空間濾波理論,說明了不同尺度上的零交叉的因果性;lu jain對二維信號進行了類似的研究;yuille和poggio證明了對于任意維信號,當用高斯函數濾波時,尺度圖中包含了數目最小的零交叉,并且可以由粗到細地跟蹤這些零交叉。     多尺度信號處理不僅可以辨識出信號中的重要特征,而且能以不同細節程度來構造信號的描述,在高層視覺處理中有重要的作用。     其中小波變換是近年得到廣泛應用的數學工具。與傅立葉變換和窗口傅立葉變換相比,小波變換是時間和頻率的局域變換,因而能有效地從信號中提取信息,它通過伸縮和平移等運算功能對函數或信號進行多尺度細化分析,解決了傅立葉變換不能解決的很多困難問題,因而被譽為“數學顯微鏡”。信號突變點檢測及由邊緣點重建原始信號或圖像是小波變換應用的一個很重要的方面。 從邊緣檢測的角度看,小波變換有以下幾個優點:     (1)小波分解提供了一個數學上完備的描述;     (2)小波變換通過選取合適的濾波器,可以極大地減小或去除所提取的不同特征之間的相關性;     (3)具有“變焦”特性:在低頻段可用高頻分辨率和低時間分辨率;在高頻段可用低頻分辨率和高時間分辨率;     (4)小波變換可通過快速算法來實現。     文獻[9]提出了一種基于層間相關性的小波邊緣檢測算法,依據的是信號主要分布在低頻部分或低尺度部分,而噪聲分布于高頻部分或高尺度部分的特點。另外小波變換具有較強的去相關性,變換后的小波系數之間仍然存在大量的相關性質,即小波系數在不同分辨率下的對應系數之間具有較強的相關性或稱層間的相關性。通過對比該方法能夠較好多的防止噪聲干擾,又能有效地保留圖像邊緣。 2.4  自適應平滑濾波方法     該方法是邊緣檢測的一個重要方法[10],無論是對于灰度圖象處理還是距離圖像和平面曲線處理都是非常有效的。它的優點是:     (1)平滑濾波的迭代運算使信號的邊緣得到銳化,此時再進行邊緣檢測,可以得到很高的邊緣定位精度;     (2)通過自適應迭代平滑,實現了將高斯平滑之后的階躍邊緣、屋頂狀邊緣和斜坡邊緣都轉化為理想的階躍邊緣,提高了圖像的信噪比;     (3)經過多次迭代運算,圖像按邊緣分塊實現自適應平滑,但不會使邊緣模糊;     (4)應用自適應平滑濾波得到一種新的圖像尺度空間描述。 2.5  其他方法     近年來隨著模糊數學、神經網絡的發展,人們不斷探索將其應用于圖像的邊緣檢測中。文獻[11]和[12]依據模糊理論討論了邊緣檢測算法的抗噪性和檢測速度問題,并證明了模糊集合理論能較好地描述人類視覺中的模糊性和隨機性;應用人工神經網絡提取圖像邊緣成為新的研究分支,目前已提出了很多算法,具有計算簡單功能強的特點,但是速度慢,穩定性差。但是神經網絡邊緣檢測可以避免自適應確定閾值的問題,具有較好的容錯性和聯想功能。 2.6  邊緣檢測的步驟     邊緣檢測分為彩色圖像邊緣檢測和灰度圖像邊緣檢測兩種,由于彩色圖像有八種彩色基,在邊緣檢測時選用不同的彩色基將直接影響實時性、兼容性和檢測效果,因此本文只限于灰度圖像的邊緣檢測研究,其步驟如圖2.1所示。

           

        其中邊緣定位是對邊緣圖像進行處理,以得到單像素寬的二值邊緣圖像,通常使用的技術是閾值法和零交叉法。邊緣定位后往往存在一些小的邊緣片斷,通常是由于噪聲等因素引起的,為了形成有意義的邊緣需要對定位后的邊緣進行鏈接。通常有兩種算法:局部邊緣鏈接和全局邊緣鏈接。 3  邊緣模型的分類及性能分析     本小節從邊緣檢測“兩難”問題出發,總結了實際圖像中可能出現的七種邊緣類型,并分別給出了數學模型描述,最后分析比較了不同邊緣類型表現出的特性及不同類型的邊緣定位與平滑尺度的關系。 3.1  邊緣檢測的“兩難”問題     首先來了解一下邊緣檢測的常用定義[13]:邊緣檢測是根據引起圖像灰度變化的物理過程來描述圖像中灰度變化的過程。引起圖像灰度不連續性的物理過程可能是幾何方面的(深度的不連續性、表面取向、顏色和紋理的不同),也可能是光學方面的(表面反射、非目標物體產生的陰影及內部倒影等)。這些景物特征混在一起會使隨后的解釋變得非常困難,且實際場合中圖像數據往往被噪聲污染。信號的數值微分的病態問題:輸入信號的一個很小的變化就會引起輸出信號大的變化。令 f(x)為輸入信號,假設由于噪聲的影響,使 f(x)發生了一個很小的變動:               式(3.1)     其中 ε<<1。對式(3.1)兩邊求導數則:          式(3.2)     由式(3.2)可以看到,若w足夠大,即噪聲為高頻噪聲時,會嚴重影響信號  f(x)的微分輸出,進而影響邊緣檢測的結果。為了使微分正則化,則需要先對圖像進行平滑。然而圖像平滑會引起信息丟失,并且會使圖像平面的主要結構發生移位。另外若使用的微分算子不同,則同一幅圖像會產生不同的邊緣,因此噪聲消除與邊緣定位是兩個相互矛盾的部分,這就是邊緣檢測中的“兩難”[14,15]。 3.2  邊緣分類及性能分析     圖像中的邊緣通常分為:階躍邊緣、斜坡邊緣、三角型屋脊邊緣、方波型屋脊邊緣、樓梯邊緣、雙階躍邊緣和雙屋脊邊緣[1]。     (1)階躍邊緣     模型為: f(x)=cl(x) ,其中 c>0為邊緣幅度, 為階躍函數。若存在噪聲,可以選用大尺度的模板平滑圖像,不會影響邊緣的定位。     (2)斜坡邊緣     理想的斜坡邊緣模型為:,其中s為邊緣幅度,d為邊緣寬度。斜坡邊緣的檢測不僅跟尺度有關,還與邊緣本身的寬度有關,若邊緣寬度比較小,則在小的平滑尺度下也能檢測到邊緣;無論是檢測極值點還是過零點,邊緣的定位都沒有隨著尺度的變化而變化。因此,對于斜坡邊緣若存在噪聲,可以選用大尺度的模板平滑圖像。而不會影響到邊緣定位。     (3)三角型屋脊邊緣     模型為:,其中s為邊緣幅度,d為邊緣寬度。對于三角型屋脊邊緣若存在噪聲可以選用大尺度的平滑模板,而不會影響邊緣的定位。     (4)方波型屋脊邊緣     方波型屋脊邊緣的模型為:,其中s為邊緣幅度,d為邊緣寬度。對于方波型屋脊邊緣檢測,不僅與平滑尺度有關,還與邊緣寬度有關,若存在噪聲,可以選用大尺度的平滑模板,而不會影響邊緣的定位。     (5)樓梯邊緣     樓梯邊緣模型為:,其中c1、c2、l均為常數。這種檢測的特點是平滑后的樓梯邊緣不能準確定位,必須對檢測到的邊緣位置進行移位校正。     (6)雙階躍邊緣     雙階躍邊緣與方波型屋脊邊緣相同,不同之處為:雙階躍邊緣的邊緣點為x=-d/2與 x=d/2,而方波型屋脊邊緣的邊緣點為 x=0。雙階躍邊緣的兩個邊緣點通過檢測一階導數的兩個極值點和二階導數的兩個過零點獲得。因此對于雙階躍邊緣大尺度下不能準確定位,必須對檢測到的邊緣位置進行移位校正。     (7)雙屋脊邊緣     模型為:,     其中:

        第7篇:卷積神經網絡的優點范文

        論文摘要: 當點擴展函數未知或不確知的情況下, 從觀察到的退化圖像中恢復原始圖像的過程稱為圖像盲復原。近年來, 圖像盲復原算法得到了廣泛的研究。本文在介紹了盲圖像恢復算法的現狀的基礎上進一步研究其的發展方向。

        一、引言

        圖像恢復是圖像處理中的一大領域,有著廣泛的應用,正成為當前研究的熱點。圖像恢復的主要目的是使退化圖像經過一定的加工處理,去掉退化因素,以最大的保真度恢復成原來的圖像。傳統的圖像恢復假設圖像的降質模型是己知的。而許多情況下,圖像的降質模型未知或具有較少的先驗知識,必須進行所謂的盲恢復。其重要性和艱巨性而成為一個研究熱點。目前所能獲取的觀測圖像是真實圖像經過觀測系統成像的結果。由于觀測系統本身物理特性的限制,同時受觀測環境的影響,觀測圖像和真實圖像之間不可避免地存在著偏差和失真,稱觀測系統對真實圖像產生了降質。圖像恢復的目的就是根據降質的觀測圖像分析和計算得出真實圖像。

        二、圖像盲恢復算法的現狀

        總體來說, 圖像盲復原方法主要分為以下兩類: 一是首先利用真實圖像的特別特征估計PSF,然后借助估計得到的PSF,采用經典的圖像復原方法進行圖像的復原。這類方法將PSF的估計與圖像的復原過程分為2個不同的過程,因而具有較少計算量的特點;二是PSF辨識和真實圖像估計相結合,同時辨識PSF和真實圖像。這類算法較為復雜,計算量較大。另外,對于點擴展函數也考慮了空間變化的復雜情況。針對目前的盲復原算法的現狀,根據退化模型的特點, 重新將算法分為空間不變的單通道盲復原算法、空間不變多通道盲復原算法和空間變化圖像盲復原算法3類。

        (一)單通道空間不變圖像盲復原算法

        在這類算法中, 最為常用的是參數法和迭代法。

        1)參數法。所謂參數法, 即模型參數法, 就是將PSF和真實圖像用某一類模型加以描述, 但模型的參數需要進行辨識。在參數法中, 典型的有先驗模糊辨識法和ARMA 參數估計法, 前者先辨識PSF的模型參數,后辨識真實圖像, 屬于第1 種類型的圖像盲復原算法, 因而計算量較小;后者同時辨識PSF和真實圖像模型參數, 屬于第2種類型圖像盲復原算法。

        2)迭代法。所謂的迭代法, 不是通過建立模型而是通過算法的迭代過程, 加上有關真實圖像和PSF的約束來同時辨識PSF和真實圖像的方法。迭代法是單通道

        圖像盲復原算法中應用最廣泛的一類算法, 它不需建立模型, 也不要求PSF 為最小相位系統, 因而跟實際更為接近。在這類算法中, 迭代盲復原算法(IBD), 基于非負性和決策域的遞歸逆濾波器算法(NAR2R IF) ,基于高階統計特性的最小

        熵算法等最為典型。

        (二)多通道二維圖像盲復原

        多通道二維圖像盲復原, 這類方法將數字通訊領域應用的一維多通道盲原分離算法擴展到二維情況并用于圖像的盲恢復。這類算法中有兩種代數方法, 一種是先辨識模糊函數, 再采用常規的恢復算法進行復原;另一種是直接對逆濾波器進行估計。此類算法的優點在于不需對初始圖像進行估計, 也不存在穩定性和收斂性問題,對圖像以及模糊函數的約束是松弛的,算法具有一般性。但是第1種算法要求采用復原算法具有收斂性;第2種算法對噪聲敏感。

        (三)空間改變的圖像盲復原方法

        在許多實際的應用中, 模糊往往是空間變化的,但由于處理工作的難度, 目前的研究較少,基本有相關轉換恢復和直接法兩類。

        相關轉換恢復的基本思想是區域分割, 即將整幅圖像分為若干局部區域, 然后假設在各個局部區域模糊是空間不變的, 利用空間不變的圖像復原有關算法進行復原。這類方法都是基于窗口的模糊辨識技術, 圖像的估計取決于窗口的大小, 由于模糊參數是連續變化的, 在范圍較大時空間不變的假設是不成立的, 因而模糊的估計精度較差, 而且這種方法只能針對部分空間變化的模糊進行處理, 缺乏通用性; 其次在區域的邊上存在振鈴現象。

        直接法的基本思想是直接對圖像進行處理。如采用簡化的二維遞推卡爾曼濾波器進行圖像模型和模糊模型的直接轉換方法, 其缺點是只能針對有限的模型, 而且模型數增加, 計算量會顯著增大;采用共軛梯度迭代算法, 但只見到一個31×31 的文本圖像處理的結果報道,對于大圖像處理效果尚需進一步的研究;將空間變化圖像系統建立成馬爾苛夫隨機模型,對復原過程,采用模擬退火算法進行最大后驗估計的方法,這種方法避免了圖像的窗口化, 并能克服模糊參數不連續性造成的影響,但這種方法只能局限于將模糊過程建立成單參數的馬爾苛夫隨機模型的情況,而且計算量也較大。

        三、圖像盲恢復的應用前景

        (1)現有算法的改進以及新的算法研究。現有各種算法還存在許多不足,有必要對算法進一步改進。如IBD算法中, 如何選擇初始條件才能保證算法的收斂;如何選擇算法終止條件才能保證恢復的質量; 如何選擇濾波器中的噪聲參數才能減少噪聲的影響。又如NAR2R IF算法中, 如何進一步解決噪聲敏感問題,支持域的確定以及如何將算法擴展到非均勻背景的情況等。提出新的算法更好地解決圖像盲復原問題, 也是今后研究的熱點。

        (2)基于非線性退化模型的圖像盲復原算法。在實際應用中,嚴格來講,所有的退化模型都是非線性的。對模型采用線性化的方法進行近似處理,雖然算法簡單,但對非線性嚴重的情況處理效果并不理想。基于多項式以及神經網絡兩種參數模型處理非線性信號盲分離算法,算法擴展到二維圖像情況需要進一步研究。研究基于非線性退化模型的圖像盲復原算法也是下一步研究方向之一。

        (3)去噪處理算法研究。加性噪聲的存在,使圖像的復原問題變成了一個病態問題,而且由于一般假設只知道噪聲的統計特性,因此要從退化圖像中完全去除噪聲是不可能的。另外,由于噪聲的存在,恢復的效果并不理想,結合降噪的圖像盲恢復的算法研究有很現實的意義,這方面也進行了部分工作。為克服噪聲的影響,一般采用先進行降噪,后進行復原;二是將降噪和復原同時進行這兩類方法。目前,大多數算法中將噪聲描述成高斯噪聲進行研究, 在實際應用時有較大局限性。對于非高斯情況的研究采用基于噪聲的高階統計特性的去噪算法研究也是很重要的研究方向,也可采用其他類型的方法進行降噪,利用自組織映射的非線性獨立組件分析方法進行圖像降噪處理算法。

        (4)實時處理算法。算法的的復雜性是制約算法應用的一個重要方面。可采用正則化的離散周期Radon變換的方法將二維的卷積轉化為一維進行處理,以提高算法的速度;也可采用神經網絡的實時處理算法。算法的實時性是算法實際應用的先決條件。

        (5)應用研究。算法的應用是推動算法研究的動力。雖然圖像盲復原算法在天文學、醫學、遙感等方面獲得了較大的應用, 但將算法應用到一般的工業圖像實時檢測、機器視覺、網絡環境下的圖像傳輸恢復、刑事偵破等方面還有大量的工作要做。

        參考文獻:

        [1] 薛梅,楊綠溪.用于含噪二值圖像的改進NAS-RIF圖像盲復原算[J].數據處理.2006.17.(2).

        第8篇:卷積神經網絡的優點范文

        關鍵詞:紅棗(Ziziphus zizyphus);邊緣檢測;分級

        中圖分類號:S665.1;TP751.1文獻標識碼:A文章編號:0439-8114(2014)10-2427-04

        Grading Red Dates Based on the Size from Image Edge Detection

        YAO Na,WU Gang,CHEN Jie

        (College of Information Engineering,Tarim University,Alar843300,Xinjiang,China)

        Abstract:Starting from the application area of research in computer vision, a method of using image edge detection to calculate the size of red dates and to classify red dates in the case of absenting decayed red dates was developed. Simulation of edge detection demonstrated the validity and superiority of the wavelet method and the simulation of grading detection proved that the new method was effective and rapid,providing the basis for the key design of red dates classifier.

        Key words:red dates(Ziziphus zizyphus); edge detection; grading

        基金項目:新疆生產建設兵團青年科技創新資金專項(2013CB020)

        新疆地區紅棗品種較多,有的品種含糖量高達34%,其營養豐富,受到人們的喜愛。目前,紅棗品種越來越多,其產量及銷售量也越來越高,紅棗采集后對其進行分類是加工過程中很重要的工作環節,最初的分揀都是由人工完成,一方面需要大量的人力資源;另一方面不能保證產品的安全。隨著科學技術的發展,農業機械化的應用越來越廣泛,研究者將重點關注紅棗自動分級,可以節省人力而實現農業自動化。李湘萍[1]介紹了紅棗分級機的工作原理;張保生等[2]將紅棗的形狀特征、顏色特征和紋理特征通過BP網絡算法進行自動分級;趙文杰等[3]提出了以顏色作為特征利用支持向量機的方法進行紅棗的缺陷識別,識別率可達96.2%;肖愛玲[4]對幾種典型的紅棗分級機的結構進行了介紹;肖愛玲等[5]對2011年前紅棗的分級技術及研究現狀進行了總結;沈從舉等[6]對紅棗分級機的研究狀態和應用方法進行了歸納。

        目前,基于計算機視覺的方法具有智能化、精度高、損傷小等優點,該方法的核心部分在于選取什么特征以及利用何種算法對紅棗進行判斷。研究者提出的方法具有一個共同特點是特征選取較多,比如同時提取顏色特征、形狀特征和紋理特征,因此計算量較大,分級機的設計組成對信息處理的硬件部分有較高的要求,在紅棗分級機的設計中存在兩方面的問題:一方面成本較高;另一方面硬件達不到設計的要求。小波變換對噪聲不敏感,邊緣檢測清晰,所以有不少研究者將不同的小波變換方法[7-10]應用在圖像邊緣檢測中,經仿真試驗證明也適合應用在紅棗的邊緣檢測中。因此,本研究提出一種簡單的分級方法來對紅棗進行分級,即以提取紅棗的邊緣特征,只有形狀特征,應用小波變換的算法,減少了計算量。

        1材料與方法

        1.1材料

        紅棗品種為新疆阿拉爾地區種植的駿棗,已經過人為的挑揀,測試結果得分為優等級的個數較多。

        1.2檢測方法

        在無腐爛的情況下,個體較大、飽滿的紅棗可分到較高的級別中,可用邊緣檢測方法對紅棗的邊緣進行檢測,然后根據檢測出的邊緣再計算紅棗的面積,面積大于某一設定閾值的紅棗為優等級,其余為低級。

        1.3小波邊緣檢測

        小波變換可以解決時域和頻域的矛盾,可以將信號進行更精確地分析。圖像中的邊緣點為灰度變化較大的像素點,即一階微分極大值點或者二階微分過零點。圖像邊緣檢測可以通過小波的奇異性來檢測。設θ(x,y)為一個平滑的二維函數,在考慮尺度參數的情況下,θa(x,y)=■■,■,那么二維小波的定義[11]為:

        ψx(x,y)=■

        ψy(x,y)=■

        用矢量形式表示二維小波變換:

        a■+■

        =af■(x,y)■+f■(x,y)■

        =af(x,y)[ψx(x,y)■+ψy(x,y)■]

        =a[(fψx)(x,y)■+(fψy)(x,y)■]

        =Wxa f(x,y)■+Wya f(x,y)■

        =aΔ(fθa)(x,y)

        fθa(x,y)表示圖像f(x,y)與平滑函數θa(x,y)卷積后的平滑圖像。梯度矢量的模值為:

        ■ (3)

        梯度矢量與水平方向的夾角為:

        α=Arg[Wa(x,y)]

        =arctan■(4)

        確定梯度矢量的模值極值后,再經過閾值的處理,可以得到圖像的邊緣,不同的a可以實現多個不同尺度的檢測。圖像中目標的方向性是重要的特征之一,作為小波的改進方向,小波的應用成為了一個研究熱點,它能有較好的方向性分析,體現了圖像的方向性。任意方向小波變換[12]的定義為:(假設γ=0,θ∈[0,π)]

        Wθa f(x,y)=f(x,y)*g(x,y,θ,γ)

        =Wθa f(x,y)cosθ+Wθa f(x,y)sinθ

        =||Wa f(x,y)||■?

        cosθ+■sinθ (5)

        =||Wa f(x,y)||(cos(Arg[Wa f(x,y)]))?

        cosθ+sin(Arg[Wa f(x,y)])sinθ

        =||Wa f(x,y)||(cosαcosθ+sinαsinθ)

        =||Wa f(x,y)||cos(α-θ)

        運用小波方法對紅棗進行邊緣檢測,為紅棗分級檢測解決基礎性的第一步難題,同時也用經典的Prewitt算子、Roberts算子、Sobel算子、Log算子、Canny算子對紅棗進行邊緣檢測以便比較分析各自的特點。

        1.4分級檢測的過程

        檢測紅棗邊緣后需要對紅棗的面積進行計算,通過對邊緣點的長度進行計算可以得出邊緣的長度,將紅棗的形狀假設為圓形,可以用圓周長將圓面積求出,即可以求出紅棗的面積。假設計算檢測出邊緣點的長度,紅棗的面積近似為:

        s=■ (6)

        因為整個過程屬于比較過程,所以進行近似計算不影響相對的比較。

        整個分級檢測的仿真試驗步驟為:

        1)讀入紅棗圖像,將彩色RGB圖像轉為灰度圖像;

        2)對紅棗灰度圖像求出小波變換的模值和梯度矢量與水平方向的夾角;

        3)在水平方向、垂直方向、-45°方向和+45°方向4個方向上進行搜索判斷模值和梯度方向的條件得到邊緣值,將得到的邊緣值進行歸一化,設定閾值為0.18來判斷紅棗圖像的邊緣;

        4)計算紅棗的邊緣長度,確定紅棗邊緣長度的閾值;

        5)根據公式(6)計算紅棗的面積;大于邊緣長度閾值的對應面積閾值的紅棗判定為優良等級的紅棗,否則為較差等級的紅棗。

        針對不同的分級機的機械設計,紅棗面積的閾值的確定可以根據兩種方式:一種方式是針對分級機單個讀取紅棗圖像并直接進行分級挑揀的情況,閾值根據經驗值來確定,比如某種品種的紅棗大小是在固定范圍內波動,預先設定固定的閾值來進行分級挑揀;另一種方式是針對分級機進行大量紅棗圖像同時進行讀取時,遍歷全部紅棗圖像,找到最大面積的紅棗,然后閾值設定為最大值的80%,大于該閾值的紅棗判定為優等級,否則判定為較差等級。

        2結果與分析

        仿真試驗中分別對單個紅棗和兩個紅棗為例進行小波的邊緣檢測,并且將小波檢測結果與Prewitt算子、Roberts算子、Sobel算子、Log算子、Canny算子檢測結果進行分析對比。

        2.1 單個紅棗檢測結果

        圖1為理想的情況,即一個紅棗全部被讀入沒有遮蓋的情況,也是正常情況下的邊緣檢測。由圖1可以看出,小波方法檢測出的曲線較少,輪廓清晰,輪廓線的連續性好,一方面有利于邊緣長度的計算;另一方面減少了曲線個數的計算,減少了整個方法的計算量。Sobel算子檢測出的紅棗圖像與小波的方法相比較,噪點較多,定位精度不夠高,邊緣比較模糊;Canny算子檢測到的邊緣雖然比較連續,但是出現了由噪聲產生的偽邊緣,這樣在計算紅棗大小時會增加計算量,并且容易出錯;Prewitt算子和Roberts算子的檢測結果類似于Sobel算子的檢測結果,并且Roberts算子的檢測結果中邊緣斷點較多,給計算紅棗的長度帶來困難;Log算子的檢測結果邊緣較為連續,有少量斷點,與小波方法相比較紅棗內部的噪點較多,復雜度僅次于Canny算子的方法檢測出的結果。根據邊緣檢測的效果和計算復雜度以及后期需要的算法的復雜度來比較這幾種方法的優劣順序為小波、Prewitt算子、Roberts算子、Sobel算子、Log算子、Canny算子。

        2.2兩個有遮蓋的紅棗檢測結果

        圖2為遮蓋的情況,因此單個紅棗的邊緣不能完全檢測出,但是根據周長閾值的比較結果,同樣可以算出單個紅棗的面積。由圖2可以看出,小波方法對于有遮蓋的紅棗檢測仍是輪廓清晰且連續性好,內部曲線較少。Sobel算子檢測出的紅棗圖像與小波的方法相比較,噪點較多,邊緣斷點較多,邊緣比較模糊;Canny算子檢測到的邊緣過于模糊且斷點較多,還出現了由噪聲產生的偽邊緣,這樣在計算紅棗大小時對后期的算法要求較高,且容易出現錯誤結果;Prewitt算子和Roberts算子的檢測結果類似于Sobel算子的檢測結果,Roberts算子的檢測結果中邊緣較為清楚;Log算子的檢測結果邊緣斷點較多,與小波方法相比較紅棗內部的噪點較多,復雜度僅次于Canny算子的方法檢測出的結果。根據邊緣檢測的結果和計算復雜度以及后期算法的復雜度來比較這幾種方法的優劣順序為小波、Roberts算子、Prewitt算子、Sobel算子、Log算子、Canny算子。對于單個和兩個紅棗進行檢測的仿真結果都說明:較于其他5種算子,小波方法均是最優的。

        研究中采集的紅棗圖像大小為442×398像素,閾值采用經驗值,實際的周長閾值映射到圖像中的周長為1 084像素,仿真試驗結果判定為準確可行,試驗結果見表1。

        3小結與討論

        隨著自動化技術在農業產品中應用越來越廣泛,其理論研究的方法也越來越多,從計算機視覺領域結合農業自動化技術提出了對紅棗加工有促進作用的紅棗自動分級的核心方法,對于紅棗生產的地區有重要意義。研究提出了利用方向小波方法對紅棗圖像進行邊緣檢測進而計算紅棗大小來對紅棗分級的方法,經仿真試驗證明小波變換方法的優越性及整個方法的有效性和快速性。此研究是在假設紅棗無腐爛的情況下進行分級的,所以有一定的局限性,但在下一步研究中可以彌補此點的不足,設置多個閾值可以將紅棗進行多個等級的分揀。

        參考文獻:

        [1] 李湘萍.6ZF-0.5型紅棗分級機的試驗研究[J].山西農機,2000(14):3-5.

        [2] 張保生,姚瑞央.基于BP神經網絡算法的紅棗分級技術應用[J].廣東農業科學,2010(11):282-283.

        [3] 趙杰文,劉少鵬,鄒小波.基于機器視覺和支持向量機的缺陷棗的識別研究[J].農業機械學報,2008,39(3):113-115.

        [4] 肖愛玲.幾種典型的紅棗分級機[J].新疆農機化,2010(4):10-11.

        [5] 肖愛玲,李偉.我國紅棗分級技術及紅棗分級機研究現狀[J].農機化研究,2011(11):241-244.

        [6] 沈從舉,賈首星,鄭炫,等.紅棗分級機械的現狀與發展[J].中國農機化學報,2013,34(1):26-30.

        [7] 宋文龍,閔昆龍,邢奕,等.基于小波變換的自適應閾值植物根系圖像邊緣檢測[J].北京科技大學學報,2012,34(8):966-970.

        [8] 王敬東,徐亦斌,.圖像小波邊緣檢測中邊界處理的研究[J].計算機工程,2007,33(5):161-163.

        [9] 鮑雄偉.小波變換在圖像邊緣檢測中的應用[J].電子設計工程,2012,20(14):160-162.

        [10] 薄勝坤,張麗英.一種基于小波變換和Canny算子相結合的邊緣檢測方法[J].長春大學學報,2012,22(10):1177-1180.

        无码人妻一二三区久久免费_亚洲一区二区国产?变态?另类_国产精品一区免视频播放_日韩乱码人妻无码中文视频
      2. <input id="zdukh"></input>
      3. <b id="zdukh"><bdo id="zdukh"></bdo></b>
          <b id="zdukh"><bdo id="zdukh"></bdo></b>
        1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

          <wbr id="zdukh"><table id="zdukh"></table></wbr>

          1. <input id="zdukh"></input>
            <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
            <sub id="zdukh"></sub>
            亚洲日本香蕉观看观视频 | 香蕉在线精品视频在线观看 | 日本乱辈伦视频 | 三级国产人成在线 | 日韩中文字幕在线一区二区三区 | 又紧又爽精品一区二区 |