深度學習大潮中的工業視覺檢測
深圳市聯優視覺技術有限公司
在2010年以前,機器視覺技術廣泛應用于工業檢測中。通常,算法工程師從自己對當前問題的理解和知識,對問題進行模型近似,然后結合自己的理論和技術進行問題求解。每個解決方案的性能與工程師的能力息息相關,很容易就可以看到解決方案的上限。而且,由于當時圖像算法技術和理論所限,解決方案中通常會有很大一部分努力是在于如何通過光照(要求視覺光源)、相機和鏡頭選型(要求工業相機和工業鏡頭的性能)來優化成像方案的方式來簡化問題,縮小問題邊界,來降低算法適用性過小的不利影響。
進入2010年后,深度學習理論席卷學術圈,也對機器視覺理論和技術帶來了深遠的影響。很多機器視覺的領頭企業也在這個方面進行發力,例如Cognex。深度學習的主要影響體現在以下方面:1.數據與模型的關系發生質的變化。傳統理論和技術中,模型為主,數據為輔,模型在設計時通常都假定能夠適用大多數情況,例外發生時,收集數據,再由工程師進行模型修正;基于深度學習的理論和技術,數據為主,模型隱藏于數據當中,或者說由數據訓練而來。2.技術適用性大大增強。在數據足夠的情況下,基于深度學習的技術或者解決方案,具備很強的魯棒性,其所能帶來的性能大大超出算法工程師的能力邊界。因此,對于光照、成像環節的要求大大降低。3.系統行為的可預測性大大降低,由于訓練數據的龐大與前向網絡的高度非線性,想要對該系統進行較詳盡的分析已經沒有可能。因此,使用中出現的問題,很難分析其根由,不像傳統技術,review代碼即可知道在模型在哪一方面有不足或者是因為什么代碼BUG引起的。
但是,需要指出的是,基于深度學習理論和技術也是有其邊界,也有其不擅長的領域。深度學習理論和技術比較適合用來解決判斷邏輯,譬如“檢測當前圖像是否有缺陷?”,“更像何種類型的缺陷?”等檢測與分類問題。但是對于測量等應用,則會不太適用。其根由在于,作為對標人類智能的理論和技術,在大多數應用領域中,深度學習理論技術還是以模仿或者逼近人類智能為其目標。而人類智能對識別擅長,但是對于測量等問題并不擅長,因此以學習人類為目標的深度學習理論和技術也依然受此限制。同時,深度學習理論和技術的出現,并不意味著傳統打光、成像技術就沒有用武之地。而且,在比較大型的應用中(例如人臉識別),也經常能看到同時集成了傳統算法技術和深度學習理論技術的解決方案。一個設計合理的方案與系統,會大大簡化我們待解決問題的維度與復雜度,從而大大縮短我們訓練網絡的數據量和時間,也同時大大降低網絡的復雜度(網絡規模和參數量),從而會大大降低我們解決方案所需的計算資源要求,這對于IOT等場合無疑是我們優先考慮的選項。
總之,深度學習理論和技術給機器視覺領域帶來沖擊,并產生了深遠的影響,這種技術與傳統技術之間的融合將會大大推進機器視覺領域的發展。
相關推薦