發表評論:
很多人都會問目前業內人臉識別技術的挑戰和難點是什么,是什么讓有些人對人臉識別的看法不是那么的樂觀。為什么很多人覺得沒有成熟可靠的商業應用。但是論文中已經接近99.7%了但是在現實中我們又能做到多少。實踐和論文的差距是什么。
很多人都會問目前業內人臉識別技術的挑戰和難點是什么,是什么讓有些人對人臉識別的看法不是那么的樂觀。為什么很多人覺得沒有成熟可靠的商業應用。但是論文中已經接近99.7%了但是在現實中我們又能做到多少。實踐和論文的差距是什么。
在回答這個的問題的時候,我覺得應該注意做科研和做產品之間的區別。人們在論文中匯報的人臉識別技術是屬于科研的行列。比如在LFW上99.7%,這種數字的意義更多是讓搞研究的那個圈子里面的人更加直觀的了解到一些情況,你也知道,通常來說這個準確率是非常高的了,所以會說我們可以說人臉識別技術在LFW上已經很成熟了,但是一模一樣的技術,拿到真實環境下得到的準確率可能只有75%……也許會有些人覺得這是很可笑的,不,請不要笑,這是科研圈里朋友的普遍做法,不是沒有苦衷的。
干過LFW的朋友其實心里都清楚,這并不是一個很好的數據庫。圖片都是從網上下載的,人臉的質量也是千差萬別,有人說這樣才接近真實情況……但實際上距離大部分的實際應用場景還是太遠了。
目前評價科研中算法的優劣的唯一方法就是找一個數據集,然后大家一起對比,數據集的不同算法得到的結果也會不同,然而……論文上通常是有報喜不報憂的惡習的,所以常常會有不公平的對比存在,隨著越來越多更大的人臉數據集的慢慢增加,對于算法的評價會可能會變得稍微公平一些……即便是這樣,論文里所謂的人臉識別技術,跟可用的『產品』之間的差距仍然很大。
這并不是說論文的算法不好,而是『產品』的天性。大部分產品都是針對性的解決一類或幾類問題,產品講究是速度,穩定性,成本,等等,不同的產品通??梢约尤氩煌南闰炆踔令~外的硬件來提升產品的可用性。這是做『產品』和做『科研』的區別。
論文和實踐的差別在于數據和方法。針對數據選擇方法,是用很多種方法融合,針對不同的情況調試不同的參數,使用不同的trick,甚至使用外圍的硬件輔助,最終的目的是提升產品的綜合體驗。
在科研里,人臉識別系統技術還是有很多可以去研究的東西的,比如怎么用更小的數據更小的模型得到更好的準確率。比如怎么克服光照的影響,比如怎么通過局部特征來完成準確識別……。
發表評論: