透過以上對分級結構的了解可以理解,在分級結構中任何一個區域的功能受損,都會影響人腦對運動的辨識和跟蹤,各種研究也證實了這一點[10-14]。人對運動的感知和理解,並不是局限在某一個腦區或者幾個腦區,而是全腦參與的活動[15]。人腦在運動處理上,除了有被動的運動感知,還有主動的運動追蹤,即凝視(共軛凝視,conjugate gaze)能力。
因而人眼就像一台高靈敏度、快速聚焦、快速響應、三軸穩定的攝影機,目前人類還造不出在對焦能力上足以和人眼比肩的攝影機,更別說做到跟眼睛同等體積了。人腦在運動辨識及追蹤處理上,目前區別於電腦運動辨識追蹤的重要一點是,
人腦的辨識追蹤是即時的,並能反饋控制眼睛的主動追逐。
在該機制下,透過「where」和「what」通路處理的資訊,會傳遞到額葉眼領域(FEF, Frontal eye fields)等眼動控制中心,作出眼球運動響應。該機制因此有如下優點:
在目前沒有能力如此強大的攝影機機的背景下,目前做的電腦運動辨識追蹤主要是基於被動影像的處理,即不會根據處理結果調整聚焦和鏡頭方向。在該條件下,對追逐演算法引入學習能力,仍然可以大幅提高追蹤速度和準確性,如Tracking-Learning-Detection (TLD) [17]方法: