中國科學院腦科學與智能技術卓越創新中心常樂研究組在《自然-通訊》(Nature Communications)上,發表了題為High-dimensional topographic organization of visual features in the primate temporal lobe的研究論文。該研究結合功能核磁共振、電生理記錄和深度學習等技術手段,系統解析了獼猴和人類被試高級視覺區的特征選擇性和拓撲組織規律,為探究視覺系統的演化和發育、構建類腦的視覺加工模型奠定了重要基礎。
物體識別是人類從外界獲取信息的重要一環。靈長類負責物體識別的腦區是下顳葉皮層。以往研究表明,靈長類下顳葉不是一個均一的結構,而是包括多個加工特定物體種類或物體特征的子區域,如加工面孔信息的面孔腦區、加工軀干信息的軀干腦區和加工視覺場景的場景腦區。前人針對下顳葉皮層的功能分區已開展了較多研究,但仍有一些重要問題尚未解答。例如,目前的功能分區不能連續覆蓋整個下顳葉,剩余的腦區的功能尚不清楚;既往研究主要在獼猴或者人類被試單獨進行,兩個物種下顳葉皮層的分區是否存在明顯差異尚不清楚。
為了回答上述問題,科研人員需要找到一組豐富的視覺特征對下顳葉皮層的選擇性進行系統刻畫。前人工作顯示,深度卷積網絡的深層單元可較好地解釋下顳葉神經元的反應。基于這一發現,常樂研究組將網絡單元對20萬張自然圖片的反應降維得到25個視覺特征(圖1a)。利用功能核磁共振實驗,研究組獲得了獼猴和人類被試顳葉皮層不同子區對這25個特征的選擇性(圖1b)。
常樂研究組系統比較了功能核磁實驗獲得的神經選擇性和視覺特征(圖2a),在與前人研究取得聯系的基礎上,發現了之前未報道的神經特征,并定位了編碼該特征的腦區。進一步,該研究組通過電生理實驗驗證了核磁實驗的結果(圖2b-e)。
同時,科研人員對顳葉皮層特征分布的拓撲組織規律進行了系統和定量的研究,發現了獼猴顳葉存在一對方向相互垂直但空間尺度不同的視覺特征梯度,而這種拓撲組織方式不能被一類近期提出的、用于解釋下顳葉拓撲結構的模型所復現,為這一類類腦智能的發展提供了新的約束。此外,該工作針對人類被試進行了同樣的核磁實驗發現:人類和獼猴相比,雖然顳葉總體結構相似但是在特征選擇性和拓撲組織規律上有較大不同,尤其體現在對無生命物體的編碼,人類編碼明顯更強;相比獼猴,人類顳葉皮層拓撲組織的規律性更差,獼猴顳葉中相互正交的特征梯度在人類大腦并不明顯(圖2f-h)。研究推測,這兩個物種間的差異可能是由于人類需要識別各種各樣的人造物體和符號。這一需求擴大了加工無生命物體的腦區,并打亂了原本有規律的拓撲組織結構。
該研究刻畫了靈長類高級視覺區的信息表征地圖,為探索物體視覺的神經機制奠定了基礎。過去,該領域對特征選擇性的研究高度定量,使用了各種復雜、先進的計算模型;相對而言,對其拓撲組織規律是定性描述為主。該工作則采用精細、定量的方式對這一問題開展研究,揭示了不同物種之間(獼猴和人類)和不同系統之間(大腦和人工神經網絡)的差異,為設計具有類腦結構的人工智能提供了依據。該研究通過構建視覺信息的大腦地圖,為腦圖譜的研究提供了可靠的功能參考。
研究工作得到中國科學院、科學技術部、國家自然科學基金委員會和上海市的資助,并獲得腦智卓越中心神經影像中心的技術支持。

圖1.(a)特征提取。AlexNet第7層4096個單元對20萬張自然圖片的反應,經過ICA降維得到25個特征。(b)獼猴左側顳葉皮層對25個特征的選擇性地圖。紅色和藍色分別顯示對特征正向和負向的偏好。

圖2.
(a)獼猴顳葉皮層的特征選擇性與21個已知視覺特征的關系。數值越高代表兩者相似性越強。
(b)獼猴顳葉未知腦區偏好特征的代表性圖片。Positive為偏好圖片,Negative為不偏好圖片。
(c)通過比較b中兩組圖片定位了一個腦區,并進行電生理記錄,黑線為記錄電極。
(d)該區域中一個神經元對兩組圖片的反應。
(e)該區域的群體結果(紫線)。作為對照,定位并記錄了一個對Negative刺激反應更強的腦區,其群體反應如綠線所示。
(f)獼猴顳葉偏好三個重要特征的子腦區以非常規則的方式排布:綠色、藍色條帶交替,兩側為紅色區域。三種不同顏色對應三個重要特征。
(g)人類大腦顳葉呈現類似排布,但規律性較獼猴差很多。
(h)獼猴和人類顳葉皮層拓撲組織規律性的定量比較。上圖為特征梯度的方向性,下圖為不同梯度的正交性。兩個指標都顯示獼猴顳葉的規律性更強。