在以斑馬魚為模式生物的毒理學研究過程中,形態分析(morphometric analysis)是快速篩查新污染物、化學品、藥品等物質對生物造成異常影響過程或探究致病機理的重要分析手段。除胚胎致死率和孵化率外,污染物對斑馬魚幼魚所產生的多種毒性終點和亞致死影響等是探索該物質毒性作用模式的有效途徑。
近日,同濟大學林思劼團隊在Environmental Science & Technology上在線發表了題為“Deep Learning-Enabled Morphometric Analysis for Toxicity Screening Using Zebrafish Larvae”的科學論文。該研究創新發展了一種基于深度學習的斑馬魚仔魚形態分析方法(Deep Learning-enabled Morphometric Analysis,DLMA),該方法基于高通量篩選(High Throughput Screening, HTS)和深度學習技術實現客觀且高效地分析毒性物質對斑馬魚幼魚生長發育的影響(圖1)。

圖1 DLMA工作流程
研究選用包括重金屬、內分泌干擾物以及代表性新污染物等九種化學物質(PFOS,BPA,CdCl2,PbI2,APAP,27-DBCZ,36-DBCZ,3-BCZ,1368-TBCZ)進行斑馬魚胚胎的暴露實驗,并采用自動化成像裝置(EVOS M5000, Thermo Fisher Scientific)采集并構建了超過2500張具有最普遍代表性的仔魚(120 hours post-fertilization)表型畸形數據庫。隨后,利用AI輔助標注Labelbox對其中1328張圖像標注了具有16種類別的實例,其中包括8種經典畸形形貌:頭部出血、下顎畸形、魚鰾未膨起、心包水腫、卵黃囊水腫、脊柱彎曲、死亡和未孵化;以及8種重要器官:眼睛、下顎、卵黃囊、心臟、頭部、脊柱、魚鰾和尾部。研究基于兩種深度學習視覺模型,Mask R-CNN和TensorMask,以Res-Net 50/101為主干網絡,對上述數據集在開源深度學習目標檢測框架Detectron2上進行訓練并優化,經過3萬次迭代得到的預訓練模型的全類平均準確率(mAP,mean average precision)高于95%。與傳統機器學習模型相比,基于Mask R-CNN建立的DLMA方法能夠同時處理斑馬魚仔魚的畸形檢測和分類以及重要器官的語義分割,因此在對上述16種類別進行分類和檢測的同時,能夠實現對每個類別的精確分割,得到每個重要器官的量化數據(如眼睛大小,心包面積等),其檢測速率利用NVIDIA RTX 2080 GPU能夠達到13 FPS(0.075s每張)。此外,該方法分別在未訓練過的120 hpf的斑馬魚圖像(1080張)和公開數據集斑馬魚仔魚圖像(870張)進行了統計學驗證,分別達到了93%和86%的正確率,且量化數據的誤差均低于10%(圖2)。

圖2 模型訓練,器官分類和量化參數
該方法的建立還使構建物質種類與畸形表型和重要器官受影響程度的構效關系成為可能(圖3)。研究發現APAP和PbI2分別誘導產生了色素缺失和頭部出血,被單獨分為一簇;BPA和PFOS兩種內分泌污染物產生了明顯的發育延遲效應,被分為一個子簇;PHCZs(polyhalogenated carbazoles)系列化學物質由于具有與二惡英(TCDD)類似的化學結構而產生了相似的心臟毒性效應,誘導產生了明顯的心包水腫畸形,包括3-BCZ、27-DBCZ、36-DBCZ和1368-TBCZ等四種新污染物被分類在一個父簇之下。

圖3 化學物質與表型終點之間聯系的關系圖
這項研究通過發展DLMA分析方法和實例驗證了深度學習在傳統毒理學篩選領域的應用潛力,結合人工智能領域的技術有助于加速環境毒理學研究的進展。考慮到大量層出不窮的人工化學品和新污染物種類,利用深度學習及其他自動化裝置構建篩選和評估物質毒性的自動化平臺具有重大意義。DLMA工作流程能夠作為高通量分析的基礎框架,推動構建一個可以快速評估并預測新污染物毒性作用的環境健康評價系統,從而更好地了解化學物質對環境和生物健康的影響,并制定更恰當的管控治理策略。
同濟大學環境科學與工程學院碩士研究生董公卿為該論文的第一作者,同濟大學環境科學與工程學院林思劼教授為該論文的通訊作者。本研究獲得了國家自然科學基金(No. 21777116;No.22176150)和中央高校基本科研業務費專項資金等項目的資助。