中大首創具全球代表性的醫療人工智能基礎模型 革新眼科疾病領域 促進更公平有效、具成本效益及保障私隱的醫療人工智能創新
由香港中文大學(中大)醫學院與多位國際研究人員領導組成的國際研究聯盟,正式啟動「全球RETFound計劃」,利用一億張眼底圖像,創建首個具全球代表性的醫療人工智能基礎模型。憑藉此全球性模型,各地研究員僅需少量數據及運算資源,便能以更公平、有效及保障私隱的方式開發醫療人工智能應用程式。「全球RETFound計劃」的理論依據與創新性已刊登於國際權威醫學期刊《Nature Medicine》。

圖為負責促進「全球 RETFound計劃」的成員,包括(左起)中大醫學院眼科及視覺科學學系研究助理教授姜泓羊博士、新加坡國立大學楊潞齡醫學院助理教授覃宇宗博士、中大醫學院眼科及視覺科學學系張艷蕾教授、英國倫敦大學學院Pearse Keane教授以及中大醫學院眼科及視覺科學學系科學主任冉安然博士。
匯聚一億張眼底圖像 加快全球醫療人工智能研究及臨床應用
醫療基礎模型是開發人工智能應用的起點,需要廣泛且多元的數據才能發揮效能,惟訓練模型的數據集並不完善,無法代表多個地域及族裔,尤其是東南亞、中亞、拉丁美洲、非洲及中東地區,阻礙醫療人工智能的發展。不同地區亦各自設有法規嚴格監管數據共享。模型分析未見資料的能力(又稱泛化能力)不足,加上專業知識及人工智能基礎設施匱乏等問題,技術差距日益擴大。
由中大醫學院、新加坡國立大學楊潞齡醫學院、英國倫敦大學學院眼科研究所(Institute of Ophthalmology, UCL)及NIHR Moorfields生物醫學研究中心的研究人員率先攜手開發「Global RETFound」模型。此模型匯聚了來自全球超過65個國家及地區、超過100個研究團隊的一億多張彩色眼底圖像。其數據集的規模空前龐大,涵蓋地區包括東南亞、非洲、中東、南美洲、西太平洋及高加索地區。作為有史以來最大型的醫療人工智能合作計劃之一,此全球模型是史上其中一個最具地理及族裔多樣性的醫療數據集,專為訓練人工智能而設。

「全球 RETFound計劃」是有史以來最大型的醫療人工智能合作計劃之一。合作成員來自全球超過65個國家及地區,並由過百個研究團隊組成,攜手匯集一億多張彩色眼底相,促進全球醫療創新。
中大醫學院眼科及視覺科學學系張艷蕾教授強調此項研究具深遠意義:「此項計劃有望革新醫療人工智能在分析未見資料的能力及公平性方面的國際標準。透過向全球研究人員提供一個經全球數據訓練的基礎模型,我們可以加速開發更切合本地臨床需求的人工智能工具,同時大幅減省所需的數據量及運算資源。」是次研究的團隊成員亦包括中大醫學院眼科及視覺科學學系科學主任冉安然博士及研究助理教授姜泓羊博士。
新加坡國立大學楊潞齡醫學院助理教授覃宇宗博士補充說:「現時的基礎模型多以『狹義』的地理及人口結構數據進行訓練,不僅限制效能,亦加劇早已存在的醫療不平等問題。『Global RETFound』聯盟為克服此難題,以創新方式輔助國際研究團隊廣泛參與,同時嚴格保障個人私隱。」
兼容性更高、更保障私隱
此模型具有靈活的「雙軌」數據共享框架,可兼容不同的參與機構而不受技術能力差距及不同的監管要求所影響,革新醫療人工智能的發展。該框架容許機構於所在地區微調生成式人工智能模型,而中央系統僅共享模型參數,確保病人資料不會在原機構以外範圍流傳。此外,已去識別化的數據亦可通過加密的基礎設施直接共享,讓在本地缺乏圖形處理資源或技術專才的機構也能參與研究。

該醫療人工智能基礎模型具有靈活的「雙軌」數據共享框架,容許機構在所在地區微調生成式人工智能模型,而中央系統僅共享模型參數,防止病人資料外洩。機構如果缺乏本地圖形處理器資源或技術專才,亦可通過框架內的加密基礎設施直接共享已去識別化的數據。
英國倫敦大學學院Pearse Keane教授表示:「此『雙軌』模式讓不同的研究團隊均可參與其中,而毋須顧慮資源是否充足。憑藉生成技術,我們可將真實與合成的數據相結合,構建一個多元且具全球代表性的數據集並保障資料的安全性。」
「Global RETFound」模型將接受多種眼科及全身疾病的全面評估,當中包括糖尿病視網膜病變、青光眼、老年黃斑病變、心血管疾病、神經退化性疾病及糖尿病相關血管併發症。該模型亦將用CC授權(Creative Commons License)形式發布,供全球非商業用的研究項目免費使用。
此聯盟致力於推廣此研究方式,以便眼科以外的其他醫學專科團隊也能作好準備,建立類似的研究計劃。聯盟期望鼓勵更多研究人員及機構加入,共同推動更包容的醫療人工智能發展。