中大首创具全球代表性的医疗人工智能基础模型 革新眼科疾病领域 促进更公平有效、具成本效益及保障私隐的医疗人工智能创新
由香港中文大学(中大)医学院与多位国际研究人员领导组成的国际研究联盟,正式启动「全球RETFound计划」,利用一亿张眼底图像,创建首个具全球代表性的医疗人工智能基础模型。凭藉此全球性模型,各地研究员仅需少量数据及运算资源,便能以更公平、有效及保障私隐的方式开发医疗人工智能应用程式。「全球RETFound计划」的理论依据与创新性已刊登於国际权威医学期刊《Nature Medicine》。

图为负责促进「全球 RETFound计划」的成员,包括(左起)中大医学院眼科及视觉科学学系研究助理教授姜泓羊博士、新加坡国立大学杨潞龄医学院助理教授覃宇宗博士、中大医学院眼科及视觉科学学系张艳蕾教授、英国伦敦大学学院Pearse Keane教授以及中大医学院眼科及视觉科学学系科学主任冉安然博士。
汇聚一亿张眼底图像 加快全球医疗人工智能研究及临床应用
医疗基础模型是开发人工智能应用的起点,需要广泛且多元的数据才能发挥效能,惟训练模型的数据集并不完善,无法代表多个地域及族裔,尤其是东南亚、中亚、拉丁美洲、非洲及中东地区,阻碍医疗人工智能的发展。不同地区亦各自设有法规严格监管数据共享。模型分析未见资料的能力(又称泛化能力)不足,加上专业知识及人工智能基础设施匮乏等问题,技术差距日益扩大。
由中大医学院、新加坡国立大学杨潞龄医学院、英国伦敦大学学院眼科研究所(Institute of Ophthalmology, UCL)及NIHR Moorfields生物医学研究中心的研究人员率先携手开发「Global RETFound」模型。此模型汇聚了来自全球超过65个国家及地区、超过100个研究团队的一亿多张彩色眼底图像。其数据集的规模空前庞大,涵盖地区包括东南亚、非洲、中东、南美洲、西太平洋及高加索地区。作为有史以来最大型的医疗人工智能合作计划之一,此全球模型是史上其中一个最具地理及族裔多样性的医疗数据集,专为训练人工智能而设。

「全球 RETFound计划」是有史以来最大型的医疗人工智能合作计划之一。合作成员来自全球超过65个国家及地区,并由过百个研究团队组成,携手汇集一亿多张彩色眼底相,促进全球医疗创新。
中大医学院眼科及视觉科学学系张艳蕾教授强调此项研究具深远意义:「此项计划有望革新医疗人工智能在分析未见资料的能力及公平性方面的国际标准。透过向全球研究人员提供一个经全球数据训练的基础模型,我们可以加速开发更切合本地临床需求的人工智能工具,同时大幅减省所需的数据量及运算资源。」是次研究的团队成员亦包括中大医学院眼科及视觉科学学系科学主任冉安然博士及研究助理教授姜泓羊博士。
新加坡国立大学杨潞龄医学院助理教授覃宇宗博士补充说:「现时的基础模型多以『狭义』的地理及人口结构数据进行训练,不仅限制效能,亦加剧早已存在的医疗不平等问题。『Global RETFound』联盟为克服此难题,以创新方式辅助国际研究团队广泛参与,同时严格保障个人私隐。」
兼容性更高、更保障私隐
此模型具有灵活的「双轨」数据共享框架,可兼容不同的参与机构而不受技术能力差距及不同的监管要求所影响,革新医疗人工智能的发展。该框架容许机构於所在地区微调生成式人工智能模型,而中央系统仅共享模型参数,确保病人资料不会在原机构以外范围流传。此外,已去识别化的数据亦可通过加密的基础设施直接共享,让在本地缺乏图形处理资源或技术专才的机构也能参与研究。

该医疗人工智能基础模型具有灵活的「双轨」数据共享框架,容许机构在所在地区微调生成式人工智能模型,而中央系统仅共享模型参数,防止病人资料外泄。机构如果缺乏本地图形处理器资源或技术专才,亦可通过框架内的加密基础设施直接共享已去识别化的数据。
英国伦敦大学学院Pearse Keane教授表示:「此『双轨』模式让不同的研究团队均可参与其中,而毋须顾虑资源是否充足。凭藉生成技术,我们可将真实与合成的数据相结合,构建一个多元且具全球代表性的数据集并保障资料的安全性。」
「Global RETFound」模型将接受多种眼科及全身疾病的全面评估,当中包括糖尿病视网膜病变、青光眼、老年黄斑病变、心血管疾病、神经退化性疾病及糖尿病相关血管并发症。该模型亦将用CC授权(Creative Commons License)形式发布,供全球非商业用的研究项目免费使用。
此联盟致力於推广此研究方式,以便眼科以外的其他医学专科团队也能作好准备,建立类似的研究计划。联盟期望鼓励更多研究人员及机构加入,共同推动更包容的医疗人工智能发展。