Artificial Intelligence Supports Research Progress in the Diagnosis and Treatment of Rare Diseases
-
摘要:
在已描述的7000多种罕见疾病中仅有5%找到了治疗方法。大数据时代,随着生物医学数据的不断增加,迫切需要高效快速的数据收集、分析和识别方法。以机器学习为着重点的人工智能应用为罕见病开辟了一条全新的途径,并广泛应用于诊断与治疗。人工智能已经向人们充分展示了其学习和分析来自不同来源的数据并做出可靠预测的能力。目前已有数量可观的人工智能技术应用于罕见疾病的案例,本文旨在总结罕见病中人工智能应用的研究进展。另外,还系统地总结了人工智能应用程序的局限性,并展望了人工智能在罕见病应用领域中的发展。
Abstract:It is noteworthy that only 5% of more than 7000 described rare diseases are treated. In the era of big data, there is ever-increasing data for understanding biomedicine. The need for efficient and rapid data collection, analyses and characterization methods is pressing. Rare diseases can particularly benefit from artificial intelligence (AI) application. AI, with an emphasis on machine learning, creates a path for such efforts and is being applied to diagnosis and treatment. AI has demonstrated its potential to learn and analyze data from different sources with results in prediction。Presently, there are AI-driven technologies applied for rare diseases and this review aims to summarize these advances. Moreover, this review scrutinizes the limitation and identifies the pitfalls of AI applications in the diagnosis and treatment of rare diseases.
-
Keywords:
- artificial intelligence /
- machine learning /
- rare disease /
- diagnosis /
- treatment /
- drug repositioning /
- drug development
-
国际上缺乏统一的罕见病定义,发达国家和地区一般采用患病率或患病数对罕见病进行界定,如美国将影响小于20万人口[1]、欧洲将每万人中影响少于5例患者的疾病定义为罕见病[2],世界卫生组织将罕见病定义为患病人数占总人口65/10万~100/10万的疾病或病变。
虽然每种罕见病可能只影响少数人群[3],但从整体看,罕见病并不罕见。超过7000种罕见病给患者和社会带来了沉重的健康负担。根据不同研究给出的预测,其影响的人口比例达5%以上,影响超过3亿人口[3-4]。保守估计,罕见病在中国影响了至少1000万人[5]。然而由于认识有限和医疗资源分布不均,我国罕见病早期识别和确诊可及性不足。中国罕见病患者平均需经历5年,8位医生,2~3次误诊才能得到最终确诊[6],同时有超过60%的患者无法在本地医院确诊[7]。由于罕见病往往是遗传起源和早期发病,大多数罕见病会伴随着患者一生[8]。我国孤儿药的可获得性和可负担性同样较差。在美国、欧盟和日本批准的孤儿药分别仅有37.8%、24.6%和52.4%被批准在中国市场销售[9]。同时有调查表明,14种罕见病的22种孤儿药是大多数中国居民无法负担的[9]。罕见病的特殊性导致传统的诊治模式难以满足患者的需求,延误诊治最佳时机带来的沉重后果非一般家庭所能承担,因此使用新方法和新技术赋能罕见病诊疗迫在眉睫。
人工智能是计算机科学的一个分支,从广义上定义为执行通常需要人类智能任务的计算机系统[10-11],其在某些临床领域的表现开始媲美甚至超过人类医生[12-13]。从2018年开始,全球医疗保健人工智能市场年均复合增长率的估算值高达43.5%,在2025年,这一市场的总值预计将达到276亿美元[14]。目前,人工智能在医学影像诊断领域的应用已拓展到了以前依赖人类专家的前沿领域[15],同时还在继续向其他领域扩展,如临床实践[16]、转化医学研究[17-18]、基础生物医学研究[19]等。
目前除了罕见病国际合作平台的努力[20],人工智能在改善罕见病患者诊疗现状的进程中也发挥着愈发重要的作用,目前正越来越多地应用于罕见病领域[21]。罕见病种类超过7000种,遍布临床各个科室,但病例数量少,仅有极少数医生见到过真实案例,难以获得诊疗经验,导致了罕见病较高的误诊率。大部分罕见病的诊断依赖于基因检测,但数量庞大且繁杂的基因突变位点,给基因位点的选择和结果解读带来巨大挑战。人工智能技术通过深入挖掘海量多源跨模态的结构化、半结构化以及非结构化医学信息,借助神经网络、知识图谱等先进技术,辅助医生作出罕见病诊疗决策,提高决策的效率和准确率,将为罕见病诊疗带来全新的发展方向[8],推动罕见病诊疗取得跨越式发展。
1. 人工智能技术助力罕见病诊疗
1.1 人工智能与罕见病诊断
随着医学研究的日益深入及电子健康记录等可用数据的爆炸式增长,计算机化诊断工具辅助临床决策获得了较快发展,其中一些工具专注于特定的罕见病诊断。人工智能整合和分析不同来源数据的能力在克服罕见病挑战(如诊断率低、患者数量少、地域分散)方面有巨大的潜力。以下将探讨人工智能在罕见病诊断中的典型应用。
1.1.1 下一代测序技术与罕见病
下一代测序(next-generation sequencing,NGS)技术为科学家们开拓了一条罕见病研究的新途径,相关基因和突变的鉴定对罕见病的预测和诊断至关重要。NGS通过在早期阶段提供快速、强大且低成本的基因分析替代方案,能够实现罕见病患者早期阶段的快速诊断,大大降低诊断延迟。
非同义单核苷酸变异(single nucleotide variants,SNV)是导致罕见病的重要潜在因素。2018年,CliniPred的出现促进了人们对高通量测序技术中变异表型的解释。CliniPred是预测非同义SNV疾病的一种分类器,其通过两种不同的机器学习算法分析来自罕见病外显子的临床数据并具有高灵敏度和特异度[22]。此外,一些最初被认为是单基因的疾病已被发现存在寡基因或多基因遗传模式。2019年,Papadimitriou等[23]研究者开发了一种基于机器学习方法识别基因对中的致病变异组合的预测器,该预测器在外部验证时表现出良好性能。
1.1.2 人工智能辅助基因型-表型整合分析
整合多种策略的基因组数据融合方法来检测突变的有害性,并以特定表型的方式对其进行优先排序已引起广泛关注。对于罕见病患者的外显子组测序得到的变异信息文件,首先进行变异筛选,然后优先考虑与临床表型相似的候选基因,以帮助研究人员确定致病变异。然而,这通常会留下很多候选位点(高达1000个)需要人工手动评估,所以需通过优先级算法对位点进行排序。
外显子疾病变异分析(exome disease variant analysis,eDiVA)是一种发表于2019年的变异致病性预测和注释工具并应用于多种罕见病,该工具通过使用家庭或父亲-母亲-子代3人的全外显子测序识别因果突变,已被科研人员应用于数个家族性疾病病例以证明临床适用性[24]。此外,其他基于神经网络的人工智能工具,如同年发表的Xrare和Deep phenomeNET变异预测器可通过一组表型和遗传特征识别全外显子或全基因组序列数据中可能的致病变异[25]。在测试中,Xrare和DeepPVP在速度和准确性上均优于类似工具和临床专家。这些结果凸显了人工智能将在罕见病领域发挥愈发重要的作用。
1.1.3 人工智能加速表型驱动诊断
尽管NGS技术的发展使医学步入基因组时代,但尚有许多疾病的病因往往难以与分子层面信息相关联,因此,临床表型依然是准确快速诊断罕见病的重要手段。
罕见病异质关联网络是一种表型驱动的基因优先排序系统。这是一个通过算法获得表型-疾病-基因与通路之间的异构网络。该工具有助于改善罕见病的因果基因识别,且与其他先进的工具相比表现出更优异的性能,因此被视为诊断支持系统的重大进步[26]。
此外,许多罕见病患者表现出特征性的畸形并具有可识别的面部特征,对临床遗传诊断具有极高的信息价值[27]。2019年,《自然》杂志上报道的基于计算机视觉和深度学习算法的图像分析框架DeepGestalt令人瞩目。该模型在超过17 000张图像的数据上进行训练,通过面部分析进行遗传诊断,并在以诊断、区分遗传综合征和反映临床真实环境的试验中取得了优于临床医生的表现。除诊断外,DeepGestalt还可通过匹配具有相似表型的未确诊患者来识别新的遗传综合征[28]。
1.1.4 人工智能辅助罕见病数据库构建与挖掘
随着患者病例数量和有关研究数据的指数级增长,更好的命名实体识别(named entities recognition,NER)方法愈加重要。由于罕见病患者数量相对较少,命名方法复杂和不同数据库之间编码不统一导致了严重的数据孤岛现象。不同作者文献中医学术语缩写差异也进一步阻碍了罕见病数据库的整理[29]。人工智能辅助的罕见病数据标准化与结构化有助于不同数据平台的互联互通。2019年,来自广东工业大学的团队提出了一种名为Dic-Att-BiLSTM-CRF(DABLC) 的神经网络NER方法。DABLC应用高效的精准字符串匹配方法将疾病实体与基于其构建的疾病字典进行匹配,其结合了外部字典资源和深度注意力神经网络的优点,从而有助于识别罕见疾病和复杂疾病的名称,并减少标签不一致的影响[30],相似的方法已在常见病领域中广泛应用[31]。而人工智能在罕见病标注识别这一领域的进展为罕见病数据平台的互操作性铺平了道路。
人类拷贝数变异(copy number variants,CNV)也会导致疾病的发生[32]。作为一种常规的遗传诊断方法,CNV的检测和解释具有重要临床价值。目前已经创建了数个用于分析CNV的在线数据库,但是遗传学专家和临床医生仍希望能更快速地从文献中获取更详细的信息,尤其是对罕见病而言稀有的CNV。我国天河计算机团队使用基于机器学习驱动的NER工具挖掘文本生成了数据库CNVdigest,可通过快速和自动的PubMed文章检索描述CNV与疾病的相关性,并用于挖掘和识别CNV与疾病的关联[33]。此外,还有研究证明了在协同过滤模型中使用异构数据集(电子病历和文献)可辅助支持罕见病诊断[34]。人工智能辅助罕见病数据库挖掘有助于建立一个全面的文献知识-疾病-表型-基因网络,从而帮助临床医生进行罕见病诊断。
1.2 人工智能与罕见病的治疗
在超过7000种罕见病中,目前只有约5%能够被有效治疗[35]。人工智能针对性应用于罕见病治疗领域的研究目前较少,但人工智能在常见疾病治疗中取得令人鼓舞的成果有望改变罕见病治疗现状,大幅降低治疗成本[8]。
1.2.1 人工智能与药物重定位
药物重定位,又称旧药新用,是指为已经批准或研究中的药物确定新的适应证。作为一种快捷且具有性价比的方法,药物重定位在罕见病治疗领域尤为重要。人工智能在拓展现有药物的罕见病适应证方面极具潜力,其驱动的相似性融合算法可全面系统地提示许多药物的副作用和新适应证[36]。2019年,Cell System杂志发表了一种利用机器学习的统一计算框架用于人类疾病的RNA样本注释(Unveiling RNA Sample Annotation for Human Diseases,URSAHD)。通过学习数千个临床基因表达谱信息并将每种罕见病与经过充分研究疾病的已记录药物疗法相关联以进行药物重定位。通过这种方式,URSAHD成功预测了癌症化疗药物,如顺铂可用于治疗两种不同的罕见贫血性疾病。其准确地区分了类似疾病间的机制差异,并利用这些差异来预测机制上存在适用性的药物[37]。尽管算法上仍有改进空间,但人工智能具有成为辅助药物重定位强有力工具的潜力。
1.2.2 人工智能改善临床试验
临床试验是治疗手段落地中不可或缺的部分。人工智能的应用可以为临床试验解决患者招募、生物标志物筛选等障碍。
2017年发表的一篇研究报道了通过人工智能算法从电子病历中挖掘新的儿童肺动脉高压患者。该研究基于可计算表型方法,在波士顿儿童医院的病历中挖掘出了413例未参加注册的儿童肺动脉高压患者[38]。这种人工智能与传统患者注册相结合的应用从数量甚至质量上改善了罕见病研究群体招募的问题。
此外,选取可靠易测量的生物标志物同样有助于在临床试验中分析患病过程或对其他干预措施的反应,这对治疗方案的开发十分重要。相较于传统的统计学方法,机器学习算法更能高效准确地从复杂的代谢谱数据中挖掘潜在的生物标志物。2018年,一篇临床期刊报道了科学家通过基于机器学习算法(Biosigner算法、基于偏最小二乘判别分析、随机森林和支持向量机)的多变量分析,发现了肌萎缩侧索硬化症治疗组和对照组之间代谢谱的差异进而确认鞘磷脂是相关疾病进展的潜在标志物[39]。此外,该算法还在West综合征患者中发现丝氨酸和一种未知代谢产物(X363)为潜在的生物标志物[40]。类似的基于随机森林的方法用于挖掘先天性胫骨假关节等其他罕见病的生物标志物挖掘[41]。相比人工筛查,基于人工智能的方法有望更为高效准确地解决与罕见病临床试验相关的诸多挑战。
1.2.3 无线网络技术及人工智能赋能远程医疗
我国大部分地区的罕见病患者不能得到及时的诊断和治疗[7],因此发展罕见病领域的远程医疗十分迫切[42-43]。随着我国分级诊疗制度的完善、5G及相关基础设施的普及,远程医疗的发展应用迎来了极佳的机遇。
2020年,一项德国的研究报道了4G和人工智能技术在非洲辅助皮肤科疾病的诊断。在该项目中人工智能只用于诊断5种易识别的皮肤病,这项工作在实现常见疾病自动化诊断和减少医生负担方面是卓有成效的[44]。在新型冠状病毒肺炎流行期间,快速促进了人工智能辅助的远程医疗应用,其中包括在医学教育领域提供高质量、互联的教育模式[45],提供维持患者治疗连续性的远程途径,如远程会诊以及处理保险文件[46],武汉协和医院的团队也通过5G远程会诊为疫情一线的患者救治提供指导和技术支持[47]。
2. 人工智能应用于罕见病领域面临的挑战
近年来,人工智能在医疗健康领域的应用备受瞩目,但人工智能面临的挑战尚未得到实质性解决[48]。虽然人工智能在临床应用中显现出巨大的潜力,但目前鲜有大规模部署。在这一部分,本文将探讨人工智能应用于医疗领域的普遍性以及罕见病领域所特有的风险与挑战。
2.1 人工智能应用于医疗领域普遍性的风险与挑战
2.1.1 可解释性
传统的人工智能系统,如规则驱动系统具有良好的可解释性。然而日益复杂的人工智能技术,如深度学习对计算结果的可解释性带来了重大挑战。这些人工智能犹如黑盒,除了少数在设计之初就维持了可解释性外[23],大多算法驱动的预测方式通常无法被阐释[49]。即在大多数情况下,数据训练机器学习算法的方式无法依据顺序和逻辑细节进行追踪[48]。循证医学往往建立在可解释性的最高标准基础之上,由此而产生信任和可接受性的挑战。医疗决策者渴望最大程度上理解疾病的致病和治疗机制[50]。这些机制理解的欠缺也会影响医疗保健利益相关者接受人工智能方法。可解释性的缺乏会导致当条件变化时(如影像学硬件变化、患者群体改变、扫描协议更新等)人们无法确定人工智能的结论是否可以推广[51]。医生不愿相信他们不完全理解的工具,即便它们获得数据支持或通过审查。美国食品药品监督管理局(Food and Drug Administration,FDA)已经批准了人工智能软件工具用于辅助诊断疾病,但由于用例的缺少,医生无法真正了解如何可靠地使用此类人工智能工具[52]。此外,患者同样对人工智能存在信任问题,其对机器错误的容忍度远低于人为错误[52]。对此,研究人员正试图通过事后解释技术探索黑盒模型的原理[53]。
2.1.2 隐私保护和数据安全
机器学习模型训练依赖大量来自患者和公众的健康相关数据,而隐私权益的保护对人工智能训练和应用提出了挑战。大数据时代可应用于人工智能的数据极广。然而,目前对数据的法律监管尚不完善,许多健康相关程序收集用户数据也未取得明确的知情同意[54-55]。很大一部分数据共享采用去标识化的做法,这是当前权衡隐私和数据收集需求的最优方式。在中国,对于去标识化数据的法律监管缺乏强制性措施,并存在较多有关个人信息使用的豁免条款。从个人隐私保护的角度来看,中国的法律监管尚处于发展阶段。但令人担忧的是,研究表明对于宣称去标识化的数据通过与其他数据库的链接和交叉识别存在被重新标识化的可能[56]。基于中国患者病例数据(出生日期、性别和基于家庭住址的代理邮政编码),有研究表明其中接近20%的人口可以在g-distinct度量下被唯一识别,超过90%的人可以被限定在十人的范围内[57]。
《健康保险流通与责任法案》(Health Insurance Portability and Accountability Act,HIPAA)为增强隐私保护提供了可行的解决方法[15]。另外,联邦学习技术在不共享输入数据的情况下进行多中心联合分析建模,数据保存在本地,模型在本地学习并更新,只共享模型的实时副本也是实现隐私保护的可行办法[48-59]。
数据对于人工智能的研发至关重要,出于隐私保护的顾虑为人工智能带来巨大风险。随着中国社会隐私保护意识的不断增强,人工智能的研发和推广必须寻找可行的解决途径。
安全风险同样不容忽视。如对抗性工具,通过构建错误数据混淆和干扰机器学习模型并使人工智能做出次优的决策。最近一项研究便证实了只要对患者电子病历的轻微修改便可完全改变人工智能做出的死亡率预测[60]。2019年发表的一项研究也同样证明了对抗性攻击对医疗机器学习的潜在威胁[61]。因此,医疗专业人员应充分意识到潜在的安全风险并为对抗性攻击制定有效的保护机制。
2.1.3 算法偏倚
算法偏倚包括但不限于数据缺失、样本差异、错误分类、测量误差[62]。人工智能的算法很大程度上取决于训练所用的数据。当训练所使用的数据不完整或只能代表人群中的一个子集时,那么生成的模型最佳性能应用范围也将局限于训练数据所代表的人群[63]。不同卫生系统的目标服务人群各不相同,这些差异包括但不限于不同的社会经济地位、生活方式、偏好和遗传差异,人工智能在开发时应充分考虑到这些因素。当用于训练模型的数据库面临缺乏人口多样性等问题时,就会出现算法偏倚。2019年,《华尔街日报》报道了谷歌用于诊断糖尿病视网膜病变的人工智能算法在模型开发地区以外的印度人群中表现欠佳[64]。2020年,一项有关人工智能心理健康护理的研究同样证实了基于有缺陷数据库的算法偏倚,此偏倚导致了心理疾病诊断的差异并可能进一步导致健康不平等[65]。来自不同来源的数据同样可能存在无法忽视的差异,如医院数据会比个人穿戴设备报告更严重的疾病进程[66]。此外,大部分人工智能模型训练需基于人类专家对数据的注释,专家通过不同的方式和情感标记数据同样会导致下游模型存在算法偏倚,这种数据偏差甚至会威胁健康平等[67]。
训练数据库和实际情况间的差异审查将为人工智能的应用带来挑战。对于稍有误差便会导致严重后果的疾病诊疗领域,要想使人工智能的应用得到推广,这些算法偏倚带来的后果需得到充分的关注。减少算法偏倚的一种方法是收集更大量的患者数据,如观察性健康医疗数据科学与信息学(Observational Health Data Sciences and Informatics,OHDSI)项目[68]。
2.1.4 可及性
机器学习的应用和开发需要强大的计算机算力,甚至一些模型需要长达数周的训练时间。人工智能应用程序的效率与计算机支持紧密相关,这导致了对可及性的挑战。世界上许多国家的大部分医疗保健机构由公共机构资助,缺少支持人工智能算力的资金来源[48]。虽然相比于人工智能开发,运行已训练完成的人工智能模型所需的资源更少,但如何存储和处理数据同样成为了人工智能实施计划中的主要挑战[48]。同时,人工智能的训练依赖受过训练的“人类专家”对数据进行标记。以医学影像为例,虽然图像可由非临床专家标记,但依旧需要专业领域的“专家”确保可信度,这一过程往往昂贵且耗时。尤其是罕见疾病会出现更多的并发症但缺少自动标记算法,当只有极少数的“专家”曾接触过这些罕见疾病并能够验证时,人工智能的可及性会大幅降低[15]。最近发表的自动化数据管理方法,如生成对抗网络[69]和自编码器[70]有望大大缩短注释时间,但这通常需要更多的数据[15]。
2.1.5 监管
在过去的几年中,各国监管部门一直在采取循序渐进的措施更新人工智能的监管框架来匹配数字健康市场快速发展的步伐。2017年美国FDA发布了数字健康创新行动计划(Digital Health Innovation Action Plan)[52]。2019年又进一步制定了有关软件功能和移动设备的政策指导文件,其中描述了对临床辅助决策支持系统包括利用机器学习算法的监管[52]。但人工智能内部工作原理不易解释,了解神经网络数十万节点间的关联和刺激序列是无法实现的。监管机构一直在尝试依赖机器学习和模式识别技术的监管,但随着人工智能的复杂性日益增加(如向深度学习和神经网络的转变),监管人工智能在罕见病诊疗中的应用将变得更具挑战性。此外,人工智能应用普遍处于终身学习并快速迭代的过程中。随着更大量数据的使用,在应用中处理和学习更多的数据,其算法也会随着时间的推移而改变。因此,监管者需要在特定时间间隔内进行定期测试以确保性能符合预期。相应的是人工智能工具开发者也必须前瞻性地规划软件的更新和发展以确保可以满足监管要求。基于软件版本的监管审批策略可能是有效的解决途径[52]。
2.2 人工智能应用于罕见病领域特有的风险与挑战
人工智能训练需要大量高质量的可用标准化数据,模型的选择同样取决于可用数据[8]。非结构化的数据库成为了限制人工智能应用的主要瓶颈[15]。由于数据保护问题和架构间的组织障碍,很多数据被锁定在隔离的、独立的、缺少互操作性的系统中[66]。罕见病患者的数量要远低于常见疾病,与之对应的是纳入研究的患者数量也相对较少。相比于常见疾病的人工智能模型,数据的稀缺性将直接导致罕见病人工智能模型性能的劣势[8]。为了创建更大的数据库,跨机构和国际合作显得尤为重要。
此外,医疗卫生行业由于缺少为现代数据分析而设计的运营系统和数据系统,且很多导致罕见病的危险因素仍未阐明,因此罕见病医疗健康数据仍存在质量上的缺陷[71]。得益于质量和处理标准的统一,目前图像是人工智能最常见的优质数据输入类型[15]。根据2020年发表的一项研究,在211项人工智能应用于罕见病的研究中,图像数据占32%[8]。相比之下,将机器学习应用于其他类型数据(如电子病历中的文本数据)的挑战更高,因为这些数据通常缺乏标准化和结构化。尤其是罕见病领域,标准的罕见病命名法及标准词汇对非标准化数据的利用和互操作性至关重要[8]。
3. 展望
在大数据时代,日益成熟的人工智能技术已广泛应用于生物医学领域。由于罕见病表型异质性和信息的稀缺,关注罕见病的研究严重缺乏。目前罕见病全外显子组测序诊断率不足30%,大多数患者仍无法获得诊断[72],人工智能算法有望通过突变预测等方式将罕见病诊断提升到新的水平。基于人工智能的多组学综合诊断也取得了进展[22, 24],由于包含的信息更为全面,跨模态多组学医疗数据融合分析技术在罕见病领域具有广阔的前景[73]。
目前世界范围内的医学文献、电子病历和患者登记系统等提供了庞大但颗粒度不佳且相互独立的数据资源。即便数据规模海量,其可用性依然是人工智能发展面临的主要挑战。在罕见病领域亟需采用统一本体且可互操作的健康登记系统,而人工智能通过自然语言处理和NER可为这一进程起到关键的推动作用。
中国罕见病患者数量超过1000万,亟需推动罕见病智能医疗的发展[5]。在中国团队发表的研究数量日益增长的同时,必须看到我国在罕见病诊断率、孤儿药可用性和数据库体系等方面与发达国家的差距[7, 9, 74-75]。国际罕见病研究联盟2017—2027年的目标之一是所有在医学界已有先例的疑似罕见病病例将在初诊后的一年内得到诊断[76],为了尽早实现这一目标,在兼顾隐私保护、法律监管和改善算法偏倚的同时,进一步探索人工智能的应用以改善罕见病患者的诊疗和预后极为必要且重要。
作者贡献:张抒扬选定研究方向、提出研究选题并负责文章终审工作。弓孟春在研究中为文章设定内容框架并起草主要部分; 焦塬石、马武仁在文章撰写阶段负责调研和整理文献、内容起草及修订; 刘鹏、金晔、胡继发、牛灵、史文钊为文章内容提出了修订建议。利益冲突:所有作者均声明不存在利益冲突。 -
[1] Arno PS, Bonuck K, Davis M. Rare diseases, drug development, and AIDS: the impact of the Orphan Drug Act[J]. Milbank Q, 1995, 73: 231-252. doi: 10.2307/3350258
[2] Franco P. Orphan drugs: the regulatory environment[J]. Drug Discov Today, 2013, 18: 163-172. doi: 10.1016/j.drudis.2012.08.009
[3] Nguengang Wakap S, Lambert DM, Olry A, et al. Estimat-ing cumulative point prevalence of rare diseases: analysis of the Orphanet database[J]. Eur J Hum Genet, 2020, 28: 165-173. doi: 10.1038/s41431-019-0508-0
[4] Li X, Lu Z, Zhang J, et al. The urgent need to empower rare disease organizations in China: an interview-based study[J]. Orphanet J Rare Dis, 2020, 15: 282. doi: 10.1186/s13023-020-01568-5
[5] Wang JB, Guo JJ, Yang L, et al. Rare diseases and legislation in China[J]. Lancet, 2010, 375: 708-709. doi: 10.1016/S0140-6736(10)60240-1
[6] Rare Diesease Impact Report: Insights from patients and the medical community Shire2013[J/OL]. https://globalgenes.org/wpcontent/uploads/2013/04/ShireReport-1.pdf.
[7] Yan X, He S, Dong D. Determining how far an adult rare disease patient needs to travel for a definitive diagnosis: A cross-sectional examination of the 2018 national rare disease survey in China[J]. Int J Environ Res Public Health, 2020, 17: 1757. doi: 10.3390/ijerph17051757
[8] Schaefer J, Lehne M, Schepers J, et al. The use of machine learning in rare diseases: a scoping review[J]. Orphanet J Rare Dis, 2020, 15: 145. doi: 10.1186/s13023-020-01424-6
[9] Gong S, Wang Y, Pan X, et al. The availability and affordability of orphan drugs for rare diseases in China[J]. Orphanet J Rare Dis, 2016, 11: 20. doi: 10.1186/s13023-016-0392-4
[10] Ramesh AN, Kambhampati C, Monson JR, et al. Artificial intelligence in medicine[J]. Ann R Coll Surg Engl, 2004, 86: 334-338.
[11] Barbour AB, Frush JM, Gatta LA, et al. Artificial intelligence in health care: insights from an educational forum[J]. J Med Educ Curric Dev, 2019, 6: 2382120519889348.
[12] Esteva A, Kuprel B, Novoa RA, et al. Dermatologist-level classification of skin cancer with deep neural networks[J]. Nature, 2017, 542: 115-118. doi: 10.1038/nature21056
[13] Gulshan V, Peng L, Coram M, et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs[J]. JAMA, 2016, 316: 2402-2410. doi: 10.1001/jama.2016.17216
[14] Yu KH, Beam AL, Kohane IS. Artificial intelligence in healthcare[J]. Nat Biomed Eng, 2018, 2: 719-731. doi: 10.1038/s41551-018-0305-z
[15] Hosny A, Parmar C, Quackenbush J, et al. Artificial intelligence in radiology[J]. Nat Rev Cancer, 2018, 18: 500-510. doi: 10.1038/s41568-018-0016-5
[16] Jha S, Topol EJ. Adapting to artificial intelligence: radiologists and pathologists as information specialists[J]. JAMA, 2016, 316: 2353-2354. doi: 10.1001/jama.2016.17438
[17] Yu KH, Levine DA, Zhang H, et al. Predicting ovarian cancer patients' clinical response to platinum-based chemotherapy by their tumor proteomic signatures[J]. J Proteome Res, 2016, 15: 2455-2465. doi: 10.1021/acs.jproteome.5b01129
[18] Yu KH, Fitzpatrick MR, Pappas L, et al. Omics analysis system for precision oncology (OASISPRO): a web-based omics analysis tool for clinical phenotype prediction[J]. Bioinformatics, 2018, 34: 319-320. doi: 10.1093/bioinformatics/btx572
[19] Hayden EC. The automated lab[J]. Nature, 2014, 516: 131-132. doi: 10.1038/516131a
[20] Lasker JN, Sogolow ED, Sharim RR. The role of an online community for people with a rare disease: content analysis of messages posted on a primary biliary cirrhosis mailinglist[J]. J Med Internet Res, 2005, 7: e10. doi: 10.2196/jmir.7.1.e10
[21] Rajkomar A, Dean J, Kohane I. Machine learning in medicine[J]. N Engl J Med, 2019, 380: 1347-1358. doi: 10.1056/NEJMra1814259
[22] Alirezaie N, Kernohan KD, Hartley T, et al. ClinPred: prediction tool to identify disease-relevant nonsynonymous single-nucleotide variants[J]. Am J Hum Genet, 2018, 103: 474-483. doi: 10.1016/j.ajhg.2018.08.005
[23] Papadimitriou S, Gazzo A, Versbraegen N, et al. Predicting disease-causing variant combinations[J]. Proc Natl Acad Sci USA, 2019, 116: 11878-11887. doi: 10.1073/pnas.1815601116
[24] Bosio M, Drechsel O, Rahman R, et al. eDiVA-classifica-tion and prioritization of pathogenic variants for clinical diagnostics[J]. Hum Mutat, 2019, 40: 865-878. doi: 10.1002/humu.23772
[25] Boudellioua I, Kulmanov M, Schofield PN, et al. Deep-PVP: phenotype-based prioritization of causative variants using deep learning[J]. BMC Bioinformatics, 2019, 20: 65. doi: 10.1186/s12859-019-2633-8
[26] Rao A, Vg S, Joseph T, et al. Phenotype-driven gene prioritization for rare diseases using graph convolution on heterogeneous networks[J]. BMC Med Genomics, 2018, 11: 57. doi: 10.1186/s12920-018-0372-8
[27] Smpokou P, Lanpher BC, Rosenbaum KN. Important considerations in the initial clinical evaluation of the dysmorphic neonate[J]. Adv Neonatal Care, 2015, 15: 248-252. doi: 10.1097/ANC.0000000000000216
[28] Gurovich Y, Hanani Y, Bar O, et al. Identifying facial phenotypes of genetic disorders using deep learning[J]. Nat Med, 2019, 25: 60-64. doi: 10.1038/s41591-018-0279-0
[29] Brasil S, Pascoal C, Francisco R, et al. Artificial intelli-gence (AI) in rare diseases: is the future brighter?[J]. Genes (Basel), 2019, 10: 978. doi: 10.3390/genes10120978
[30] Xu K, Yang Z, Kang P, et al. Document-level attention-based BiLSTM-CRF incorporating disease dictionary for disease named entity recognition[J]. Comput Biol Med, 2019, 108: 122-132. doi: 10.1016/j.compbiomed.2019.04.002
[31] Bhasuran B, Murugesan G, Abdulkadhar S, et al. Stacked ensemble combined with fuzzy matching for biomedical named entity recognition of diseases[J]. J Biomed Inform, 2016, 64: 1-9. doi: 10.1016/j.jbi.2016.09.009
[32] Kaminsky EB, Kaul V, Paschall J, et al. An evidence-based approach to establish the functional and clinical significance of copy number variants in intellectual and developmental disabilities[J]. Genet Med, 2011, 13: 777-784. doi: 10.1097/GIM.0b013e31822c79f9
[33] Yang X, Song Z, Wu C, et al. Constructing a database for the relations between CNV and human genetic diseases via systematic text mining[J]. BMC Bioinformatics, 2018, 19(Suppl 19): 528.
[34] Shen F, Liu S, Wang Y, et al. Utilization of electronic medical records and biomedical literature to support the diagnosis of rare diseases using data fusion and collaborative filtering approaches[J]. JMIR Med Inform, 2018, 6: e11301. doi: 10.2196/11301
[35] Kaufmann P, Pariser AR, Austin C. From scientific discovery to treatments for rare diseases-the view from the national center for advancing translational sciences - office of rare diseases research[J]. Orphanet J Rare Dis, 2018, 13: 196. doi: 10.1186/s13023-018-0936-x
[36] Keiser MJ, Setola V, Irwin JJ, et al. Predicting new molecular targets for known drugs[J]. Nature, 2009, 462: 175-181. doi: 10.1038/nature08506
[37] Lee YS, Krishnan A, Oughtred R, et al. A computational framework for genome-wide characterization of the human disease landscape[J]. Cell Syst, 2019, 8: 152-162. doi: 10.1016/j.cels.2018.12.010
[38] Geva A, Gronsbell JL, Cai T, et al. A computable phenotype improves cohort ascertainment in a pediatric pulmonary hypertension registry[J]. J Pediatr, 2017, 188: 224-231. doi: 10.1016/j.jpeds.2017.05.037
[39] Blasco H, Patin F, Descat A, et al. A pharmaco-metabolomics approach in a clinical trial of ALS: Identification of predictive markers of progression[J]. PLoS One, 2018, 13: e0198116. doi: 10.1371/journal.pone.0198116
[40] Lagrue E, Madji Hounoum B, Rullier C, et al. Cerebro-spinal fluid metabolomics in west syndrome: Central role of the serine metabolic pathway[J]. J Transl Sci, 2018, 4: e101.
[41] Carlier A, Vasilevich A, Marechal M, et al. In silico clinical trials for pediatric orphan diseases[J]. Sci Rep, 2018, 8: 2465. doi: 10.1038/s41598-018-20737-y
[42] Combi C, Pozzani G, Pozzi G. Telemedicine for developing countries. A survey and some design issues[J]. Appl Clin Inform, 2016, 7: 1025-1050. doi: 10.4338/ACI-2016-06-R-0089
[43] Ekeland AG, Bowes A, Flottorp S. Effectiveness of telemedicine: a systematic review of reviews[J]. Int J Med Inform, 2010, 79: 736-771. doi: 10.1016/j.ijmedinf.2010.08.006
[44] Greis C, Maul LV, Hsu C, et al. Artificial intelligence to support telemedicine in Africa[J]. Hautarzt, 2020, 71: 686-990. doi: 10.1007/s00105-020-04664-6
[45] Lucey CR, Johnston SC. The transformational effects of COVID-19 on medical education[J]. JAMA, 2020, 324: 1033-1034. doi: 10.1001/jama.2020.14136
[46] Sinha S, Kern LM, Gingras LF, et al. Implementation of video visits during COVID-19: lessons learned from a primary care practice in New York City[J]. Front Public Health, 2020, 8: 514. doi: 10.3389/fpubh.2020.00514
[47] Chen LK, Yuan RP, Ji XJ, et al. Modular composite building in urgent emergency engineering projects: a case study of accelerated design and construction of Wuhan Thunder God Mountain/Leishenshan hospital to COVID-19 pandemic[J]. Autom Constr, 2021, 124: 103555. doi: 10.1016/j.autcon.2021.103555
[48] Shaw J, Rudzicz F, Jamieson T, et al. Artificial intelligence and the implementation challenge[J]. J Med Internet Res, 2019, 21: e13659. doi: 10.2196/13659
[49] Samek W, Wiegand T, Müller KR. Explainable artificial intelligence: understanding, visualizing and interpreting deep learning models[J]. arXiv preprint arXiv: 170808296, 2017.
[50] Greenhalgh T, Howick J, Maskrey N. Evidence based medicine: a movement in crisis? [J]. BMJ, 2014, 348: 3725. doi: 10.1136/bmj.g3725
[51] Ford RA, Price W, Nicholson I. Privacy and accountability in black-box medicine[J]. Mich Telecomm Tech L Rev, 2016, 23: 1.
[52] Benjamens S, Dhunnoo P, Meskó B. The state of artificial intelligence-based FDA-approved medical devices and algorithms: an online database[J]. NPJ Digit Med, 2020, 3: 118. doi: 10.1038/s41746-020-00324-0
[53] Molnar C, Casalicchio G, Bischl B. Interpretable machine learning-a brief history, state-of-the-art and challenges[J]. arXiv preprint arXiv: 09337, 2010.
[54] Gostin LO, Halabi SF, Wilson K. Health data and privacy in the digital era[J]. JAMA, 2018, 320: 233-234. doi: 10.1001/jama.2018.8374
[55] Grundy Q, Held FP, Bero LA. Tracing the potential flow of consumer data: A network analysis of prominent health and fitness apps[J]. J Med Internet Res, 2017, 19: e233. doi: 10.2196/jmir.7347
[56] Culnane C, Rubinstein BI, Teague V. Health data in an open world[J]. arXiv preprint arXiv: 171205627, 2017.
[57] Gong M, Wang S, Wang L, et al. Evaluation of privacy risks of patients' data in China: Case study[J]. JMIR Med Inform, 2020, 8: e13046. doi: 10.2196/13046
[58] Festag S, Spreckelsen C. Privacy-preserving deep learning for the detection of protected health information in real-world data: comparative evaluation[J]. JMIR Form Res, 2020, 4: e14064. doi: 10.2196/14064
[59] Zhang W, Wang Q, Li M. Privacy-preserving collaborative training for medical image analysis based on multi-blockchain[J]. Comb Chem High Throughput Screen, 2021, 24: 933-946. doi: 10.2174/1386207323666201022110616
[60] Sun M, Tang F, Yi J, et al. Identify susceptible locations in medical records via adversarial attacks on deep predictive models[J]. arXiv preprint arXiv: 1802.04822.
[61] Finlayson SG, Bowers JD, Ito J, et al. Adversarial attacks on medical machine learning[J]. Science, 2019, 363: 1287-1289. doi: 10.1126/science.aaw4399
[62] Gianfrancesco MA, Tamang S, Yazdany J, et al. Potential biases in machine learning algorithms using electronic health record data[J]. JAMA Intern Med, 2018, 178: 1544-1547. doi: 10.1001/jamainternmed.2018.3763
[63] Mittelstadt BD, Allo P, Taddeo M, et al. The ethics of algorithms: mapping the debate[J]. Big Data Society, 2016, 3: 2053951716679679.
[64] Abrams C. Google's effort to prevent blindness shows AI challenges[J]. The Wall Street J, 2019, 1: 26.
[65] Straw I, Callison-Burch C. Artificial Intelligence in mental health and the biases of language based models[J]. PLoS One, 2020, 15: e0240376. doi: 10.1371/journal.pone.0240376
[66] Schwendicke F, Samek W, Krois J. Artificial intelligence in dentistry: chances and challenges[J]. J Dent Res, 2020, 99: 769-774. doi: 10.1177/0022034520915714
[67] Khullar DAI. Could worsen health disparities[N]. New York Times, 2019-1-31.
[68] Hripcsak G, Duke JD, Shah NH, et al. Observational health data sciences and informatics (OHDSI): opportunities for observational researchers[J]. Stud Health Technol Inform, 2015, 216: 574-578.
[69] Xiao C, Choi E, Sun J. Opportunities and challenges in developing deep learning models using electronic health records data: a systematic review[J]. J Am Med Inform Assoc, 2018, 25: 1419-1428. doi: 10.1093/jamia/ocy068
[70] Kingma DP, Welling M. Auto-encoding variational bayes[J]. arXiv preprint arXiv: 13126114, 2013.
[71] Nelson GS. Bias in artificial intelligence[J]. N C Med J, 2019, 80: 220-222.
[72] Jaganathan K, Kyriazopoulou Panagiotopoulou S, McRae JF, et al. Predicting splicing from primary sequence with deep learning[J]. Cell, 2019, 176: 535-548. doi: 10.1016/j.cell.2018.12.015
[73] Wang F, Preininger A. AI in health: state of the art, challenges, and future directions[J]. Yearb Med Inform, 2019, 28: 16-26. doi: 10.1055/s-0039-1677908
[74] Austin CP, Cutillo CM, Lau LPL, et al. Future of rare diseases research 2017—2027: an IRDiRC perspective[J]. Clin Transl Sci, 2018, 11: 21-27. doi: 10.1111/cts.12500
[75] Han J, Cui Y, Zhou X. Rare diseases research in China: opportunities, challenges, and solutions[J]. Intractable Rare Dis Res, 2012, 1: 10-12.
[76] Austin CP, Dawkins HJS. Medical research: next decade's goals for rare diseases[J]. Nature, 2017, 548: 158.
-
期刊类型引用(3)
1. 马晓碗,龚力,万智,程南生. 中国罕见病临床研究现状的分析与思考. 华西医学. 2025(01): 2-6 . 百度学术
2. 刘晓涵,晋红中. 皮肤罕见病诊治进展及管理体系建设. 罕见病研究. 2023(02): 147-152 . 本站查看
3. 张文,闫晓婷,许莹,张欣欣,李倩,左煌. 罕见病研究数据采集和应用的现状及伦理学思考. 中国医学伦理学. 2023(10): 1132-1137+1154 . 百度学术
其他类型引用(1)
计量
- 文章访问数: 1112
- HTML全文浏览量: 435
- PDF下载量: 239
- 被引次数: 4