人工智能在医疗保健领域开发数字孪生的作用:癌症护理案例(二)
原文链接
4 案例研究:利用 AI 进行子宫内膜癌护理的数字孪生概念化
为了探索数字孪生在癌症护理中的应用,我们选择了子宫内膜癌的示例案例研究,子宫内膜癌是澳大利亚最常见的妇科癌症之一(澳大利亚癌症,2021 年)。子宫内膜癌约占所有子宫癌的90%(癌症委员会,N.D.),是女性癌症死亡的第六大原因(美国癌症协会,N.D.; R. L. Siegel 等人,2019 年)。2018年,全球诊断出约380,000例新的子宫内膜癌病例(世界癌症研究基金会国际,N.D)。
不同国家的医疗保健挑战和交付各不相同(Schütte 等人,2018 年)。医疗保健系统和结构影响治疗的工作方式(同上)。因此,在本案例研究中,我们专注于一个医疗保健系统,即在澳大利亚的背景下。我们正在与澳大利亚的一家大型癌症医院合作,从而获得临床医生和相关数据,以支持数字孪生的发展,并将其应用于医疗保健环境,以增强临床决策支持。
癌症诊断需要考虑多种风险因素。如果没有决策支持解决方案的帮助,包含临床和基因组数据的大型数据集可能难以及时有效地导航和评估(Dork 等人,2020 年)。新的研究表明了患者的基因组图谱与子宫内膜癌之间的关系(Dork 等人,2020 年)。因此,分析基因组和组织病理学数据提供了额外的患者风险分层,这可以帮助临床医生确定量身定制的个性化指导和治疗策略(Marnitz 等人,2020 年)。然而,这种复杂数据的整合和临床开发是尚未解决的挑战(Bjornsson 等人,2019 年)。
数字孪生可以帮助表示这些数据并将其集成到个人的数字副本中,而人工智能算法可用于通过考虑多种风险因素来确定患者的总体生存率以及疾病在整个生命周期中的行为来进行癌症诊断和/或预测。下面,我们将讨论在癌症护理中概念化数字孪生的三个相互关联的推动因素。
4.1 物理世界数据
如图1所示,来自物理世界的数据是开发癌症患者数字孪生的关键驱动力。数字健康技术采用的进步见证了企业级临床和实验室信息系统的广泛部署,导致收集了大量临床和非临床患者数据,并以组织病理学和放射学调查、基因组图谱和临床进展记录的数字成像形式提供(Aceto 等人,2020 年;维克拉马辛哈等人,2021 年)。这些大量的多模态数据对于开发数据驱动的模型(即数字模型)至关重要(Barricelli等人,2019)。数字模型的性能将取决于数据的质量、数量和可用性(同上)。
从文献调查中,我们确定并分类了不同类型的子宫内膜癌数据集(如表1所示),这些数据集在公共领域可用,可用作开发数字孪生的第一步。在表1中,我们还指定了数据格式(例如,文本,数字)以及数据是主观的还是客观的。“客观”是指数据不会根据个人的观点而变化,而“主观”是指可以根据个人意见而变化的数据。收集的数据可用于指导患者的癌症管理途径:
诊断数据用于确定患者是否患有癌症,并进一步确定癌症的确切类型及其程度(分期)。
预后数据有助于提供有关结局潜力的信息,包括生存率和癌症复发。
预测数据用于测量和提供有关患者癌症对特定类型治疗的可能结果的信息。
治疗监测数据用于衡量对治疗的反应,结果数据用于训练新的或重新训练现有的人工智能模型。
表 1. 子宫内膜癌数据源、类型及其用法
数据类型 | 数据源 | 示例数据 | 数据格式 | 主观或客观 | 用法 |
---|---|---|---|---|---|
临床数据 | SEER, NCDB, TCGA | 分期、分级、BMI、诊断年龄 | 文本和数字 | 目的 | 预后和预测 |
人口统计数据 | SEER, NCDB, TCGA | 种族、民族、性别 | 文本和数字 | 目的 | 预后和预测 |
实验室和扫描数据 | TCGA | CT 扫描、MRI、PET 扫描、组织病理学显微镜图像 | 图像 | 目的 | 诊断 |
患者报告数据 | — | 疼痛程度,感到沮丧,进行体育锻炼的能力 | 文本和数字 | 主观 | 治疗监测 |
基因组数据 | TCGA, 波特克 | 原始测序数据、基因表达 | 文本和数字 | 目的 | 诊断、预后和预测 |
社会心理数据 | 先知,NCDB | 婚姻状况 | 发短信 | 客观和主观 | 预后和预测 |
传统上,在包括子宫内膜癌在内的大多数癌症中,选择5到10个风险因素,从中可以将患者分为相对同质的组(Chambers等人,2020)。这些用于设计临床试验(同上)。来自临床试验的信息侧重于跟踪患者群体对特定治疗方案的反应,如果患者属于该特定组,则选择适当的治疗方法(同上)。随着更多数据的出现,它可以帮助提供更个性化的建议,但在诊断、预后、预测和治疗监测决策中可能会考虑更多的危险因素。同时考虑所有风险因素可能超出了人类决策者的典型认知能力。然后,数字孪生成为一种工具,帮助管理这些海量数据集,并提供更有效的数据探索和利用以及嵌入式关键上下文见解。
4.2 数字模型开发
从图像、基因组测序和癌症分期生成的大型数据集(其中一些在上一节中确定)的持续爆炸式增长,对开发可以使用数字孪生支持诊断和预后的模型构成了重大挑战(Jin 等人,2021 年)。所提供的方法包括涉及数字孪生模型开发的规划、实施、监控和评估(Lu 等人,2020 年)的关键步骤,其中所有关键利益相关者(包括临床医生、IT 专业人员和数据科学家)都参与其中。利益相关者可以在协同设计期间帮助分析数字孪生,以确定可行性和临床影响、数据的可用性以及与数据治理相关的任何问题(例如,队列的隐私和同意;卢等人,2020)。
数字模型开发过程的第一步是预处理数据并执行特征工程,例如过滤、去除缺失值、识别极值和异常值、数据平衡、转换和模型正则化以避免过度拟合(Bi 等人,2019 年;卡利丁迪,2020 年;刘等人,2017)。在特征工程之后,人工智能算法用于表征开发的知识(即数字模型)。例如,在子宫内膜癌诊断中,已经探索了聚类(Praiss 等人,2020 年)、深度学习(高桥等人,2021 年)和回归(Lees 等人,2021 年)等 ML 算法。
开发数字模型的最后一步涉及领域专家的严格质量保证。然后需要对数字模型进行持续改进,将来自物理世界的新信息和数据整合到数字模型中以提高其性能(Ellahham 等人,2020 年)。
数字世界和物理世界之间的双向交互使数字孪生能够帮助捕获和维护有关个人的数据(通过监控患者数据和行为),这与数字模型相结合,可以帮助了解特定个体的癌症演变。这可以帮助任何使用数字孪生的临床决策支持系统随着时间的推移变得更加个性化,并提高预测个人进展的精度。这种改进可以帮助评估患者的健康状况、延长预期寿命和降低医疗成本(Elayan 等人,2021 年),同时允许提供最适合个人的个性化建议。最近的研究表明,应用数字孪生来优化癌症治疗方案,使头颈癌的存活率提高了 3.73%(Tardini 等人,2021 年)。
4.3 增强的决策支持
数字孪生可以通过向医疗保健专业人员提供有价值的信息来帮助增强决策支持。如图1所示,数字孪生提供了癌症患者的数字表示。基于AI的数字模型可以分析来自数字孪生的数据。如前所述,这反过来可以使用数字孪生(即特定就诊患者的数字副本)实现实时场景模拟,用于患者的不同治疗和可能的护理途径,从而确定最适合患者的治疗以及最佳的生存结果。由此,医疗保健专业人员可以与就诊患者讨论选择、其相对优点和特定患者可能经历的并发症,然后他们可以一起更轻松地为特定呈现患者确定最佳护理途径;它还考虑了患者对生活质量与数量的个人观点。通过在人工智能背景下利用这三个关键驱动因素来开发数字孪生,可以改善癌症诊断、预后和治疗选择的分析和有效管理。这反过来又可以改善临床护理决策过程,以及护理质量、临床结果以及患者的体验和满意度(Ellahham 等人,2020 年;如何与陈,2020;妮西娅和伊兰戈,2017;瓦马特万等人,2019 年)。
医疗保健领域的 5 个数字孪生 - 后续步骤、障碍和促进因素
如前所述,医疗保健服务面临许多挑战,癌症护理尤其如此(Wickramasinghe,2019)。 将技术应用于医疗保健的重点和动机必须支持更好的可及性、质量和价值的医疗保健价值主张(Wickramasinghe,2010,2019)。 最重要的是,任何解决方案都必须以患者为中心(同上)。通过按照我们的建议将数字孪生概念化用于癌症护理,我们将这些重要方面放在首位;此外,我们还致力于解决健康和医学领域对人工智能在医疗保健中的应用的批评;也就是说,开发不透明的黑匣子型解决方案,也无法将患者置于中心位置。
在介绍该模型时,我们承认,除了主要优势外,包括根据每个患者的独特特征和偏好更快地确定最合适的治疗方法,该方法确实存在特定于医疗保健的挑战。从医疗保健的角度来看,主要挑战包括以下要求:
在开发数字孪生时收集和使用的数据是准确的,不会发生冲突。数据准确性的问题之一是完整性,如果在数字孪生中使用,可能会在预测中产生偏差。例如,在某些情况下,监测、流行病学和最终结果 (SEER) 数据集不包含有关手术前或手术后是否给予患者治疗的信息(SEER,N.D)。如果使用这种不完整的信息,那么它可能会影响对治疗建议的分析,因为对患者生存月数的估计是基于结合治疗和给予患者时间的知识(同上)。治疗数据的另一个问题是,它基于多种因素,不限于临床信息,例如患者接受治疗的偏好、其所在地区/国家的治疗可用性以及治疗费用。所有这些因素都没有在当前数据集中捕获(SEER,N.D.;詹姆斯等人,2009 年)。使用此类信息可能会为治疗建议创建不准确的数据。
临床专业知识和患者偏好得到正确平衡。目前的治疗方法没有充分考虑患者的偏好和结果(例如PROM;考夫曼和罗克,2021 年)。这为已经认知超负荷的临床决策过程增加了一层额外的复杂性。患者偏好的一个主要问题与生活质量和数量有关。在某些情况下,生活质量可能会随着生存期的延长而恶化,而一些患者更喜欢高质量的生活,同时认识到寿命可能会缩短。
真实世界的证据和来自随机临床试验的结果混合在一起。目前,最高证据治疗建议来自随机临床试验,这些试验对大量患者有足够的把握度,可以明确回答临床和统计学上与治疗比较相关的问题(Luthringer&Marziale,N.D)。这些研究的进行成本很高,需要很长时间的规划和执行,并且需要很长时间才能获得有效的结论。它们还需要当地、国家和国际治疗医生和医院之间的高度合作。他们通常有排除,例如年龄或显着的合并症,限制了它们对许多癌症患者的应用(Sherman 等人,2016 年)。真实世界的证据可能会有所帮助,特别是当医学和科学文献的初步研究不可用,癌症罕见且大型试验不可行时(Agarwala 等人,2018 年;谢尔曼等人,2016 年)。登记处和其他数据集的汇总导致为某些癌症(例如包含超过一百万患者的乳腺癌)及其相关临床信息建立了广泛的数据库(Cardoso 等人,2021 年;豪拉德等人,2021 年)。
在应对这些挑战方面,将数字孪生概念应用于癌症护理的关键方面与它在制造业中的广泛应用和使用方式有很大不同(例如,如图1中的汽车电池示例)。
在癌症护理中开发数字孪生也存在技术挑战,例如数据可用性、安全性以及与道德和负责任的人工智能相关的问题。它们探讨如下:
很少有公开可用的大型数据集可用于开发用于癌症管理的数字孪生,例如子宫内膜癌。因此,至关重要的是,必须进行主动的数据捕获和可用性,并加强对医疗保健专业人员的数据教育,以确保捕获大量高质量的数据,并使其可用于进一步开发可以提供更好的癌症护理的数字孪生。另一个关键挑战涉及数据链接和集成。从各种新兴数字医疗保健系统中捕获大量数据,并将其与不同类型的数据(例如心理社会数据、患者对治疗的偏好和患者报告的结果数据)集成,将有助于使用人工智能算法开发更准确的数字模型,这些算法可以帮助快速诊断、增强决策支持和癌症患者更好的个性化健康结果(国家癌症研究所, 2020)。
数据隐私和保护是医疗保健领域关注的一个关键问题,尽管使用某些形式的数据加密来管理数据传输。鉴于数字孪生依赖于新兴和多样化的数据源,例如来自医疗物联网设备、传感器和其他数字化医疗设备的数据,这种担忧显着增加。这些来源可能容易受到网络攻击,从而对患者隐私和数据完整性产生不利影响,导致人们担心,如果在数字孪生模型中使用这些数据来提出治疗建议,这些数据可能会被证明是有问题的。

扫一扫,关注我们