一项最新的研究发现,用于协助医生治疗精神分裂症患者的计算机算法在处理之前未见过的新鲜数据时表现不佳。这一发现揭示了医用人工智能在评估未曾接触过的患者治疗效果时可能面临的挑战。
背景
这些医用工具使用人工智能技术来分析大数据集中的特征,预测个体对特定治疗的反应,这被认为是精准医疗的核心。医疗保健专业人员希望通过这些工具为每位患者量身定制治疗方案,提高治疗的有效性。

在一项发表在《科学》杂志上的研究中,研究人员指出,人工智能模型在预测训练样本中涉及患者的治疗结果时表现高度准确。然而,当面临未见过的患者数据时,模型的性能显著下降,甚至可能只比随机猜测略高。
研究方法
研究人员评估了一种通常用于精神病预测模型的算法,使用了五项抗精神病药物临床试验的数据,涉及来自北美、亚洲、欧洲和非洲的1513名被诊断患有精神分裂症的志愿者。这些试验在2004年至2009年间进行,测量了志愿者在服用抗精神病药物之前和四周后的症状。
研究团队首先在开发算法的试验中测试了算法的准确性,然后使用多种方法评估了该算法在新数据上的分析准确性。
结果和讨论
研究发现,人工智能模型在处理未经训练的数据集时表现不佳,预测似乎几乎是随机的。研究团队强调,为确保精准医疗的有效性,预测模型需要在不同情况下保持稳定准确性,并降低偏差或随机结果的可能性。
合著者之一、康涅狄格州纽黑文耶鲁大学精神病学家亚当·切克鲁德表示,这一研究突显了算法仍需在多个样本上进行严格测试的重要性。他呼吁更像研发药物那样思考模型开发,强调模型的开发和测试过程需要遵循严格的原则,不能仅仅进行一次测试就认为模型是可靠的。
这项研究为精准医疗领域提供了有益的洞见,为今后改进和发展医用人工智能算法提供了重要的指导。
暂无评论...