目前的统计模型过于简单。他们没有在人们之间捕捉复杂的生物变化,把他们当作噪音来丢弃。我们怀疑这可能在一定程度上解释了为什么这么多的药物试验在简单的动物身上起作用,但在人类复杂的大脑中却失败了。如果这样,机器学习能够模拟人类大脑的全部复杂性,可能会发现治疗效果,否则将会被遗漏,”该研究的主要作者,Parashkev Nachev博士(UCL神经病学研究所)说。
为了验证这一概念,研究小组对中风患者的大规模数据进行了研究,提取了每个病人中风所引起的脑损伤的复杂解剖模式,并在此过程中建立了有史以来最大规模的脑卒中的解剖学注册图像。作为中风影响的指标,他们使用凝视的方向,客观地从眼睛上测量,就像在医院入院时的头部CT扫描一样,而MRI扫描通常在1 - 3天后进行。
然后,他们模拟了一组假设药物的大规模荟萃分析,以确定常规统计分析所遗漏的不同震级的治疗效果是否可以通过机器学习来识别。例如,考虑到一种药物治疗能使脑损伤降低70%,他们通过使用传统的(低维度)统计测试和使用高维机器学习方法测试了显着效果。
这种机器学习技术考虑到整个大脑的损伤,将中风视为一种复杂的“指纹”,由多种变量描述。
“中风试验倾向于使用相对较少的,粗糙的变量,例如病变的大小,忽略病变是否集中在关键区域或边缘。”我们的算法学习了整个大脑的损伤模式,在高解剖分辨率下使用了数千个变量。通过阐明解剖学和临床结果之间的复杂关系,它使我们能够发现比传统技术更敏感的治疗效果,”该研究的第一作者,天博徐(UCL神经病学研究所)解释道。
这种机器学习方法的优点是在考虑降低病灶体积的干预措施时尤为突出。在常规的低维度模型中,干预需要将病变的体积缩小78.4%,以便在临床试验中检测到效果。而高维模型在病灶缩小仅55%的情况下,更有可能检测到效果。
“传统的统计模型将会忽略一种效果,即使这种药物通常会使病灶的大小减少一半,甚至更多,仅仅是因为大脑功能解剖学的复杂性——当没有考虑到的情况下——在测量的临床结果中引入了如此多的个体差异。”然而,即使它对行为没有明显的影响,但挽救50%受影响的大脑区域也是有意义的。没有多余的大脑,”Nachev博士说。
研究人员说,他们的研究结果表明,机器学习对医学科学来说是无价的,尤其是当研究中的系统——比如大脑——非常复杂的时候。
“机器学习的真正价值并不在于自动化我们认为容易做到的事情,而是将非常复杂的决定正式化。”机器学习可以结合临床医生的直觉灵活性和驱动循证医学的统计数据。将10世纪的变量组合在一起的模型仍然可以是严格的和数学上的。我们现在可以精确地捕捉到解剖学和结果之间的复杂关系,”纳切夫博士说。
“我们希望研究人员和临床医生在下次需要进行临床试验时,开始使用我们的方法,”合着者Geraint Rees教授(UCL生命科学学院院长)说。