沃森的炒作:为什么人工智能还没有接管肿瘤学?
继IBM的人工智能(AI)程序沃森之后,一举成名在游戏节目中冒险!2011年,中国似乎在世界舞台上迈出了一步。
很快,沃森就确立了地位合作伙伴关系与美国政府退伍军人事务部、斯隆凯特林、梅奥诊所和克利夫兰诊所等著名医疗机构合作,将人工智能应用于癌症治疗。
然而,沃森随后进军肿瘤学领域却没有取得这样的成就顺利因为它的统治冒险!所做的。尽管近年来沃森已经变得越来越准确,但在癌症诊断中,错误的建议比错过问题的后果更严重冒险!因此,医疗机构和IBM之间的许多高调合作悄悄结束了。
为什么沃森惊人的计算能力在肿瘤学领域表现不佳?
归结起来,对沃森来说,赢得一个游戏节目和战胜癌症是非常不同的任务,而且沃森受到的训练也不同。
归结起来,赢得一个游戏节目和癌症诊断是非常不同的任务,所以沃森接受了不同的工具训练;结果,取得了不同程度的成功。
人工智能算法的数据训练
人工智能有两个组成部分:训练和推断。在部署人工智能程序进行决策(推理)之前,需要对其进行训练,以便在预测分析期间实现最小程度的错误。
训练一个人工智能程序类似于教一个学生。人工智能软件和学生都需要帮助来建立一个利用外部信息的思维系统,这样他们就可以在未来解决相同或类似的问题。
人工智能软件中设计了解决问题的方程协议,也称为算法。然后,在训练课程中,算法分析现有数据——就像学生从教科书中学习一样——来建立参数。这代表了人工智能可以在未来的分析中使用的思维过程。
IBM的沃森在《危险边缘》中获胜!在2012年。信贷:IBM
在监督训练中,算法使用完全标记的数据集。换句话说,输入(“问题”)和输出(“答案”)值之间存在明确的关系。在算法计算输入值后,它将得到即时和精确的反馈,即它的计算是否与输出匹配(“答案”)。通过这种方式,它可以快速调整,以增加下次得到正确答案的机会。
在无监督训练中,数据是没有标签的。因此,对于算法来说,学习参数之间的关系更具挑战性。在半监督学习中,只有部分数据被标记;因此,半监督学习的有效性介于监督学习和无监督学习之间。
不同的数据训练冒险!和肿瘤
当设置为任务时赢得冒险!或棋类游戏,如国际象棋,人工智能软件将搜索最有可能导致胜利的结果——国际象棋中的将死或围棋中的正确答案冒险!
这种AI游戏问题的训练是有监督的,因为数据集包含了大量以前的国际象棋比赛或对问答冒险!这些数据集被完全标记,输入和结果之间有明确的关系。
另一方面,完全标记的数据集对于肿瘤学沃森的训练是不可行的。由于许多实验室结果都是定量分析的,而人工智能在处理和分析图像扫描方面表现出色,因此在诊断方面训练沃森相对简单。一个2018年的论文在肿瘤学家报道称,沃森在处理清晰、明确的任务(如诊断)时能够达到很高的准确性。
然而,用病人的非结构化、简短且通常是主观的信息来训练沃森要困难得多,比如医生的笔记和出院总结,这些信息占病人记录的近80%。
冒险!和肿瘤学是不同的任务
与冒险!,沃森有一个完美的场景。问答格式是明确的。沃森接受了同样风格的测试问题的训练和测试。因此,收集和准备用于分析的数据是相对简单的。沃森所需要的只是强大的计算能力来处理大量数据并确定最有可能的答案。
另一方面,肿瘤学包含更多的复杂性。事实上,肿瘤学是几个问题的结合体:诊断,从以前的期刊出版物中剔除信息,分析非结构化的患者信息。虽然人工智能可以很好地分析实验室结果中的定量数据,但它还不具备分析上下文和细微差别丰富的文本的能力。
几乎每一篇期刊文章和医生的证明都是由不同的作者写的,每一篇文章都有不同的术语和速记。在一篇十页的密集的期刊文章中,分析出不同成分(基因突变、症状、信号通路等)之间的内容和关系,比剖析一句话要复杂得多冒险!的问题。人们发现,在论文中提出的多个观点中,在特定的语境中找出哪个是最重要的相对容易;相比之下,像沃森这样的人工智能就不能轻易地捕捉到这种细微差别。
同样,医生的病历中经常包含不完整的信息和细节,字迹模糊或没有按照时间顺序组织。人类可以决定在特定环境下哪个细节更重要,但人工智能只能根据定义好的协议工作;因此,这些系统不能灵活地在一篇论文中权衡一种类型的细节与其他类型的细节,而在下一篇论文中则相反。
此外,还有工程师们所说的“未知的未知”,这可能会引入偏差,在你意识不到的情况下影响你的分析。在这里,未知的未知可能是机制、基因、途径或与癌症的相互作用,它们与癌症的联系尚未被确定。虽然这些也给人类带来了问题,但我们的大脑在评估未知未知的重要性时更加灵活。然而,在没有事先指示的情况下,人工智能在评估这些变量时效率较低。最后,如果医生有偏见,那么沃森将通过训练他们的笔记来继承他们的偏见;这种偏差可能会影响诊断的准确性。
因此,从期刊文章和医生的笔记中收集和准备数据进行分析将是一件混乱的事情。相同的肿瘤学家纸显示了沃森在诊断方面的熟练程度,还发现沃森在依赖时间的复杂建议(如治疗时间表)方面得分很低。此外,沃森在评估不同类型的癌症时表现不一致更好的在某些类型上比其他类型更重要。
沃森在医学上做得很好
像沃森这样的人工智能系统仍然可以在医学上有广泛的应用。人工智能或人工智能驱动的机器人擅长执行具有明确步骤的重复性任务,例如简单的眼睛或头发常规手术,x光片或其他扫描分析,在办公室访问间隙检查患者以及处理行政账单或索赔。
沃森还成功分析了基因信息等清晰、结构化的数据。例如,北卡罗莱纳大学最近发表了一篇关于沃森有效性的论文基因组学.在一项研究中,沃森能够识别出以前未识别的突变,这对治疗建议很重要。
前进
目前,人工智能已经在制造业领域得到广泛应用。通过接管那些重复、乏味和危险的任务,人工智能让人类去解决更复杂、更微妙的问题。通过这种方式,人工智能和人类可以并肩工作,以实现更高的效率和更低的不准确性。
同样的教训也适用于医疗保健,人工智能承担了更琐碎的任务,让人类来处理模棱两可和复杂的问题。
与此同时,用新数据(如涉及的新基因、途径和生物标记物)不断重新训练算法,可能会加强人工智能的学习并提高其准确性。