五个步骤需要把AI炒作在生命科学变成现实
过去18个月已经看到不可思议的研发突破了在可行的COVID-19疫苗和治疗。能够使这些收益在这样的速度和规模很大程度上的应用数据,新旧。信使rna COVID-19疫苗的发展,例如,在很大程度上吸引了数据和知识从现有研究艾滋病毒。这种日益增长的依赖数据驱动的采用人工智能(AI)在生命科学领域。一个GlobalData报告预计,2021年,人工智能将整个制药行业“最颠覆性技术。”
毫无疑问,AI的使用减少了处理数据的时间,加快研发。但是有一个警告的声音。尽管可以理解的兴奋,大多数科学家在研究函数仍然是消费几乎有一半的时间“争吵”数据。虽然这是一个改善前几年,这一数字接近80%,它仍然是一个很多的时间和精力花在数据准备而不是揭示数据的见解。
尤其如此庞大而复杂的研究组织。在这些组织研发功能显然有更多的数据可能是孤立的和有组织的。他们可能也缺乏灵活敏捷,精通技术初创企业诞生在云中,谁擅长AI。所以,如何研发领导人AI的巨大潜力变成现实的成功?这里有五个方法来解锁AI的价值。
- 确保特定领域的专业知识:通用、广谱AI平台不会丰富数据充分或交付结果的精度要求在生命科学研发。IBM华生的失败尝试医疗保健是一个警醒的这个事实。而先进的ML模式存在于公共领域(例如,伯特,BioBERT,艾尔摩,Word2vec),他们不解决实际用例和通常需要特定于域的优化训练,验证和解释阶段。特定领域的AI由领域专家使用复杂的模型,包括命名实体识别(尼珥)提取、语义关系和基于语义结构的问答。这种特异性是至关重要的,例如,当从大量的非结构化的科学文献检索信息。
- 拥抱的噪音:多数据,尤其是历史数据,检索混乱、复杂和困难。但这些数据太有价值的被丢弃或忽略。组织需要能够捕获、过滤、标签和我的速度,这样就可以将现有的数据协调与新的研究和机器可读的。据估计,80%企业数据通常是在非结构化的文本如Word文档和pdf文档。这也是真正的外部数据源,如专利,临床笔记和文献数据库。特定领域的人工智能,适用于精确本体有助于组织拥抱“噪音”,把它变成见解。
- 把真实的证据:现实世界的证据(RWE)是非常有益的在生命科学和公共卫生。我们见过在行动与COVID-19症状研究中应用佐伊实时跟踪的症状。监控通过COVID-19疫苗的副作用NHS的黄牌应用也添加到池中现实世界的知识。另一个新兴的RWE来源包括论坛等社交媒体。讨论组患者患有特定疾病设立的可以保存有价值的现实世界和实时的见解和上下文。我们正开始看到现在这样的数据纳入人工智能模型。
- 嵌入数据标准:行业标准数据将大大有助于成功的人工智能项目。公平原则——可发现的数据,访问,可互操作、可重用——是关键。当数据集在整个企业范围内“FAIR-ified”,他们可以采取迅速和应用于新的问题或人工智能模型,而不需要一个广泛的数据清理。此外,研发不仅是一个内部过程。生命科学公司需要数据来自第三方,合同研究组织(cro)需像PubMed公共数据来源。通过嵌入公平原则和生态系统内鼓励其他人来做同样的事情,协作、数据共享和重用是由更简单。
- 保持人类的中心:最后,重要的是不要忘记生命科学组织人类的价值在任何人工智能任务。虽然我们生活在一个时代的快速技术创新和计算能力,研究人员的见解仍是不可或缺的。人类推理和细微差别是至关重要的在发现异常,识别模式,得出合理的结论,解释结果准确、训练模型成功的几率高。推进我们对疾病的理解和实现突破最终将共同努力,在人工智能增强人类研究人员的技能。
AI将发挥至关重要的作用在生命科学研发的未来。我们已经看到了AI帮助整个大流行——例如,迈出一大步筛选大量的批准药物对COVID-19那些潜在的治疗用途。然而,今天的现实是,生命科学才刚刚抓表面的AI,除了人类的聪明才智,能做什么。研发领导成熟的人工智能方法,按照上面的步骤,我们将实现更快的好处——帮助推进我们对疾病的理解,加快速度至关重要的治疗病人。
广告