ChatGPT提高材料科学的效率
人工智能开发商OpenAI承诺,将通过其名为ChatGPT的新型聊天机器人重塑人们的工作和学习方式。事实上,在威斯康星大学麦迪逊分校,这种大型语言模型已经在帮助材料工程师们利用它的力量,快速、经济地从科学文献中提取信息。
几年来,威斯康星大学麦迪逊分校材料科学与工程教授戴恩·摩根(Dane Morgan)在他的实验室中使用机器学习(一种基于数据的人工智能)来评估和寻找新型材料,并取得了巨大成功。与摩根密切合作的科学家马西耶·波拉克(Maciej Polak)对人工智能可能帮助完成的其他任务进行了头脑风暴。
Polak说:“人工智能可以越来越多地帮助完成相当复杂和耗时的任务。“我们想,‘什么是材料科学家经常做的事情,我们希望我们有更多的时间?’关键的一点是阅读论文来获取数据。”
Polak说,材料科学家经常下载,然后梳理冗长的研究论文,寻找一小组数字添加到他们的数据集中。
Polak说:“我们认为我们可以把所有这些耗时的任务都交给人工智能,它可以为我们阅读这些论文,并为我们提供信息。”
要求聊天机器人,即使是像ChatGPT这样强大的聊天机器人,仅仅从论文全文中寻找和提取数据,仍然超出了它们的能力范围。因此,Polak改进了这项技术,要求机器人一个句子一个句子地检查,并决定每个句子是否包含相关数据——这项任务是将论文浓缩为一两个关键句子。然后,他要求机器人以表格的形式呈现信息,然后人类研究人员可以检查表格和句子,以确保它们是正确和相关的。这项技术产生了大约90%的准确率,使研究人员能够从一组论文中提取数据,以创建一个关于金属玻璃临界冷却速率的数据库。
2023年2月,Polak、Morgan及其同事在arXiv预印本服务器上发表了一篇关于该技术的论文。
虽然这项技术将研究人员的论文阅读工作量减少了约99%,但波拉克对进一步改进它很感兴趣。
想要更多突发新闻吗?
订阅188金宝搏备用每日时事通讯,每天将突发科学新闻直接发送到您的收件箱。
免费订阅他说:“我是那个还在做最后一个手工步骤的人——检查表格的准确性。”“所以,我想找到一种方法,让这个过程完全自动化。”
为了达到这一点,团队进行了“即时”工程——找出准确的问题和顺序,让机器人提取出他们想要的信息,然后再次检查。他们将最初的方法应用于提取数据表,然后向机器人提出一系列后续问题,以引入数据集错误的可能性。这迫使AI返回,重新检查数据并标记错误。在绝大多数情况下,人工智能能够识别错误信息。
“这是最重要的事情;它可以承认自己犯了错误,”波拉克说。“也许它不知道如何解决这个问题,但至少我们没有得到与事实不符的信息。”
该团队于2023年3月在arXiv上发表了关于该技术迭代的另一篇论文。
Morgan说,这种使用ChatGPT和其他大型语言模型的提示工程一开始感觉很不寻常。
“这不是传统意义上的编程;与这些机器人互动的方法是通过语言,”摩根说。“让程序提取数据,然后让它检查它是否确定正常的句子,感觉更像是我训练孩子们得到正确答案的方式,而不是我通常训练计算机的方式。”这是一种让电脑做事的不同方式。它真的改变了你对电脑功能的看法。”
波拉克说,重要的是,这项技术不需要太多的努力或深入的知识。
Polak说:“以前,人们必须编写数百行代码来做这样的事情,而且结果往往不是很好。”“现在我们有了像ChatGPT这样的工具,在功能上有了巨大的进步。”
摩根很快指出,将人工智能融入研究并不能取代研究生和科学家。相反,这些工具可以让研究人员从事他们以前没有时间、金钱或人力进行的项目。
摩根说:“我认为这些工具将改变我们做研究的方式,就像b谷歌改变了我们做研究的方式一样。”“今天,我们通常通过b谷歌和其他搜索工具来探索一个领域,帮助我们找到论文和相关资源,然后我们阅读这些论文和资源来提取信息和数据。现在,你可以进入这些大型语言模型之一,围绕一个主题收集信息,并使用我们一直在开发的技术,在几个小时内建立一个数据库进行审查。”
参考:Polak MP, Morgan D.从会话语言模型和提示工程的研究论文中提取准确的材料数据——ChatGPT的例子。arXiv.2023年3月7日在线发布。doi:10.48550 / arXiv.2303.05352
这篇文章是根据以下内容重新发表的材料.注:材料可能因长度和内容而被编辑。欲了解更多信息,请与引用的来源联系。
这篇文章是基于尚未经过同行评审的研究结果。因此,结果被视为初步的,并应如此解释。了解同行评议过程在研究中的作用在这里.欲了解更多信息,请与引用的来源联系。