开源机器学习帮助对抗癌症
这是一个开放的邀请去偷。出癌症战士和诱惑他们的新项目,预计抗癌药物有效性通过机器学习和原始的基因数据。
研究人员建立了程序在乔治亚理工学院希望癌症战士把它免费,或者只是滑动部分的编程代码,所以他们已经开源了。他们希望吸引一群研究人员也将分享他们自己的癌症和计算机专业知识和数据来改进程序一起,拯救更多的生命。
研究人员邀请他们的代码也是一个挑战。
他们挑战别人来打败他们在他们自己的游戏,帮助磨练一个强大的软件工具为了更大的利益。不仅劳动成果仍将公开访问病人最好的治疗中获益。
“我们不想把自己的代码或数据或盈利,”约翰·麦克唐纳说,佐治亚理工学院的综合癌症研究中心的主任。“我们想让这个开放所以它会传播。”
货物
研究人员想要参与可以开始一项新的研究通过阅读软件10月26日,2017年发表在《华尔街日报》《公共科学图书馆•综合》。他们会发现链接下载软件从GitHub和访问的代码。
他们会从一个当前程序,已约85%准确评估治疗效果的九个药物在273名癌症患者的基因数据。这项研究由麦当劳和合作者弗雷德里克·Vannberg细节如何以及为什么。
“九药物在发表的研究中,但我们实际运行约120药物通过项目总,”Vannberg说,乔治亚理工学院的助理教授生物科学。
程序使用证明机器学习机制也使数据规范化。后者允许机器学习与来自不同数据源的数据,使其兼容。
偏差
研究人员减少了人类的偏见哪些数据是重要的预测结果。
“这是更有效的投入大量的原始数据,让算法排序出来,”麦克唐纳说。“这是寻找关联,没有原因,这是不好的预选你怀疑是什么最相关的数据。”
一大偏差研究人员扔掉是只集中于基因表达数据与特定类型的癌症治疗他们的目标。
“事实证明,最好给癌症的程序数据从一个广泛的多样性,这实际上会给一个更好的预测药物有效性为一个特定的癌症如乳腺癌,”Vannberg说。
“在分子水平上,一些乳腺癌,例如,会更类似于一些比其他乳腺癌,卵巢癌”麦克唐纳说。“我们只是让算法处理一切,我们得到精度高。”
获奖者
研究人员也希望项目池大量的匿名病人的治疗成功与失败数据,这将有助于程序优化预测所有人的利益。但这并不意味着一些公司不会受益,。
“如果一个公司出现,使利润在使用程序来帮助病人,这很好,并没有义务给回项目,”麦克唐纳说,世卫组织还在乔治亚理工大学生物科学学院的教授。“其他人可能只是如果他们所以请。”
但是希望,大多数玩家会仁慈的精神。
“与我们的项目,我们广告共享应该是什么人,”Vannberg说。“这可能是一个对每个人都赢了,但实际上这是一个赢的癌症患者。”
这篇文章被转载材料所提供的乔治亚理工学院的技术。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。