遗传变异的宝库
一个研究小组从英国和美国最近宣布一个巨大项目的完成来支持建立改良小麦品种。他们一起产生一个资源使开放一千万突变的面包和面条小麦品种。
这项研究已经支持几个成功的故事。使用这种突变数据已经允许科学家和育种者产生改良小麦品种与更大的谷物和更高的营养价值。然而,这项研究并不是没有挑战,需要一些令人难以置信的新技术和方法的发展为了最后打开小麦基因组。
了解更多关于这项研究本身,我跟博士Ksenia Krasileva,组长厄理工学院和Sainsbury实验室。
JR:阻碍了人员编制这样一个全面的数据库对小麦突变直到现在?为什么这样一个复杂的植物在遗传水平上解开呢?
乐:小麦基因组17 Gb,这是人类基因组的5倍。添加到这个数量的遗传物质的挑战,小麦有100000个基因只占1 - 2%的基因组。的重大突破是我们发展小麦基因外显子组捕获——解码的能力只是空间在每个工厂成本效益,因此允许我们序列2700行组成的资源。
JR:为什么它是重要的,这个新数据可用在一个公共数据库?在哪里能找到它,以及它如何能被利用吗?
乐:公共数据的可用性和种子可以确保每个人都有获得它,从每个国家的研究人员,育种者和行业在世界各地,包括在发展中国家。这扩大了使用资源,将加速小麦的研究和繁殖。资源是在网上wheat-tilling.com和dubcovskylab.ucdavis.edu/wheat-tilling
JR:这个项目涉及的4000亿个DNA碱基进行了排序从2735年小麦突变体线。你怎么处理和处理所有数据?这必须提出了巨大的挑战?
乐:数据处理高性能计算(HPC)环境中厄理工学院,加州大学戴维斯分校。HPC系统被用来测序读映射到为2700个人小麦小麦基因组参考线。这一步需要24至48小时运行每个示例使用8 cpu和需要60 GB RAM。在第二步中,突变被称为使用HPC集群。这个步骤可以并行和分布式跨集群在2000年个人任务花了几小时每个cpu运行使用4和7 GB /任务。总而言之,我们花了数年才产生和处理数据。如果我们重新分析今天使用最现代的计算,我们仍然会花费几个月。
JR:专业知识所做的每一个合作者提供让这个项目成功?
乐:这是一个真正的合作项目在四个机构:加州大学戴维斯分校,厄勒姆学院,约翰英纳斯中心和洛桑。最初的小麦数量是在加州大学戴维斯分校和洛桑,标准件,也由JIC。厄生成戴维斯测序数据和另一个一半的一半。所有机构参与数据分析。就我个人而言,我参与了这个项目自2011年以来第一次在加州大学戴维斯分校的博士后农业部研究员和过去两年在厄勒作为组长。极大地促成了项目的成功是开放数据和分析,共享所有的工具和参与的所有项目的机构从一开始。
Ksenia博士Krasileva杰克拉德说,高级编辑技术网络。188金宝搏备用