1001年拟南芥基因组的努力用磨刀石磨组装、注释、分析策略来捕获的多样性
2011年8月30日
安德里亚•安德森——通过基因组Web
研究团队隶属于1001年国际拟南芥基因组项目依靠精心挑选株拟南芥全基因组重排序——RNA序列相结合,局部新创大会,re-annotation,在某些情况下对模型处理植物的遗传多样性和地理。
超越“这是非常重要的目录变异和试图解释那些东西做什么相对于参考,”资深作者理查德•莫特生物信息学和统计学研究员威康信托中心牛津大学人类遗传学在序列。
本周公布的两项新研究,包括一个由莫特和他的同事们,也正在增加对拟南芥基因组数,移动人员有点接近1001个拟南芥基因组测序的目标(10/7/08)。
在他们的研究中,出现在本周自然,莫特和他的同事从英国、德国和美国的测序,组装和注释的基因组18 a芥到达已知世界范围内的分布和范围的表型特征。RNA-sequencing数据生成的幼苗从这些登记入册不仅提供了在植物基因表达的信息,但也帮助验证编码单核苷酸多态性,注释基因组,识别位点,影响拟南芥的基因表达。
“使用基因组,幼苗转录组,计算基因特征预测我们祖先,多态性基因内容,并登记入册的表达谱,”研究人员写道。“我们发现,功能多态性的后果往往难以解释没有基因re-annotation和完整的序列数据。”
莫特和他的合作者之间生成每个基因组的大约27和63次报道,使用Illumina公司基因组序列分析仪平台200年-碱基对和400 -碱基对库的压力。
一般来说,每一个新的基因组是一个百分之二小于1.19亿基地Col-0参考基因组,代表加入一个被称为哥伦比亚2000年测序。
哥伦比亚加入和18到达测序自然研究的交叉使超过700拟南芥行Multiparent先进一代杂交,或者魔法,收集、莫特解释说,和分析的亲代菌株有望帮助魔术在未来后代解释数据。
团队的分析发现120万插入和删除,以及数以百万计的新基因组snp。相比Col-0参考,每个加入测试包含497668至789187种单碱基变异。其中,约100000个snp应变出现在编码序列也被审问的RNA-sequencing幼苗组织。