大麻基因组图谱击败人类基因组计划基准
2011年,医学基因组学成为第一家对大麻基因组进行测序的公司.当时医学基因组公司的首席执行官,凯文·麦克南说他的灵感来自于他的几个朋友,他们被诊断出患有癌症药用大麻研究进展.麦克尔南认为,对大麻基因组的完整测序和开放获取的出版,可以使植物材料本身是非法的国家的研究人员研究这种药物,创造更广泛的知识库可以加速新型大麻疗法的发展。
基因组图谱记录
虽然麦克尔南的公司确实通过对大麻的基因组进行测序创造了历史,但由于当时研究人员可用的测序设备,大麻基因组达不到人类基因组计划(HGP)设定的标准。十年前.这些标准通常被报道为基因组的N50,这是一组序列平均长度的统计表达。例如,HGP报告的N50为500kb,这意味着HGP序列中50%的基因组片段长度超过500,000个碱基对。
到目前为止,大麻科学研究人员在试图将大麻基因组测序到相同的细节水平时,还无法达到这个500kb N50标准。2018年8月初,医药基因组公司和他们的财务支持者达什宣布他们成功地对大麻基因组进行了640kb N50测序,比HGP标准提高了28%。使用在太平洋生物科学医学基因组学团队预测,1Mb的N50可以在一年内实现。
为什么基因组片段长度很重要?
当涉及到准确分析存储在基因组中的信息时,拥有更长的DNA序列是非常有用的。在接受达什公共新闻服务的采访时,Dash Force新闻, McKernan阐述了相邻性对准确解读的重要性。
“想象一下,你试图读一本章节都被打乱的书。你可以做很多错误的叙述。举个例子:“The”,“their”,“The IRS”。三种完全不同的意思。扩展到段落和章节,这是一个大问题。我们曾经拥有足够连续的基因组,可以组成2-3000个字母单词,但现在我们可以拥有64万个章节。”
当涉及到处理基因组多态性时,能够在这些长“章节”中阅读大麻基因组是非常有用的。由于旧的基因组测序技术无法实现如此大的N50,基因组中多态性的数量是基因组测序难度的主要因素。在人类中,你会发现多态性率为千分之一,但在大麻基因组中,这个数量级更大,多态性率为百分之一,这就解释了大麻测序的巨大难度差距。多态基因基破坏了预期来自母亲和父亲基因组的正常基因序列,因此影响了计算机系统从重建中识别正确模式的容易程度。具有更大N50的大麻序列的创建最小化了多态基因的统计效应,使计算机更容易解析和重建大麻基因组。
实验室外的影响
随着大麻测序准确性的提高,潜在应用的数量也在增加。最初的任务是让大麻研究更容易获得,现在可能也会改革大麻品种获得专利的方式。这种改进的测序所达到的精确度可能使大麻育种者在获得菌株专利的过程中更容易证明他们已经生产出了独特的菌株。使用这种更准确的分析来对抗不公正颁发的专利,这种专利是通过对小规模大麻育种者培育的菌株进行测序来获得的,这些菌株早于现有的既定专利。基因组测序可以提供一种明确证明两种菌株是否相似到足以挑战专利的方法。
这种创业支持是Dash的一个关键目标,他们的目标是彻底改变当前的科学出版市场通过使用他们的加密货币平台来创建一个加密激励和加密记录的同行评审系统。通过使用加密激励模型,希望拥有良好声誉的审稿人能够比目前的科学出版模型获得更公平的工作报酬。该加密记录系统将确保与大麻基因组相关的研究数据在未来几年保留在公共档案中数据衰减的风险.