加速生物图像分析的技术将改进HTS技术
这项新技术有望对当今高通量生物筛选方法(如用于药物发现的方法)产生的显微图像进行更高精度的分析,并帮助破译人类组织的复杂结构。
研究人员说,准确性的提高可以减少这些筛选方法所需的成本和时间,使以前需要大量资源的新型实验成为可能,还可能发现有趣但微妙的异常现象,否则不会被发现。这项技术也将适用于生物学以外的领域,因为它提高了信念传播算法的效率,这是一种广泛使用的方法,用于得出关于互联网络的结论。
计算机科学学院机器学习系副教授杰弗里·戈登(Geoffrey Gordon)说:“目前用于检测细胞培养的自动筛选系统只观察单个细胞,没有充分考虑相邻细胞之间的关系。”“这在很大程度上是因为用现有的方法同时检查许多细胞需要不切实际的计算时间。”
他补充说,在许多情况下,计算机视觉系统已被证明能够区分人类难以察觉的模式。然而,即使是自动化系统也可能混淆两个相似的模式,这种混淆可以通过考虑相邻的单元来解决。
戈登和他的同事,生物医学工程专业的学生陈山庆和计算生物学家罗伯特·f·墨菲,通过提高信念传播算法的效率,能够将他们的关注点从单个细胞扩展到多个细胞。该算法已成为研究人员的主力,因为它使计算机能够通过利用多个信息源对一组数据进行推断。例如,对于生物标本,它可以用来推断图像的哪些部分是单个细胞,或者确定每个细胞内特定蛋白质的分布是否异常。
但是随着变量数量的增加,信念传播算法会变得笨拙,需要大量不切实际的计算时间来解决这些问题。
信念传播算法假设邻居——无论是单元格还是文本比特——都对彼此有影响。因此,该算法将用于推理的每个证据表示为相互连接的网络中的一个节点,并在节点之间交换消息。卡内基梅隆大学的研究人员发现了生成这些信息的捷径,这大大提高了整个网络的速度。
Lane计算生物学中心主任Murphy说,这项技术可以在许多应用中提高信念传播算法的性能,包括文本分析、Web分析和医疗诊断。在这篇论文中,研究人员将他们的技术应用于分析HeLa细胞内的蛋白质模式。他们发现这项技术将分析速度提高了几个数量级。
Murphy说,在用于药物发现和其他研究的高通量筛选过程中,每天需要分析数万个孔——每个孔包含数十或数百个细胞。他补充说,如果没有这项新研究中实现的这种加速,那么在如此多的井中对细胞关系进行自动化分析是不可能的。
原文:陈等机器学习研究9 (4),2008