TargetP
开发了一种基于神经网络的工具TargetP,用于新识别蛋白质的大规模亚细胞定位预测。仅使用n端序列信息,它可以区分用于线粒体、叶绿体、分泌途径和“其他”定位的蛋白质,在冗余减少的测试集上成功率为85%(植物)或90%(非植物)。通过对最近测序的拟南芥2号和4号染色体以及智人系(Ensembl Homo sapiens)蛋白质组的TargetP分析,我们估计所有植物蛋白质的10%是线粒体蛋白,14%是叶绿体蛋白,而分泌蛋白的丰度在拟南芥和智人中都在10%左右。TargetP还可以预测卵裂位点,其正确预测位点的水平从大约40% - 50%(叶绿体和线粒体前序列)到70%以上(分泌信号肽)。
广告