科学家在法医指纹分析自动化的关键一步
第一个重大案件涉及指纹证据的谋杀案是在美国托马斯·詹宁斯1911年在芝加哥。詹宁斯闯入一个家在半夜,当发现了房主,击毙了那个男人。他被判在犯罪现场留下指纹的基础上,下一个世纪的大部分时间里,指纹被认为,在法庭上和在公众的想象中,所有但可靠的识别方法。
然而,最近研究表明,指纹检查可以产生错误的结果。例如,美国国家科学院的一份2009年的报告发现,结果,“从考官,考官不一定是可重复的,”甚至有经验的考官可能会不同意自己的过去的结论当他们重新审视同一个印刷在稍后的日期。这些情况会导致无辜的人们被错误指控和罪犯剩余的自由更多的犯罪。
但科学家一直在努力减少人为错误的机会。本周,科学家们从国家标准和技术研究院(NIST)和密歇根州立大学报告说,他们已经开发出一种算法,指纹分析过程自动化的一个关键步骤。
“我们知道,当人类分析犯罪现场的指纹,这个过程本身是主观的,“说Elham Tabassi, NIST的电脑工程师,该研究的作者之一。“通过减少人类的主观性,我们可以进行指纹分析更可靠、更高效。”
一个关键的决策点
如果指纹都是高质量的,匹配他们的微风。例如,电脑可以很容易地匹配两套卷印刷收集受控条件下,当你滚的十个手指在指纹卡或扫描仪。
“但是在犯罪现场,没有人指导罪犯如何留下好印,“阿尼尔Jain说,密歇根州立大学的计算机科学家,该研究的作者之一。因此,指纹遗留在犯罪scene-so-called潜在的足迹被经常偏,扭曲和褪色。同样,如果打印上是有混淆背景模式如一张20美元的钞票,它可能很难单独的打印背景。
这就是为什么当一个考官接收潜在打印从犯罪现场,他们的第一步是判断他们包含多少有用的信息。
“这第一步是标准做法在法医社区,”Jain说。“这是我们自动化的步骤。”
这一步后,如果打印包含足够的有用的信息,它可以提交一个自动指纹识别系统。AFIS(发音AY-fiss)然后搜索数据库,并返回一个列表的潜在的匹配,而考官评价寻找一场决定性的比赛。
但最初的决定指纹质量是至关重要的。
“如果你提交一份打印AFIS没有足够的信息,你更有可能得到错误的匹配,“Tabassi说。另一方面,“如果你不提交一份打印,实际上确实有足够的信息,犯罪者会摆脱困境。”
目前,打印质量是主观的判断,和不同的考官得出不同的结论。自动化这一步使得结果一致。“这意味着我们将能够研究错误,找到方法来解决这些问题随着时间的推移,“Tabassi说。
自动化这一步也将允许指纹过程更有效的证据。这将允许他们减少积压,更快地解决犯罪问题,花更多的时间在具有挑战性的打印,需要更多的工作。
训练算法
研究人员使用机器学习来构建他们的算法。与传统编程为电脑你写出明确指令,在机器学习,你训练计算机识别模式通过展示它的例子。
培训的例子,研究人员已31指纹专家分析100潜在的打印,得分的每个规模质量1 - 5所示。这些照片和他们的分数被用来训练算法来确定一个潜在的打印包含多少信息。
培训完成后,研究人员对算法的性能进行了测试,它得分一系列新的潜在的打印。然后提交这些得分打印AFIS软件连接到一个数据库超过250000卷打印。所有隐藏指纹匹配的数据库,他们要求AFIS找到它。
这个测试场景中不同于真实的生活环境调查,因为在这个测试中,研究人员知道正确的匹配为每一个潜在的打印。如果评分算法正确工作,那么AFIS发现正确匹配的能力应与质量分数。换句话说,打印得分低质量应该更可能产生错误的结果,为什么它是如此重要的不是无意中提交低——在现实案例和打印质量打印AFIS得分作为高质量应该更容易生成正确的匹配。
根据这个指标,评分算法表现略好于平均水平的人类考官参与这项研究。
是什么让这个突破,在机器学习和计算机视觉的最新进展,是一个大型数据集的可用性的潜在的打印。机器学习算法需要大型数据集进行训练和测试,直到现在,大型数据集的潜指纹没有可用的人员,很大程度上是由于隐私问题。在这种情况下,密西根州警察为研究人员提供了测试数据集,首先剥离后数据的识别信息。
研究人员下一步是使用一个更大的数据集。这将允许他们提高算法的性能和更准确地测量它的错误率。
“我们运行我们的算法对数据库250000打印,但是我们需要对数百万运行它,“Tabassi说。“这样的算法必须是非常可靠的,因为生命和自由受到威胁。”
这篇文章被转载材料所提供的NIST。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。