机器学习辅助环境监测
佛罗伦萨飓风在北卡罗莱纳肆虐时,释放出了一场“排泄物风暴”。大量的养猪场粪池将危险的细菌和重金属冲进了附近的水道。
更有效的监督可能会防止一些最坏的影响,但即使在最好的时候,州和联邦环境监管机构也过度扩张和资金不足。然而,根据斯坦福大学的研究人员的说法,机器学习的形式可以提供帮助,即训练计算机自动检测数据中的模式。
他们的研究发表在《自然-可持续发展》杂志上,发现机器学习技术可以发现的违规行为是现有方法的2到7倍,并建议在公共投资中广泛应用。
斯坦福大学地球、能源与环境科学学院埃米特环境与资源跨学科项目(E-IPER)的研究生、该研究的合著者埃丽诺·贝纳米说:“特别是在预算减少的时代,确定具有成本效益的方式来保护公众健康和环境至关重要。”
优化资源
正如美国国税局无法审计每个纳税人一样,大多数政府机构必须不断地就如何分配资源做出决定。机器学习方法可以通过预测哪些资金可以产生最大效益来帮助优化这一过程。研究人员重点研究了《清洁水法》(Clean Water Act),根据该法案,美国环境保护署(Environmental Protection Agency)和州政府负责监管30多万处设施,但每年能够检查的设施不到其中的10%。
利用过去检查的数据,研究人员部署了一系列模型来预测检查失败的可能性,基于设施的特征,如位置、行业和检查历史。然后,他们在所有设施上运行了模型,包括那些尚未被检查的设施。
这项技术为每个设施生成了一个风险评分,表明检查失败的可能性有多大。然后,该小组创建了四个反映不同制度约束的检查场景——例如,不同的检查预算和检查频率——并使用分数来确定检查的优先级和预测违规行为。
在限制最少的情况下——在现实世界中不太可能——研究人员预测,与现状相比,违规数量会增加7倍。当他们考虑更多的约束条件时,发现的违规数量仍然是现状的两倍。
算法的局限性
研究人员警告说,尽管机器学习有潜力,但它也有需要防范的缺陷。该研究的主要作者、E-IPER的研究生Miyuki Hino说:“算法是不完美的,它们有时会延续偏见,而且它们可以被利用。”
例如,代理人,如养猪场主人,可能会操纵他们报告的数据,以影响获得利益或避免处罚的可能性。其他人可能会改变他们的行为——当被抓到的风险很低时放松标准——如果他们知道他们被算法选中的可能性。制度、政治和财政限制可能会限制机器学习改进现有实践的能力。如果这种方法系统地将监管从低收入或少数民族地区的设施转移开,可能会加剧环境正义问题。此外,机器学习方法没有考虑到随着时间的推移可能发生的变化,比如公共政策优先级和污染控制技术。
研究人员对这些挑战提出了一些补救措施。随机选择一些设施,不管它们的风险评分如何,偶尔重新训练模型,以反映最新的风险因素,这有助于让低风险设施保持合规意识。环境正义问题可以纳入检查目标实践。研究使用自我报告数据的价值和权衡可以帮助管理对战略行为和设施操纵的担忧。
研究人员建议,未来的工作可以研究将机器学习方法整合到EPA更广泛的执法工作中的额外复杂性,例如纳入具体的执法优先事项或确定技术、财务和人力资源限制。此外,这些方法可以应用于美国国内以及监管机构寻求有效利用有限资源的其他情况。
“这个模型是一个起点,可以通过更多关于不同检查、违规和执法反应的成本和收益的细节来增强,”合著者、E-IPER的研究生尼娜·布鲁克斯说。
本文已从材料所提供的斯坦福大学.注:材料的长度和内容可能经过编辑。如需进一步信息,请联系所引用的来源。
参考
环境监测的机器学习。日野,E. Benami和N. Brooks。自然可持续发展(2018),https://doi.org/10.1038/s41893-018-0142-9。