Several legal acts mandate that management agencies regularly assess biological populations. For species with distinct markings, these assessments can be conducted noninvasively via capture-recapture and photographic identification (photo-ID), which involves processing considerable quantities of photographic data. To ease this burden, agencies increasingly rely on automated identification (ID) algorithms. Identification algorithms present agencies with an opportunity-reducing the cost of population assessments-and a challenge-propagating misidentifications into abundance estimates at a large scale. We explored several strategies for generating capture histories with an ID algorithm, evaluating trade-offs between labor costs and estimation error in a hypothetical population assessment. To that end, we conducted a simulation study informed by 39 photo-ID datasets representing 24 cetacean species. We fed the results into a custom optimization tool to discern the optimal strategy for each dataset. Our strategies included choosing between truly and partially automated photo-ID and, in the case of the latter, choosing the number of suggested matches to inspect. True automation was optimal for datasets for which the algorithm identified individuals well. As identification performance declined, the optimization recommended that users inspect more suggested matches from the ID algorithm, particularly for small datasets. False negatives (i.e., individual was resighted but erroneously marked as a first capture) strongly predicted estimation error. A 2% increase in the false negative rate translated to a 5% increase in the relative bias in abundance estimates. Our framework can be used to estimate expected error of the abundance estimate, project labor effort, and find the optimal strategy for a dataset and algorithm. We recommend estimating a strategy's false negative rate before implementing the strategy in a population assessment. Our framework provides organizations with insights into the conservation benefits and consequences of automation as conservation enters a new era of artificial intelligence for population assessments.
Optimización de la identificación fotográfica automatizada para las evaluaciones poblacionales Resumen Varios actos jurídicos obligan a los organismos de gestión a evaluar con frecuencia las poblaciones biológicas. En el caso de las especies con marcas distintivas, estas evaluaciones pueden realizarse de forma no invasiva mediante captura‐recaptura e identificación fotográfica (foto‐ID). Esto implica procesar cantidades considerables de datos fotográficos. Las agencias usan cada vez más los algoritmos de identificación automatizada (ID) para aminorar esta carga. Los algoritmos de identificación brindan una oportunidad (reducir el costo de las evaluaciones de población) y un reto (propagar las identificaciones erróneas a las estimaciones de abundancia a gran escala). Exploramos varias estrategias para generar historiales de capturas con un algoritmo de identificación que evaluara las compensaciones entre los costes laborales y el error de estimación en una evaluación poblacional hipotética. Para ello, realizamos un estudio de simulación basado en 39 conjuntos de datos de foto‐ID que representaban a 24 especies de cetáceos. Introdujimos los resultados en una herramienta de optimización personalizada para discernir la estrategia óptima para cada conjunto de datos. Nuestras estrategias incluyeron elegir entre la foto‐ID real y la parcialmente automatizada y, en el caso de esta última, elegir el número de coincidencias sugeridas para inspeccionar. La automatización real fue óptima para los conjuntos de datos en los que el algoritmo identificó bien a los individuos. A medida que el rendimiento de la identificación disminuía, la optimización recomendaba a los usuarios inspeccionar más coincidencias sugeridas por el algoritmo de identificación, sobre todo para conjuntos de datos pequeños. Los falsos negativos (es decir, el individuo en recaptura, pero marcado erróneamente como primera captura) predijeron fuertemente el error de estimación. Un aumento del 2% en la tasa de falsos negativos se tradujo en un aumento del 5% en el sesgo relativo de las estimaciones de abundancia. Nuestro marco puede utilizarse para estimar el error esperado en la estimación de la abundancia, proyectar el esfuerzo de trabajo y encontrar la estrategia óptima para un conjunto de datos y un algoritmo. Recomendamos estimar la tasa de falsos negativos de una estrategia antes de aplicarla en una evaluación de población. Nuestro marco proporciona a las organizaciones información sobre los beneficios para la conservación y las consecuencias de la automatización a medida que la conservación entra en una nueva era de inteligencia artificial para las evaluaciones de poblaciones.
【摘要】 一些法律规定, 管理机构必须定期对生物种群进行评估。对于有明显参考标识的物种, 可以用标记重捕和照片识别的无损伤方法进行评估, 这就需要处理大量的照片数据。为了减轻这一负担, 各机构越来越依赖自动识别算法。识别算法给机构带来了降低种群评估成本的机遇, 但同时也带来了挑战, 因为可能会将错误识别推广到大尺度的丰度估计之中。本研究探索了使用识别算法生成捕获历史记录的几种策略, 并在模拟的种群调查中评估了人力成本和估计误差之间的利弊权衡。为此, 我们利用代表24种鲸类的39个照片识别数据集进行了模拟研究。我们将结果输入定制的优化工具, 为每个数据集制定了最优策略。这些策略包括在真正自动化和部分自动化的照片识别之间做出选择, 如果是后者, 则选择建议检查的匹配数量。对于算法能很好识别个体的数据集, 真正自动化是最优选择。随着识别效果下降, 我们的优化策略建议用户检查更多来自识别算法的建议匹配, 尤其是对于小数据集。假阴性(即个体被再次观察到, 但被错误地标记为首次捕获)可以很强地预测估计误差的水平。假阴性率每增加2%, 丰度估计的相对偏差就会增加5%。我们的框架可用于评估丰度估计的预期误差、预测人力劳动强度, 并为数据集和算法找到最优策略。我们建议在实施特定的种群评估策略之前, 先评估该策略的假阴性率。随着保护工作进入利用人工智能进行种群评估的新时代, 我们的框架可为各组织了解自动化的保护效益和结果提供见解。【翻译:胡怡思;审校:聂永刚】.
Keywords: Jolly‐Seber; Jolly‐Seber模型; Jolly−Seber; artificial intelligence; captura‐recaptura; capture‐recapture; cetacean; cetáceos; errores de identificación; evaluación de stock; inteligencia artificial; misidentification; optimización; optimization; stock assessment; 人工智能; 优化; 标记重捕; 种群评估; 错误识别; 鲸鱼.
© 2025 Society for Conservation Biology.