Prévision des épidémies d'insectes à l'aide de l'apprentissage automatique : Une étude de cas sur le dendroctone du pin ponderosa

Résumé :

La planification de la gestion forestière repose sur la prévision des épidémies d'insectes tels que le dendroctone du pin ponderosa, en particulier dans un avenir à moyen terme, c'est-à-dire dans cinq ans. Les algorithmes d'apprentissage automatique sont des solutions potentielles à ce problème difficile en raison de leurs nombreux succès dans une variété de tâches de prédiction. Cependant, leur application présente de nombreux défis subtils : identifier les meilleurs modèles d'apprentissage et le meilleur sous-ensemble de covariables disponibles (y compris les décalages temporels) et évaluer correctement les modèles pour éviter des mesures de performance trompeuses. Nous abordons systématiquement ces questions en prédisant la probabilité d'une épidémie de dendroctone du pin dans la région de Cypress Hills et nous recherchons les modèles les plus performants pour prédire les infestations futures sur 1, 3, 5 et 7 ans. Nous formons neuf modèles d'apprentissage automatique, dont deux arbres de régression boosté généralisé (GBM) qui prédisent les infestations futures de 1 et 3 ans avec 92 % et 88 % d'AUC, et deux nouveaux modèles mixtes qui prédisent les infestations futures de 5 et 7 ans avec 86 % et 84 % d'AUC, respectivement. Nous avons également envisagé de former les ensembles de données d'entraînement et de test en divisant l'ensemble de données d'origine de manière aléatoire plutôt que d'utiliser l'approche appropriée basée sur l'année et nous montrons que cela peut permettre d'obtenir des modèles qui obtiennent des résultats élevés sur l'ensemble de données de test mais faibles dans la pratique, ce qui entraîne des évaluations de performance inexactes. Par exemple, un modèle k-plus proche voisin avec une performance réelle de 68% AUC, obtient un score trompeur de 78% sur un ensemble de données de test obtenu à partir d'une division aléatoire, mais un score plus précis de 66% sur une division basée sur l'année. Nous étudions ensuite comment la précision de la prédiction varie en fonction de la longueur de l'historique des covariables et nous constatons que le réseau neuronal et le réseau naïf de Bayes prédisent avec plus de précision lorsque la longueur de l'historique augmente, en particulier pour les prédictions futures à 1 et 3 ans, et il en va de même pour le GBM. Notre approche est applicable à d'autres espèces invasives. Les prédicteurs qui en résultent peuvent être utilisés pour planifier la gestion des forêts et des ravageurs et pour planifier les lieux d'échantillonnage dans les études de terrain.

Prévision des épidémies d'insectes à l'aide de l'apprentissage automatique : Une étude de cas sur le dendroctone du pin ponderosa

Résumé :

Derniers documents de recherche

Modélisation et prévision des cas de COVID-19 en utilisant des sous-populations latentes

Vers un système de santé apprenant basé sur l'intelligence artificielle pour la prédiction de la mortalité au niveau de la population à partir d'électrocardiogrammes

Prédiction du trouble obsessionnel-compulsif : Importance de la conception de caractéristiques assistée par la neurobiologie et de l'apprentissage par transfert de diagnostic croisé

Laissez-nous vous aider

Connectez-vous avec la communauté

Explorer la formation et l'enseignement supérieur

Exploiter le potentiel de l'intelligence artificielle

Connectez-vous avec la communauté

Explorer la formation et l'enseignement supérieur

Exploiter le potentiel de l'intelligence artificielle