Poste de recherche

Prévision des épidémies d'insectes à l'aide de l'apprentissage automatique : Une étude de cas sur le dendroctone du pin ponderosa

Résumé :

La planification de la gestion forestière repose sur la prévision des épidémies d'insectes tels que le dendroctone du pin ponderosa, en particulier dans un avenir à moyen terme, c'est-à-dire dans cinq ans. Les algorithmes d'apprentissage automatique sont des solutions potentielles à ce problème difficile en raison de leurs nombreux succès dans une variété de tâches de prédiction. Cependant, leur application présente de nombreux défis subtils : identifier les meilleurs modèles d'apprentissage et le meilleur sous-ensemble de covariables disponibles (y compris les décalages temporels) et évaluer correctement les modèles pour éviter des mesures de performance trompeuses. Nous abordons systématiquement ces questions en prédisant la probabilité d'une épidémie de dendroctone du pin dans la région de Cypress Hills et nous recherchons les modèles les plus performants pour prédire les infestations futures sur 1, 3, 5 et 7 ans. Nous formons neuf modèles d'apprentissage automatique, dont deux arbres de régression boosté généralisé (GBM) qui prédisent les infestations futures de 1 et 3 ans avec 92 % et 88 % d'AUC, et deux nouveaux modèles mixtes qui prédisent les infestations futures de 5 et 7 ans avec 86 % et 84 % d'AUC, respectivement. Nous avons également envisagé de former les ensembles de données d'entraînement et de test en divisant l'ensemble de données d'origine de manière aléatoire plutôt que d'utiliser l'approche appropriée basée sur l'année et nous montrons que cela peut permettre d'obtenir des modèles qui obtiennent des résultats élevés sur l'ensemble de données de test mais faibles dans la pratique, ce qui entraîne des évaluations de performance inexactes. Par exemple, un modèle k-plus proche voisin avec une performance réelle de 68% AUC, obtient un score trompeur de 78% sur un ensemble de données de test obtenu à partir d'une division aléatoire, mais un score plus précis de 66% sur une division basée sur l'année. Nous étudions ensuite comment la précision de la prédiction varie en fonction de la longueur de l'historique des covariables et nous constatons que le réseau neuronal et le réseau naïf de Bayes prédisent avec plus de précision lorsque la longueur de l'historique augmente, en particulier pour les prédictions futures à 1 et 3 ans, et il en va de même pour le GBM. Notre approche est applicable à d'autres espèces invasives. Les prédicteurs qui en résultent peuvent être utilisés pour planifier la gestion des forêts et des ravageurs et pour planifier les lieux d'échantillonnage dans les études de terrain.

Derniers documents de recherche

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !