Institut de l'intelligence artificielle de l'Alberta

L'apprentissage automatique dans la production végétale

Publié

23 novembre 2023

Un partenariat entre Amii et le Conseil national de recherches du Canada explore la manière dont l'IA et l'apprentissage automatique peuvent contribuer à nourrir une population mondiale croissante. Le projet exploite la puissance de l'apprentissage automatique et de la génomique végétale pour développer des cultures capables d'augmenter les rendements, d'utiliser moins de ressources et de résister aux effets croissants du changement climatique sur la production alimentaire.

"Selon l'Organisation des Nations unies pour l'alimentation et l'agriculture, nous devons doubler notre production alimentaire par rapport à la production actuelle", explique Jubair Sheikh, le scientifique d'Amii spécialisé dans l'apprentissage automatique qui dirige le projet.

"Et comme nous avons moins de terres agricoles, nous devons augmenter la production alimentaire ou les valeurs de rendement. L'édition de gènes combinée à la sélection génomique est l'un des moyens d'y parvenir".

Le potentiel de la génomique végétale

Depuis que l'homme a commencé à cultiver des plantes, il les a sélectionnées pour qu'elles présentent des caractéristiques souhaitables, qu'il s'agisse d'un rendement plus élevé, d'un meilleur goût ou d'une apparence plus agréable. Après des milliers d'années de sélection, la plupart des plantes que nous plantons ont très peu en commun avec leurs ancêtres sauvages.

Cependant, grâce à la génomique végétale et à l'édition de gènes, les producteurs de denrées alimentaires peuvent accomplir bien plus qu'avec la seule sélection. La génomique peut aider à identifier la base génétique d'un caractère, et l'édition de gènes permet d'appliquer ces connaissances pour modifier le caractère en utilisant le même type de mutations que celles qui se produisent dans la nature.

Amii et le CNRC ont travaillé ensemble sur plusieurs projets liés à la génomique des plantes. Le plus récent consiste à utiliser un modèle d'apprentissage automatique formé sur les différences de séquence et d'expression des gènes entre les espèces pour prédire comment un gène sera exprimé directement à partir de la séquence génétique.

L'ADN est codé avec de nombreuses informations, dont certaines ne sont utilisées que dans certaines conditions. L'expression des gènes est le processus par lequel ces informations sont utilisées et transformées en une fonction qui influence les cellules de l'organisme. Shiekh explique que l'expression des gènes peut être "régulée à la hausse" ou "régulée à la baisse", ce qui rend cette expression plus ou moins probable.

Ainsi, dit-il, si un gène de résistance à la sécheresse est régulé à la hausse dans une plante donnée, cela signifie que cette culture a plus de chances de résister au temps sec. Si le gène est régulé à la baisse, cette caractéristique a moins de chances d'apparaître.

S'adapter au changement climatique

Le dernier partenariat Amii/CNRC utilise l'apprentissage automatique pour comparer les gènes entre trois cultures apparentées - Pea, Faba et Medicago- afin de prédire le niveau d'expression d'un certain gène d'une espèce par rapport à l'orthologue de l'autre espèce. Étant donné que le modèle d'apprentissage automatique est formé sur les propriétés fonctionnelles de la séquence génétique, les modèles devraient saisir le langage de l'expression des gènes et aider à expliquer la biologie du processus.

Le modèle d'apprentissage automatique Amii est formé sur les données exclusives du CNRC concernant le pois, la féverole et le Medicago, ce qui lui permet d'être très performant sur les cultures de légumineuses. Bien que la génétique des plantes puisse également être explorée avec des méthodes non-ML, M. Sheikh affirme que l'apprentissage automatique est beaucoup plus efficace et prend beaucoup moins de temps que les autres méthodes, qui peuvent nécessiter des expériences en laboratoire ou sur le terrain. C'est important, ajoute-t-il, car les méthodes génétiques traditionnelles d'identification des gènes peuvent être extrêmement longues et coûteuses.

"L'apprentissage automatique nous permet d'ajouter des informations biologiques complémentaires, telles que l'impact sur l'expression des gènes, à l'identification des variants et des gènes responsables, et d'intégrer ces informations dans les modèles de prédiction génomique ", a déclaré David Konkin, agent de recherche associé au CNRC.

Il est important de disposer de cadres prédictifs plus robustes pour les cultures si l'on veut réagir au changement climatique. Les stratégies actuelles consistent généralement à planter des champs de cultures expérimentales et à attendre que les plantes aient poussé. Il faut parfois plusieurs saisons de croissance pour obtenir des résultats fiables. Mais dans un monde où les conditions météorologiques évoluent en raison du changement climatique, cela peut signifier que les données sont rapidement obsolètes.

"Si vous plantez des champs d'essai, cela peut prendre cinq ans [pour créer de nouveaux cultivars]. Imaginez maintenant qu'il y ait une sécheresse et que la plante ne reçoive pas autant d'eau qu'il y a cinq ans. Vous avez déjà perdu cinq ans sur le terrain. Je ne dis pas que ce que vous avez fait est obsolète, mais vous y êtes presque", explique M. Sheikh.

En utilisant le modèle d'apprentissage automatique pour prédire les expressions génétiques, les chercheurs peuvent concentrer leurs tests sur les candidats les plus prometteurs, ce qui leur permet d'économiser du temps et des ressources.

Bien que les résultats soient prometteurs, M. Sheikh indique que les chercheurs s'efforcent d'améliorer les modèles afin d'obtenir une plus grande précision. Il est également optimiste quant au fait que le modèle qu'ils ont conçu pour examiner le maïs et le sorgho pourrait être ré-entraîné pour être utilisé sur d'autres cultures. Il ajoute que les travaux ont également permis de prédire les expressions génétiques de plantes qui ne sont pas apparentées, ce qui ouvre de nouvelles perspectives pour l'avenir de la production alimentaire.

Auteurs

Jubair Sheikh

Scott Lilwall

Partager