Nouvelles

Possibilité de stage : Conseil national de recherches du Canada (CNRC)

Contexte

Les objectifs de ce projet sont d'appliquer la découverte guidée par les données pour soutenir les efforts visant à améliorer la production de protéagineux canadiens et de concevoir des méthodes d'apprentissage automatique pour exploiter les ensembles de données génomiques générés par le Conseil national de recherches du Canada (CNRC). Cette collaboration à l'intersection de l'IA et de la biologie des protéines végétales permettra d'extraire des modèles d'information biologique significatifs et de produire des informations précieuses pour la recherche et les applications futures dans divers domaines agricoles. Plus précisément, l'objectif principal de ce projet est de développer des modèles qui prédisent les phénotypes moléculaires - y compris l'abondance des transcriptions et des protéines - directement à partir des séquences d'ADN.

Le domaine de la prédiction du phénotype moléculaire commence à tirer parti des progrès de l'apprentissage automatique. Les progrès récents en génomique et en spectrométrie de masse permettent désormais de générer des ensembles de données de taille et de qualité suffisantes pour entraîner des modèles complexes (par exemple, des réseaux neuronaux profonds) sur des phénomènes biologiques tels que la transcription et la traduction. Cependant, peu d'études ont été publiées dans ce domaine et le développement d'une expertise sur la meilleure façon d'aborder ce problème est une priorité élevée pour ce projet.

Description du projet

Dans ce projet, nous étudions les modèles de contraste des orthologues et cherchons à améliorer nos travaux précédents. La littérature existante et les nouvelles approches étudiées à Amii montrent un potentiel dans les ensembles de données disponibles publiquement et dans ceux du CNRC. Ce travail peut être amélioré en modifiant l'architecture existante ou en ajoutant de nouvelles informations à l'architecture existante. Bien que les données du CNRC soient actuellement limitées aux informations sur les séquences des protéagineux, en particulier le canola et les légumineuses (pois, lentilles), avec une priorité accordée aux caractéristiques liées aux graines, des informations supplémentaires telles que l'ADN transcriptomique et chloroplastique seront disponibles avec le temps. Ces informations supplémentaires seront intégrées dans le modèle existant ou dans une nouvelle architecture afin d'obtenir de meilleures performances. L'une des principales composantes de ce projet est l'interprétabilité des modèles ML et la détermination de la raison pour laquelle un certain résultat est prédit. Par exemple, quelles régions de la séquence sont les plus exprimées lors de la prédiction du résultat et quelles informations supplémentaires sont les plus efficaces. Dans un premier temps, les modèles existants qui ont été explorés doivent être bien compris. Pour cette étape, les premiers résultats obtenus doivent être reproduits. Après cette démonstration, l'accent sera mis sur les moyens d'améliorer les performances du modèle et sur la manière dont nous pouvons intégrer des informations supplémentaires. Parmi les pistes à explorer ici, on peut citer l'ingénierie des fonctionnalités, l'expansion des données et une nouvelle architecture.

Le résultat de ce projet sera une première génération de modèles prédictifs de l'abondance du phénotype moléculaire (ou endophénotype). Ces modèles devraient avoir une grande utilité pour l'amélioration des cultures. En fournissant un moyen d'évaluer les associations de traits et la modélisation à un niveau fonctionnel (c'est-à-dire le dosage des transcriptions, des protéines ou des gènes/fonctions), ces types de modèles devraient entraîner un changement de paradigme dans la sélection et le développement des traits.

Le projet sera exécuté sur une période de deux ans, et Amii accueillera un certain nombre de stagiaires consécutifs au cours du projet. Les stagiaires travailleront sous la supervision d'un scientifique principal d'Amii pendant toute la durée de leur stage. Les stages débutent à 4 mois avec la possibilité d'une extension jusqu'à 12 mois.

Écoutez le témoignage de l'une de nos stagiaires, Ruchika :

"J'ai vécu une expérience extraordinaire en tant que stagiaire en apprentissage automatique chez Amii. Bien que j'aie travaillé sur le projet pendant 4 mois, j'ai fait une étude documentaire, compris les objectifs de la recherche, reproduit une méthode de pointe existante et publiée, et développé un nouveau modèle dans ce court laps de temps. Ces réalisations ont été possibles grâce à l'environnement de soutien et de collaboration d'Amii. Amii a créé un environnement de travail inclusif où les différentes perspectives, idées et opinions des membres de l'équipe sont acceptées. Je suis heureux d'avoir eu l'occasion d'appliquer mes connaissances et mes compétences en apprentissage automatique à un projet financé par le CNRC chez Amii."

Compétences / expertise requises

Nous recherchons un stagiaire talentueux et enthousiaste ayant de solides connaissances en biologie computationnelle et en apprentissage automatique.

Principales responsabilités :

  • Construire, former et évaluer des modèles ML
  • Entreprendre des recherches appliquées sur les techniques de ML afin de remédier aux limites des modèles existants.

Exigences :

  • Au moins un an dans un programme d'études supérieures en CS / ML, MSc. ou PhD.
  • Expérience de la recherche et/ou de projets appliqués dans le domaine de la biologie computationnelle et des technologies d'apprentissage profond connexes (par exemple, réseaux neuronaux convolutifs (CNN), modèles de séquences, réseaux d'attention, apprentissage par transfert).
  • Maîtrise du langage de programmation Python et des bibliothèques et boîtes à outils associées (par exemple, scikit learn, Pandas, Jupyter notebooks, PyTorch, Keras, Tensorflow, transformateurs).

Les actifs :

  • Expérience de travail avec des flux d'ingénierie de données et des bases de données.
  • Dossier de publication dans des conférences universitaires évaluées par des pairs ou dans des revues pertinentes en intelligence artificielle.
  • Connaissance et expérience de la conception de cadres expérimentaux pour les grands ensembles de données.

Exigences non techniques :

  • Esprit d'équipe interdisciplinaire, enthousiaste à l'idée de travailler ensemble pour atteindre l'excellence.
  • Capable d'une pensée critique et indépendante
  • Capacité à communiquer clairement des concepts techniques et à donner des conseils sur l'application de l'intelligence artificielle.
  • la curiosité intellectuelle et le désir d'apprendre de nouvelles choses, techniques et technologies

Comment postuler

Si cela ressemble à l'opportunité que vous attendiez, n'attendez pas pour postuler ! Veuillez envoyer votre lettre de motivation et votre CV par le biais de l'annonce Indeed avant le 19 avril 2022.

Les candidats doivent être légalement autorisés à travailler au Canada au moment de la demande.

Amii est fière d'être un employeur qui respecte l'égalité des chances. Nous nous engageons à créer une main-d'œuvre diversifiée, inclusive et excellente.

Derniers articles d'actualité

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !