Martin Müller s'intéresse au développement de méthodes de recherche efficaces pour les problèmes difficiles.
Cherchez, planifiez, partez !
Le principal domaine de recherche de Martin Müller est la recherche heuristique moderne, avec ses interactions complexes entre la recherche, la connaissance, les simulations et l'apprentissage automatique. Lui et son équipe de recherche travaillent sur la compréhension et l'amélioration de la recherche arborescente de Monte Carlo, l'exploration et l'échantillonnage dans l'apprentissage par renforcement, l'exploration dans SAT, la recherche et l'apprentissage profond pour Hex, et la théorie des jeux combinatoires - en particulier le développement d'algorithmes efficaces qui combinent la recherche et la décomposition du sous-jeu. Il travaille également sur la planification indépendante du domaine, la planification de la marche aléatoire, la planification des mouvements et l'échantillonnage aléatoire à partir de distributions discrètes à évolution temporelle.
Martin et son équipe ont produit des programmes et des algorithmes pour les jeux de Go, Amazones, Clobber et Hex. Nombre de ses algorithmes utilisent les trois méthodes modernes de recherche heuristique : la recherche, la connaissance et les simulations aléatoires. Il a dirigé le développement du programme open source Fuego qui, en 2009, a remporté pour la première fois une partie de Go 9x9 à armes égales contre un joueur humain professionnel de haut niveau. Martin travaille sur le Go informatique depuis 30 ans et a été le co-superviseur universitaire (avec Richard S. Sutton) de David Silver, qui est devenu chef de l'apprentissage par renforcement chez DeepMind et chercheur principal sur AlphaGo. Avec ses étudiants et ses collègues, M. Müller a mis au point une série de programmes de jeu, de systèmes de planification et de solveurs SAT qui ont fait leurs preuves.