la recherche arborescente Monte-Carlo (MCTS) consiste à simuler de nombreuses séquences aléatoires d’actions ou d’étapes dans la résolution d’un problème, et d’en apprécier le résultat final sur un critère de coût ou d’utilité. Ces simulations conduisent au choix de la meilleure première action. Avant ce choix, on s’efforce de simuler toutes les options au moins une fois (exploration), et les plus prometteuses un nombre élevé de fois (exploitation) pour obtenir des statistiques suffisantes sur leurs résultats. La MCTS est utilisée en particulier en planification probabiliste et dans les jeux.
De quoi s'agit-il vraiment ?