Skip to main content

Bruno Bouzy

Research Interests:
Le jeu de Go est un jeu très ancien aux règles simples Le jeu de Go est un jeu d'origine chinoise vieux de trois à quatre mille ans qui est très populaire au Japon, en Chine et en Corée où il existe des joueurs professionnels. Il ne... more
Le jeu de Go est un jeu très ancien aux règles simples Le jeu de Go est un jeu d'origine chinoise vieux de trois à quatre mille ans qui est très populaire au Japon, en Chine et en Corée où il existe des joueurs professionnels. Il ne s'est développé que récemment aux États-Unis et en Europe où il n'existe que de forts amateurs. Ses règles sont très simples mais sa complexité est immense. Le lecteur novice souhaitant connaître les règles de ce jeu peut se reporter à l'annexe A. La combinatoire du Go est plus grande que celle du jeu d'Échecs Il a d'abord été difficile d'évaluer théoriquement la complexité algorithmique du jeu de Go. En 1983, Robson a prouvé que le problème consistant à décider si un joueur peut forcer la victoire à partir d'une configuration donnée était un problème dont le temps de résolution est une fonction exponentielle de la taille du goban. Il existe d'autres résultats théoriques sur la complexité algorithmique de ce jeu qui te...
Dans cet article, nous présentons un nouvel algorithme de recherche heuristique basé sur le calcul de moyennes pour la planification temps réel, appelé MHSP (Mean-Based Heuristic Search Planning). Il associe les principes d’UCT (Upper... more
Dans cet article, nous présentons un nouvel algorithme de recherche heuristique basé sur le calcul de moyennes pour la planification temps réel, appelé MHSP (Mean-Based Heuristic Search Planning). Il associe les principes d’UCT (Upper Confidence for Tree), un algorithme de type bandit ayant donné de très bons résultats dans le domaine des jeux, et plus particulièrement dans le cadre du jeu de Go, et une recherche heuristique en vue d’obtenir un planificateur temps réel dans le contexte de la planification d’actions. MHSP est évalué sur différents problèmes de planification et comparé aux algorithmes de recherche en ligne et d’apprentissage existants. Nos résultats mettent en évidence la capacité de MHSP à retourner en temps réel des plans qui tendent vers un plan optimal au cours du temps. Ils montrent de plus que MHSP est plus rapide et retourne des plans de meilleure qualité que les algorithmes existants dans la littérature.
Les jeux sont étudiés en Intelligence Artificielle depuis ses origines. Historiquement le jeu d'Echecs et l'Alpha-Béta ont été les plus étudiés. Des algo- rithmes et des structures de données utilisées initialement pour les jeux... more
Les jeux sont étudiés en Intelligence Artificielle depuis ses origines. Historiquement le jeu d'Echecs et l'Alpha-Béta ont été les plus étudiés. Des algo- rithmes et des structures de données utilisées initialement pour les jeux comme l'approfondissement itératif et les tables de transpositions ont été ensuite réu- tilisés pour de nombreux autres problèmes. Nous présentons dans ce chapitre di érents algorithmes utilisés pour les jeux. Les jeux sont étudiés en Intelligence Arti cielle depuis ses origines. His- Nous commençons par deux sections sur les jeux à deux joueurs, la première traite de l'Alpha-Beta et de certaines de ses optimisations, la deuxième porte sur les algorithmes de Monte-Carlo qui ont donné récemment de très bons résultats sur certains jeux et qui ont une portée très générale. On peut noter au passage les contributions essentiellement françaises aux algorithmes de Monte-Carlo, on peut même parler d'une école française du Monte-Carlo dans les jeu...
In this paper, we introduce a new heuristic search algorithm based on mean values for real-time planning, called MHSP. It consists in associating the principles of UCT, a banditbased algorithm which gave very good results in computer... more
In this paper, we introduce a new heuristic search algorithm based on mean values for real-time planning, called MHSP. It consists in associating the principles of UCT, a banditbased algorithm which gave very good results in computer games, and especially in Computer Go, with heuristic search in order to obtain a real-time planner in the context of classical planning. Compared to UCT, at leaf nodes, MHSP replaces the simulations by heuristic values given by planning graph techniques. When the heuristic is admissible, the initial mean values of nodes are optimistic, which is a correct way of guiding exploration.
We have developed two go programs, Olga and Oleg, using a Monte Carlo ap- proach, simpler than Bruegmann's (Bruegmann, 1993), and based on (Abramson, 1990). We have set up experiments to assess ideas such as progressive pruning,... more
We have developed two go programs, Olga and Oleg, using a Monte Carlo ap- proach, simpler than Bruegmann's (Bruegmann, 1993), and based on (Abramson, 1990). We have set up experiments to assess ideas such as progressive pruning, transpositions, temperature, simulated annealing and depth-two tree search within the Monte Carlo framework. We have shown that progressive pruning alone gives better results
Introducing the original ideas of using Monte-Carlo simulation in computer Go. Adding new ideas to pure Monte-Carlo approach for computer Go. • Progressive pruning • All moves as first heuristic • Temperature • Simulated annealing •... more
Introducing the original ideas of using Monte-Carlo simulation in computer Go. Adding new ideas to pure Monte-Carlo approach for computer Go. • Progressive pruning • All moves as first heuristic • Temperature • Simulated annealing • Depth-2 tree search Conclusion: • With the ever-increasing power of computers, we can add more knowl- edge to the Monte-Carlo approach to get
Research Interests:
RÉSUMÉ. Le cadre des travaux présentés dans cet article est celui de la l'amélioration d'une fonction d'évaluation de type Monte Carlo pour le jeu de Go. Une évaluation Monte Carlo est la moyenne des résultats terminaux... more
RÉSUMÉ. Le cadre des travaux présentés dans cet article est celui de la l'amélioration d'une fonction d'évaluation de type Monte Carlo pour le jeu de Go. Une évaluation Monte Carlo est la moyenne des résultats terminaux d'un grand nombre de parties aléatoires simulées à ...
Research Interests:
Commercial games can be an excellent testbed to artificial intelligence (AI) research, being a middle ground between synthetic, highly abstracted academic benchmarks, and more intricate problems from real life. Among the many AI... more
Commercial games can be an excellent testbed to artificial intelligence (AI) research, being a middle ground between synthetic, highly abstracted academic benchmarks, and more intricate problems from real life. Among the many AI techniques and problems relevant to games, such as learning, planning, and natural language processing, pathfinding stands out as one of the most common applications of AI research to games. In this document we survey recent work in pathfinding in games. Then we identify some challenges and potential directions for future work. This chapter summarizes the discussions held in the pathfinding workgroup.