muzero

A set of experiments and human-playing comparisons with the Muzero agent from Google DeepMind, made as part of a research project with l'école polytechnique.

python artificial-intelligence reinforcement-learning-algorithms deepmind muzero

Updated Jul 27, 2021
Python

abrahamabel / GenesisZero

Star

GenesisZERO : potential applications for MCTS agents with LLMs for Sequential decision-making

reinforcement-learning deep-reinforcement-learning gym reinforcement-learning-algorithms monte-carlo-tree-search gym-environment reinforcement-learning-agent alphazero mcts-algorithm muzero large-language-models llm llms stochastic-muzero muzero-stochastic llm-agent

Updated Dec 16, 2023

liudengfeng / mrlxq

Star

muzero Algorithm Reinforcement Learning for Chinese XiangQi

reinforcement-learning ray rllib muzero xiqngqi

Updated May 1, 2023
Python

mdhiebert / meta-minichess

Star

Meta-learning experiments for the game of minichess and related rule variants.

meta-learning alphazero muzero minichess meta-minichess gym-minichess

Updated Oct 9, 2021
Python

souvikshanku / tic-tac-toe-zero

Star

MuZero - tic-tac-toe

tic-tac-toe muzero

Updated Jun 2, 2024
Python

svenssona / muzero

Star

Learning how muzero works

reinforcement-learning muzero

Updated Sep 4, 2021
Jupyter Notebook

benborder / drla-sim

Star

Trains a deep reinforcement learning agent in simulation testbed environments with the DRLA library.

reinforcement-learning cpp deep-reinforcement-learning pytorch cartpole connect4 ppo dreamer libtorch muzero

Updated Apr 27, 2024
C++

benborder / drla-atari

Star

Trains deep reinforcement learning agents in Atari environments via the DRLA library.

reinforcement-learning cpp deep-reinforcement-learning pytorch atari ppo dreamer libtorch muzero

Updated Apr 27, 2024
C++

Nebraskinator / SuperMarioBrosAI

Star

MuZero for Super Mario Bros

ai deep-reinforcement-learning super-mario-bros muzero

Updated Mar 9, 2021
Python

abrahamabel / Muzero-GDM_Pseudo_Code

Star

A Notebook implementation of the Pseudocode from the original Muzero paper

python jupyter-notebook mcts muzero muzero-pseudocode

Updated Jan 14, 2024
Jupyter Notebook

Atze00 / muzero-cartpole

Star

reinforcement-learning cartpole replay muzero

Updated Dec 28, 2020
Python

AntoniovanDijck / BlackJackRL

Star

Deep Q Learning blackbox strategies for casino games

machine-learning deep-neural-networks reinforcement-learning deep-learning tensorflow blackjack deep-reinforcement-learning torch reinforcement-learning-algorithms deep-q-network mlx rlx q-learning-algorithm muzero

Updated Mar 22, 2024
Jupyter Notebook

BIGBALLON / Toward-AGZ

Star

Materials for AlphaGo

deep-learning deep artificial-intelligence alphago alphago-zero muzero

Updated Mar 10, 2022

hayashimasa / Robust_MuZero

Star

A robust variant of MuZero

deep-reinforcement-learning pytorch robust-control muzero

Updated Mar 22, 2021
Python

seawee1 / efficientalphazero

Star

AlphaZero for singleplayer environments implemented efficiently using Ray

mcts ray alphago alphazero muzero

Updated Apr 4, 2023
Python

benborder / drla

Star

C++ Deep Reinforcement Learning Agent library

reinforcement-learning cpp deep-reinforcement-learning pytorch ppo dreamer libtorch muzero

Updated Apr 27, 2024
C++

Improve this page

Add a description, image, and links to the muzero topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the muzero topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

muzero

Here are 40 public repositories matching this topic...

ChukwumaChukwuma / enyimba_ai

fpga-tom / pyzero

trunghng / muzero

Itomigna2 / Muesli-cartpole

alexZajac / muzero_experiments

abrahamabel / GenesisZero

liudengfeng / mrlxq

mdhiebert / meta-minichess

souvikshanku / tic-tac-toe-zero

svenssona / muzero

benborder / drla-sim

benborder / drla-atari

Nebraskinator / SuperMarioBrosAI

abrahamabel / Muzero-GDM_Pseudo_Code

Atze00 / muzero-cartpole

AntoniovanDijck / BlackJackRL

BIGBALLON / Toward-AGZ

hayashimasa / Robust_MuZero

seawee1 / efficientalphazero

benborder / drla

Improve this page

Add this topic to your repo