0% found this document useful (0 votes)

8 views21 pages

(Shifar) - Parallel and Distributed Computing

Uploaded by

MD Tahsin Amin

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views21 pages

(Shifar) - Parallel and Distributed Computing

Uploaded by

MD Tahsin Amin

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 21

Acceleration for Deep Reinforcement Learning using

Parallel and Distributed Computing: A Comprehensive

Survey
Authors: Zhihong Liu, Xin Xu, Peng Qiao, Dongsheng Li (National University of Defense
Technology, China)
Course Code: CIT 5203

Course Title: Parallel and Distributed Computing

Presented By
A.B.M. Shifar Emtiuz
ID: 6232020107
Reg: 08417
Introduction

• Overview: Deep Reinforcement Learning (DRL) merges deep learning and

reinforcement learning, driving AI breakthroughs in gaming, robotics, and
healthcare.
• Problem: DRL training is computationally intensive due to large neural
networks, massive experience data, and complex hyper-parameter tuning.
• Solution: Parallel and distributed computing accelerates DRL training.
• Survey Goal: Provide a comprehensive review of state-of-the-art acceleration
methods, including taxonomy and open-source platforms.
Motivation

1 2 3
Why Accelerate DRL(Deep Contribution Scope
Reinforcement Learning ): Covers architectures,
First survey to systematically
• Example: Training DQN on Atari parallelism strategies,
takes 38 days with 50M frames.
classify DRL acceleration
techniques using parallel and synchronization, evolutionary
• Growing complexity demands faster distributed computing. methods, and libraries.
training for real-world applications.
DRL (Deep Reinforcement Learning)
Fundamentals

• Definition: DRL involves agents learning optimal policies through

environment interactions, collecting experience data (state, action,
next state, reward).
• Key Features:
• Handles high-dimensional state spaces.
• Self-learns without labeled data.
• Enables offline training for online problems.
DRL Classification
Model-Based DRL:

• Uses known or learned environment dynamics (e.g., MB-MPO, AlphaZero).

Model-Free DRL:

• Value-based (e.g., DQN), policy-based, or actor-critic (e.g., PPO, SAC).

On-Policy vs. Off-Policy:

• On-policy: Stable, less sample-efficient.

• Off-policy: Sample-efficient, less stable.
System Coordination: Managing actors, learners,
and parameter servers.

Sample Generation: Producing billions of

experience samples (e.g., 2.5B frames for
navigation).
Challeng
es in DRL Workload Heterogeneity: Frequent data movement
across devices.
Training
Synchronization Issues: Obsolete gradients in
heterogeneous environments.

Optimization Limits: Stochastic gradient descent

prone to local optima.
System Architectures
Overview

• Components:
• Actors: Environment interaction.
• Learners: Gradient computation.
• Parameter Servers: Model maintenance.
• Replay Memory: Off-policy data storage.
• Architecture Types: Centralized (star topology)
vs. Decentralized (fully connected).
Centralized Architectures
• Features: Central node maintains global model,
simpler synchronization but scalability bottleneck.
• Examples:
• Gorila: Massively distributed DQN, 10x faster
training.
• APE-X: Prioritized experience replay for DQN.
• A3C: On-policy learning with actor-learner
threads.
Decentralized • Features: Multiple learners aggregate gradients via all-reduce, scalable but
with synchronization overhead.
Architectures • Examples:
• IMPALA: CPU actors, GPU learners, synchronous updates.
• rlpyt: Multi-GPU acceleration with all-reduce.
• DD-PPO: Scalable across machines, combined actor-learner.
Simulation Parallelism
• Role: Simulations (e.g., OpenAI Gym, MuJoCo) generate
training samples.
• Challenges: High computational cost for physics and
rendering.
• Solutions:
• Parallel simulation environments.
• GPU-accelerated simulations for robotics.
• Large-batch simulations for efficiency.
• Platforms: OpenAI Gym, MuJoCo, Unity ML, Gazebo,
AirSim, Brax.
Computing Parallelism

• Data Parallelism: Splits data across workers with model replicas.

• Model Parallelism: Divides neural network for large models.
• Pipeline Parallelism: Processes model layers in stages.
• Hybrid Approaches: Combines schemes (e.g., ZeRo, HeiPipe).
• Hardware Support: GPUs for learners, CPUs for actors, FPGAs for tasks.
Distributed Synchronization

• Goal: Synchronize backpropagation-based training.

• Methods:
• Synchronous: Stable but slower (e.g., IMPALA).
• Asynchronous: Faster but less stable (e.g., A3C, APE-X).
• Prioritized Experience Replay: Focuses on high-error samples.
• Innovation: Gossip-based peer-to-peer synchronization.
Deep Evolutionary Reinforcement
Learning

• Approach: Evolution-based training avoids local optima.

• Techniques:
• Evolution Strategies: Scalable RL alternative.
• Neural Architecture Search: Evolves network topologies.
• Population-Based Training: Enhances policy diversity.
• Pros: Robust, scalable. Cons: Computationally expensive.
Advanced Parallelism Techniques

• Pipeline Parallelism:
• Splits model layers into stages for pipelined processing.
• Example: HeiPipe for DRL with layered neural networks.
• Hybrid Parallelism:
• Combines data, model, and pipeline parallelism.
• Example: ZeRo optimizes memory and computation.
• DRL Adaptation: Handles dynamic workloads from environment interactions.
Hardware Acceleration for Parallelism

• Hardware Roles:
• GPUs: Accelerate learner gradient computations.
• CPUs: Handle actor environment interactions.
• FPGAs: Optimize specific tasks (e.g., FA3C, QtAccel) .
• Benefits: Reduces training time (e.g., GPU-based simulations in robotics).
• Challenges: Hardware heterogeneity requires tailored frameworks.
Distributed
Synchronization
• Goal: Synchronize backpropagation-based training across workers.
• Methods:
• Synchronous: Stable, slower (e.g., IMPALA).
• Asynchronous: Faster, less stable (e.g., A3C, APE-X).
• Prioritized Experience Replay: Focuses on high-error samples.
• Innovation: Gossip-based synchronization for peer-to-peer scalability.
Open-Source Platforms

• Overview: 16 libraries compared for DRL development.

• Key Examples:
• Ray RLlib: Scalable RL framework.
• SampleFactory: Fine-grained worker optimization.
• Fiber: Supports population-based methods.
• Evaluation: Usability, scalability, algorithm support, hardware
compatibility.
Future Research Directions

• Fine-Grained Workers: Task-specific roles (e.g., Actor, Policy, Trainer).

• Gossip-Based Architectures: Scalable peer-to-peer communication.
• LLM Integration: Enhancing RL with language model feedback.
• Gaps:
• Balancing actor-learner inference.
• Scalable simulations.
• Hybrid optimization (backpropagation + evolution).
Case Studies in Parallel DRL
• IMPALA: Scales to thousands of CPU cores for fast sample generation .
• APE-X: Achieves high throughput with prioritized replay .
• DD-PPO: Distributed PPO for multi-machine scalability .
• Impact: Reduces training time from days to hours for complex tasks.
Conclusion

1 2 3 4
Summary Impact Contribution: Closing
DRL acceleration Enables faster training Comprehensive survey Distributed DRL
leverages for robotics, autonomous with taxonomy and innovation will drive AI
architectures, driving, and more. future directions. advancements.
parallelism,
synchronization, and
evolutionary
methods.
References
• Liu, Z., Xu, X., Qiao, P., & Li, D. (2023). Acceleration for Deep Reinforcement
Learning using Parallel and Distributed Computing: A Comprehensive Survey.
ACM Computing Surveys, November 2023

(Tahsin) PCD
No ratings yet
(Tahsin) PCD
21 pages
Advanced Systemdesign 2023
No ratings yet
Advanced Systemdesign 2023
65 pages
With Serverless Computing
No ratings yet
With Serverless Computing
9 pages
Notes For Deep Learning
No ratings yet
Notes For Deep Learning
6 pages
Deep Learning (DL) - Comprehensive Summary
No ratings yet
Deep Learning (DL) - Comprehensive Summary
9 pages
DL Unit 5 Perfect Pdf. - 1
No ratings yet
DL Unit 5 Perfect Pdf. - 1
17 pages
DL Theory Syllabus
No ratings yet
DL Theory Syllabus
3 pages
Deep Learning Frameworks & Techniques
No ratings yet
Deep Learning Frameworks & Techniques
5 pages
Deep Reinforcement Learning An Overview
No ratings yet
Deep Reinforcement Learning An Overview
30 pages
Deep Reinforcement Learning Overview
No ratings yet
Deep Reinforcement Learning Overview
30 pages
Deep Learning and Neural Networks
No ratings yet
Deep Learning and Neural Networks
1 page
Real-Time Machine Learning: The Missing Pieces
No ratings yet
Real-Time Machine Learning: The Missing Pieces
6 pages
Lecture 16 Meta Learning
No ratings yet
Lecture 16 Meta Learning
39 pages
Detailed Performance Analysis of Distributed Tensorflow On A GPU Cluster Using Deep Learning Algorithms
No ratings yet
Detailed Performance Analysis of Distributed Tensorflow On A GPU Cluster Using Deep Learning Algorithms
8 pages
Deep Reinforcement Learning
No ratings yet
Deep Reinforcement Learning
1 page
Ray: A Distributed Framework For Emerging AI Applications
No ratings yet
Ray: A Distributed Framework For Emerging AI Applications
19 pages
Deep Learning Concise Notes
No ratings yet
Deep Learning Concise Notes
4 pages
NN DL Unit - III
No ratings yet
NN DL Unit - III
19 pages
Deep Learning on GPU Clusters
No ratings yet
Deep Learning on GPU Clusters
50 pages
Demystifying Parallel and Distributed Deep Learning
No ratings yet
Demystifying Parallel and Distributed Deep Learning
43 pages
Deep Learning
No ratings yet
Deep Learning
10 pages
Neural Networks & Deep Learning Makaut & & 7th SemNotes
No ratings yet
Neural Networks & Deep Learning Makaut & & 7th SemNotes
36 pages
20IT7301 - Deep Learning Syllabus
No ratings yet
20IT7301 - Deep Learning Syllabus
3 pages
clc02 Nvmhoang Ass3
No ratings yet
clc02 Nvmhoang Ass3
26 pages
AI
No ratings yet
AI
11 pages
Chapter1. Introduction To Deep Learning
No ratings yet
Chapter1. Introduction To Deep Learning
21 pages
Rldist
No ratings yet
Rldist
10 pages
Deep Learning Fundamentals
No ratings yet
Deep Learning Fundamentals
19 pages
Deep Learning-1
No ratings yet
Deep Learning-1
20 pages
Rlpyt: A Research Code Base For Deep Reinforcement Learning in Pytorch
No ratings yet
Rlpyt: A Research Code Base For Deep Reinforcement Learning in Pytorch
12 pages
Deep Learning Essentials for Tech Enthusiasts
No ratings yet
Deep Learning Essentials for Tech Enthusiasts
3 pages
Aula 1 T
No ratings yet
Aula 1 T
4 pages
Large-Scale Deep Learning With Tensorflow: Jeff Dean Google Brain Team
No ratings yet
Large-Scale Deep Learning With Tensorflow: Jeff Dean Google Brain Team
119 pages
Deep Learning in Neural Networks An Overview
No ratings yet
Deep Learning in Neural Networks An Overview
89 pages
Torchrec
No ratings yet
Torchrec
20 pages
T RL: Efficient Deep Reinforcement Learning With Polyhedral Dependence Graphs
No ratings yet
T RL: Efficient Deep Reinforcement Learning With Polyhedral Dependence Graphs
17 pages
DGM Mid Sem
No ratings yet
DGM Mid Sem
39 pages
DL 1
No ratings yet
DL 1
20 pages
Deep Learning UNIT 5
No ratings yet
Deep Learning UNIT 5
182 pages
Csa4020 Deep-Learning LP 1.0 22 Csa4020 Deep-Learning LP 1.0 1 Deep Learning
No ratings yet
Csa4020 Deep-Learning LP 1.0 22 Csa4020 Deep-Learning LP 1.0 1 Deep Learning
2 pages
PGM in Modern AI Approaches
No ratings yet
PGM in Modern AI Approaches
14 pages
Deep Reinforcement Learning
No ratings yet
Deep Reinforcement Learning
7 pages
DLBench A Comprehensive Experimental Evaluation of
No ratings yet
DLBench A Comprehensive Experimental Evaluation of
23 pages
Deep Reinforcement Learning in Computer Vision: A Comprehensive Survey
No ratings yet
Deep Reinforcement Learning in Computer Vision: A Comprehensive Survey
103 pages
15 ML
No ratings yet
15 ML
60 pages
Various Paradigms of Learning Problems
100% (1)
Various Paradigms of Learning Problems
14 pages
RL Decision
No ratings yet
RL Decision
40 pages
3rd Unit DL Final Class Notes
No ratings yet
3rd Unit DL Final Class Notes
78 pages
Deep Learing
No ratings yet
Deep Learing
37 pages
Anna University Aiml
No ratings yet
Anna University Aiml
3 pages
Review of Deep Learning Algorithms and Architectur
No ratings yet
Review of Deep Learning Algorithms and Architectur
29 pages
Deep Learning
No ratings yet
Deep Learning
5 pages
IntroductionToAISystems
No ratings yet
IntroductionToAISystems
29 pages
A Brief Survey of Deep Reinforcement Learning
No ratings yet
A Brief Survey of Deep Reinforcement Learning
16 pages
Deep Learning Module-01
No ratings yet
Deep Learning Module-01
17 pages
Deep Reinforcement Learning Mohit Sewak
No ratings yet
Deep Reinforcement Learning Mohit Sewak
6 pages
Tahsin - Amin (Software Testing & Quality Assurance)
No ratings yet
Tahsin - Amin (Software Testing & Quality Assurance)
27 pages
FF 44
No ratings yet
FF 44
11 pages
Random Numbers
No ratings yet
Random Numbers
127 pages
Circuit Simulation 1
No ratings yet
Circuit Simulation 1
11 pages
2022 Resit Solution
No ratings yet
2022 Resit Solution
12 pages
Electives For E-MTech AI DSE 1 IIT Patna 2024 Decembter
No ratings yet
Electives For E-MTech AI DSE 1 IIT Patna 2024 Decembter
23 pages
Offline Critic-Guided Diffusion Policy For Multi-User Delay-Constrained Scheduling
No ratings yet
Offline Critic-Guided Diffusion Policy For Multi-User Delay-Constrained Scheduling
34 pages
A Futures Quantitative Trading Strategy Based On A Deep Reinforcement Learning Algorithm
No ratings yet
A Futures Quantitative Trading Strategy Based On A Deep Reinforcement Learning Algorithm
5 pages
基于深度强化学习的多智能体协同算法关键技术研究王思颖
No ratings yet
基于深度强化学习的多智能体协同算法关键技术研究王思颖
155 pages
Robotics Engineer Resume - Meghdeep Jana
100% (1)
Robotics Engineer Resume - Meghdeep Jana
1 page
Virtual Rodent Models Neural Activity
No ratings yet
Virtual Rodent Models Neural Activity
55 pages
Reinforcement Learning Applications
No ratings yet
Reinforcement Learning Applications
10 pages
Pfe Book 2024
No ratings yet
Pfe Book 2024
17 pages
Deep Reinforcement Learning-Based Collaborative Vi
No ratings yet
Deep Reinforcement Learning-Based Collaborative Vi
16 pages
Energy Plus With RL
No ratings yet
Energy Plus With RL
112 pages
Reinforcement Learning For Cyber-Physical Systems: Xing Liu, Hansong Xu, Weixian Liao, and Wei Yu
No ratings yet
Reinforcement Learning For Cyber-Physical Systems: Xing Liu, Hansong Xu, Weixian Liao, and Wei Yu
10 pages
(Synthesis Lectures On Artificial Intelligence and Machine Learning) Philip Osborne, Kajal Singh, Matthew E. Taylor - Applying Reinforcement Learning On Real-World Data With Practical Examples in Pyth
No ratings yet
(Synthesis Lectures On Artificial Intelligence and Machine Learning) Philip Osborne, Kajal Singh, Matthew E. Taylor - Applying Reinforcement Learning On Real-World Data With Practical Examples in Pyth
105 pages
Flexible Job-Shop Scheduling Via Graph Neural Network and Deep Reinforcement Learning
No ratings yet
Flexible Job-Shop Scheduling Via Graph Neural Network and Deep Reinforcement Learning
11 pages
Transfer Learning in Deep Reinforcement Learning A Survey
No ratings yet
Transfer Learning in Deep Reinforcement Learning A Survey
19 pages
Reinforcement Learning in AI
No ratings yet
Reinforcement Learning in AI
4 pages
1 s2.0 S0957417423009971 Main
No ratings yet
1 s2.0 S0957417423009971 Main
32 pages
Ai 4 All
No ratings yet
Ai 4 All
18 pages
4.ED-DQN An Event-Driven Deep Reinforcement Learning Control Method For Multi-Zone Residential Buildings
No ratings yet
4.ED-DQN An Event-Driven Deep Reinforcement Learning Control Method For Multi-Zone Residential Buildings
17 pages
DRL for Low-Carbon Edge Computing
No ratings yet
DRL for Low-Carbon Edge Computing
11 pages
1 s2.0 S2215098621000070 Main
No ratings yet
1 s2.0 S2215098621000070 Main
12 pages
Human-Level Control Through Deep Reinforcement Learning - Nature
No ratings yet
Human-Level Control Through Deep Reinforcement Learning - Nature
11 pages
Lecture 7
No ratings yet
Lecture 7
52 pages
Continuous Deep Q-Learning With Model-Based Acceleration: Shixiang Gu Timothy Lillicrap Ilya Sutskever Sergey Levine
No ratings yet
Continuous Deep Q-Learning With Model-Based Acceleration: Shixiang Gu Timothy Lillicrap Ilya Sutskever Sergey Levine
10 pages
Sustainability 16 01278
No ratings yet
Sustainability 16 01278
15 pages
18 Deeprl
No ratings yet
18 Deeprl
19 pages
Digital Twin for Optical Communication
No ratings yet
Digital Twin for Optical Communication
6 pages
Deep RL Movie Recommendation System
No ratings yet
Deep RL Movie Recommendation System
5 pages
Deep Reinforcement Learning-Based Autonomous Navigation of Mobile Robots in Smart Factory
No ratings yet
Deep Reinforcement Learning-Based Autonomous Navigation of Mobile Robots in Smart Factory
56 pages
Deep Learning for Transport & Health
No ratings yet
Deep Learning for Transport & Health
9 pages

(Shifar) - Parallel and Distributed Computing

Uploaded by

(Shifar) - Parallel and Distributed Computing

Uploaded by

Acceleration for Deep Reinforcement Learning using

Parallel and Distributed Computing: A Comprehensive

Course Title: Parallel and Distributed Computing

• Overview: Deep Reinforcement Learning (DRL) merges deep learning and

• Definition: DRL involves agents learning optimal policies through

• Uses known or learned environment dynamics (e.g., MB-MPO, AlphaZero).

• Value-based (e.g., DQN), policy-based, or actor-critic (e.g., PPO, SAC).

On-Policy vs. Off-Policy:

• On-policy: Stable, less sample-efficient.

Sample Generation: Producing billions of

Optimization Limits: Stochastic gradient descent

• Data Parallelism: Splits data across workers with model replicas.

• Goal: Synchronize backpropagation-based training.

• Approach: Evolution-based training avoids local optima.

• Overview: 16 libraries compared for DRL development.

• Fine-Grained Workers: Task-specific roles (e.g., Actor, Policy, Trainer).

You might also like