Skip to content

reinforcement-learning-kr/Unity_ML_Agents_2.0

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Unity ML-Agents 2.0

이 레포지토리는 Reinforcement Learning Korea의 유니티 머신러닝 에이전트 튜토리얼 제작 프로젝트의 결과로 제작된 강의들을 위한 자료들을 포함하고 있습니다. 본 레포에서는 다음의 강의에 대한 자료를 제공합니다.

이 레포는 본 강의에서 제작하는 유니티 ML-Agents(Github) 환경들의 빌드파일과 유니티 프로젝트 파일을 제공합니다. 또한 제공된 환경들에서 에이전트를 학습하기 위한 심층강화학습 알고리즘을 제공합니다.

버전 정보

최근 Unity ML-Agents와 numpy 버전 변화에 따라 강의 진행하던 버전과 조금 버전 변경이 발생하였습니다.
아래와 같은 버전으로 진행 부탁드립니다!

  • Python 3.9
  • Pytorch 2.0, 2.1
  • Unity 2022.1.18, 2022.3.4
  • ML-Agents 2.3 (Unity Package)
  • ML-Agents 0.30.0 (Python Package)

그리고 특정 라이브러리들의 경우 사용해야 하는 버전이 정해져있으므로 설치 이후에 아래 명령어 입력 부탁드립니다!

  • pip install protobuf==3.19.6 numpy==1.23.5 onnx==1.11.0

사용법

pip install -r requirements.txt
cd agents
python **.AGENT.py # 예시: python 04.dqn.py

디렉토리 구조 설명

├─ agents           # 에이전트 학습 스크립트 관리
├─ config           # ml-agents 내장 알고리즘 config.yaml 관리
├─ demo             # demonstration 관리
├─ envs             # 빌드된 환경 관리
├─ resrc            # README 이미지 관리
└─ unity_project    # 환경의 유니티 프로젝트 관리

알고리즘

모든 알고리즘은 파이썬과 파이토치를 통해 작성되었습니다. 본 강의에서 제공하는 심층강화학습 알고리즘은 다음과 같습니다.

기초편

  1. Deep Q Network (DQN)
  2. Advantage Actor Critic (A2C)
  3. Deep Deterministic Policy Gradient (DDPG)
  4. Behavioral Cloning (BC)

응용편

  1. Proximal Policy Optimization (PPO)
  2. Attention PPO
  3. Adversarial PPO
  4. MA-POCA
  5. Exploration by RND
  6. HyperNetworks

환경

모든 환경은 유니티와 유니티 머신러닝 에이전트를 통해 제작되었습니다. 다음과 같은 환경들의 제작 방법에 대해 강의합니다. 각 환경과 해당 환경에 대한 학습 결과는 다음과 같습니다.

기초편

1. 그리드월드
Gridworld

2. 드론
Drone

3. 카트 레이싱
KartRacing

응용편

1. 닷지
Dodge

2. 퐁
Pong

3. 방탈출
EscapeRoom

4. 메이즈
Maze

5. 투 미션
TwoMission

About

Repository for implementing Unity ML-Agents 2.0

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published