도서상세보기

도서명 파이토치와 유니티 ML-Agents로 배우는 강화학습 : 응용편
저자 민규식, 이현호, 박유민
출판사 위키북스
출판일 2025-01-10
정가 38,000원
ISBN 9791158395490
수량

00장: 유니티와 ML-Agents 설치하기
유니티와 ML-Agents 설치하기
유니티 허브 다운로드 및 설치
유니티 라이선스 활성화
유니티 에디터 설치
ML-Agents 설치
ML-Agents 파일 내려받기
유니티에 ML-Agents 설치하기
ML-Agents 파이썬 패키지 설치하기

01장: 유니티와 ML-Agents 설치하기
1.1 프로젝트 시작하기
1.2 닷지 환경 구성하기
1.3 스크립트 작성하기
1.3.1 스크립트 파일 생성 및 설정
1.3.2 DodgeScene 스크립트
1.3.3 BallScript 스크립트
1.3.4 Area 스크립트
1.3.5 DodgeAgent 스크립트
1.4 닷지 환경 설정 및 환경 빌드

02장: Proximal Policy Optimization (PPO
2.1 PPO 알고리즘의 개요
2.2 PPO 알고리즘의 이론
2.2.1 PPO 알고리즘의 목적함수
2.2.2 PPO의 분산학습
2.2.3 PPO의 네트워크 구조
2.2.4 PPO 알고리즘의 학습
2.2.5 PPO 알고리즘의 성능
2.3 PPO 코드
2.3.1 라이브러리 불러오기
2.3.2 파라미터 값 설정
2.3.3 Model 클래스
2.3.4 Agent 클래스
2.3.5 Main 함수
2.3.6 학습 결과
2.4 mlagents-learn (파라미터 랜덤화
2.5 커리큘럼 학습
2.5.1 mlagents-learn을 이용한 커리큘럼 학습
2.5.2 Python-API를 이용한 커리큘럼 학습

03장: 가변적인 입력 환경과 어텐션
3.1 가변적인 입력 환경의 개요
3.2 닷지 환경 수정(가변적인 입력 환경
3.3 어텐션 기법의 이론
3.3.1 멀티 헤드 어텐션
3.3.2 강화학습에서 어텐션의 적용
3.4 어텐션 PPO 코드
3.4.1 라이브러리 불러오기
3.4.2 파라미터 값 설정
3.4.3 Model 클래스
3.4.4 Agent 클래스
3.4.5 Main 함수
3.4.6
이 책에서 다루는 내용

응용 강화학습 환경 제작: 닷지, 퐁, 방탈출, 메이즈, 투 미션
응용 강화학습 알고리즘과 이를 응용하기 위한 기법들의 이론 및 학습 코드 구현: PPO, Attention,RND, MA-POCA, HyperNetworks
분산 학습, 커리큘럼 학습, 가변 입력 환경, 자가 학습, 멀티에이전트, 어려운 탐험 환경, 다중 골 환경 등 ML-Agents를 이용한 다양한 학습 방법 제공
Python API와 mlagents-learn을 통한 응용 강화학습 알고리즘 설정 및 학습 방법