안드레아 론자 : 알라딘

헤더배너

분야보기

알라딘 굿즈

온라인중고

1/0 photos

신간알리미 신청

상품평점

분류

이름:

안드레아 론자 (Andrea Lonza)

	최근작
	2021년 8월 <파이썬 기반 강화학습 알고리듬>

안드레아 론자(Andrea Lonza)

대표작

파이썬 기반 강화학습 알고리듬

저자의 말

<파이썬 기반 강화학습 알고리듬> - 2021년 8월 더보기

강화학습은 변화하는 요구 사항에 근거해 이상적 행동을 자동으로 결정할 수 있는 스마트한 모델과 에이전트를 만드는 인기 있고 유망한 인공지능 분야다. 이 책은 에이전트를 개발할 때 강화학습 알고리듬을 마스터하고 구현하는 것을 이해할 수 있도록 도와준다. 강화학습 환경에서 작업해야 하는 도구, 라이브러리, 셋업 소개를 시작으로 강화학습의 빌딩 블록을 다루고 Q-러닝과 SARSA 알고리듬을 응용하는 (등의) 가치 기반 메소드를 상세하게 알아본다. 복잡한 문제를 해결하기 위해 Q-러닝과 신경망의 조합을 이용하는 방법을 소개한다. DDPG와 TD3 같은 결정적 알고리듬을 학습하기 전에 성능과 안정성을 개선하기 위한 폴리시 그래디언트 메소드, TRPO, PPO를 학습할 것이다. 또한 이미테이션 학습 기술이 작동하는 방법과 DAgger가 에이전트를 훈련시키는 방법을 다룬다. 진화 전략과 블랙박스 최적화 기술을 다룬 다음, UCB와 UCB1 같은 탐색 접근법을 학습하고 ESBAS라는 메타 알고리듬을 개발해본다. 이 책을 마칠 시점에는 현실 문제를 해결하기 위해 강화학습 알고리듬을 활용할 수 있는 역량을 갖추고 강화학습 연구 모임에 참여할 수 있을 것이다.

주제 분류별

소설 l 에세이 l 시 l 희곡 l 문학일반 l 문화평론 l 만화 l 어린이/유아 l 인문/사회과학 l 역사 l 경제경영/자기계발 l 과학/공학/기술 l 여행 l 예술 l 취미/실용/레저 l 가정/건강/요리/교육 l 외국어/사전 l 잡지 l 종교/역학 l 컴퓨터/인터넷 l 학습서/수험서 l 교재 l 번역 l 사진/그림

가나다별

가 l 나 l 다 l 라 l 마 l 바 l 사 l 아 l 자 l 차 l 카 l 타 l 파 l 하 l 기타

	국내문학상수상자

	국내어린이문학상수상자

	해외문학상수상자

	해외어린이문학상수상자

(주)알라딘커뮤니케이션

대표이사 최우경 고객정보보호 책임자 최우경 사업자등록 201-81-23094 통신판매업신고 2003-서울중구-01520 이메일 privacy@aladin.co.kr 호스팅 제공자 알라딘커뮤니케이션 (본사) 서울시 중구 서소문로 89-31

ⓒ Aladin Communication. All Rights Reserved.

고객센터 1544-2514 (발신자 부담)

서울시 마포구 백범로 71 숨도빌딩 7층 Fax 02-6926-2600

1:1 문의 FAQ

중고매장 위치, 영업시간 안내