본문 바로가기

책 소개

[강화학습 및 자율주행 입문서] Reinforcement Learning for Sequential Decision and Optimal Control

 

소개글

 

  인공지능의 발전은 인류 사회의 많은 영역에 중요한 영향을 끼치고 있습니다. 그 중에서도 강화학습(Reinforcement Learning, RL)은 인공지능의 하나의 핵심 기술 중 하나로, 학계와 산업 분야에서 큰 주목을 받고 있습니다. 강화학습의 성공 사례로는 이세돌 바둑 기사를 이기는데 성공한 알파고(AlphaGo)부터 현재 많은 사람들이 이용하고 있는 챗 지피티(ChatGPT) 등이 있습니다. 이처럼 강화학습은 이미 복잡한 의사결정과 제어 문제를 다루는데 있어서 막대한 잠재력을 갖고 있음이 다양한 사례를 통해 증명되었습니다.

 

  본 책은 강화학습의 핵심 원리를 체계적으로 이해하고 싶은 엔지니어들과 학자들을 위한 지침서입니다. 강화학습의 기반을 이루는 개념을 분석하고 다양한 알고리즘과 응용 사례를 상세하게 제시함으로써, 이 분야에 입문하는 사람들에게 친숙하면서도 체계적인 정보를 제공하고자 합니다. 이 책은 강화학습을 전체적으로 탐험하고 그 핵심을 꿰뚫고 싶은 독자들에게 귀중한 지침서 역할을 할 것입니다.

 

해당 서적에 대한 자세한 내용은 위 QR코드를 스캔하여 해당 웹사이트에서 확인하실 수 있습니다.

 

 

작가의 말

 

  친애하는 독자 여러분, 점차 복잡해지는 의사 결정과 제어 문제는 산업 분야에서 더욱 중요성을 띠고 있습니다.이에 따라 인간 뇌의 학습 메커니즘을 모방하는 강화 학습 기술은 다양한 응용 가능성을 제시하고 있습니다. 그러나 강화 학습에서의 수학적 지식은 복잡하고 제어해야 하는 시스템 또한 복잡하여, 실제 엔지니어링에서의 적용에는 다양한 어려움이 동반됩니다.

 

  이러한 어려움을 극복하기 위해 저는 칭화대학교에 개설된 ‘강화학습과 시스템제어’ 대학원 과정에서 가르쳤던 내용을 참고하여 이 교육 참고서를 저술했습니다. 이 책을 집필하는 과정에서 업계 전문가와 학계의 의견을 종합하여 포괄적이면서도 간결하며 실용적인 내용을 담기 위해 최선을 다하였습니다. 이 책을 통해 강화 학습의 핵심 개념을 체득하고 다양한 알고리즘을 효과적으로 활용하여 실제 산업 제어 문제를 해결하는 역량을 키우시길 바랍니다. 이 책과 함께하는 공부가 즐겁고 유익한 경험이 되길 기원합니다.

 

 

책 소개

 

  이 책은 원리 분석과 주요 알고리즘, 실제 사례의 구조를 기반으로 동적 시스템의 결정과 제어에서의 강화학습 방법을 체계적으로 설명합니다. 전체 11개의 장으로 구성되어 있으며, 강화학습의 기본적인 개념부터 몬테카를로 방법(Monte Carlo Method), 시계열을 차분하는 방법, 동적 프로그래밍(Dynamic Programming), 함수 근사법 (Function Approximation), 정책 경사 하강법 (Policy Gradient Method), 근사 동적 프로그래밍(Approximate Dynamic Programming), 상태 제약조건의 처리 및 신경망 기반 강화학습 등의 내용을 다룹니다.

 

  이 책은 주로 공학과 산업 응용 및 연구에 종사하는 연구원과 기술자를 대상으로 작성되었습니다. 공학 영역에서 필요한 내용을 포괄적으로 설명하며, 강화학습의 기본 원리와 심층적인 지식을 모두 다루는 것을 목표로 하고 있습니다. 또한, 강화학습에 입문하는 입문하려는 초보자부터 심화학습을 원하는 중급자까지 다양한 수준의 독자를 위해 적합한 서적입니다.

 

 

작가 소개

 

이승보 (Shengbo Eben Li)

 

  저자는 현재 칭화대학교에서 교수와 박사 지도 교수, 그리고 칭화대학교 차량공학원의 부원장을 역임하고 있습니다. 또한, 스탠포드 대학교(Stanford University), 미시간 대학교(Michigan University), 그리고 UC버클리(University of California, Berkeley)에서 유학 경험을 가지고 있습니다. 저자는 자율주행 및 강화학습, 최적제어 등의 영역에서 연구를 진행하고 있습니다.

 

  현재까지 논문 131여편을 게재하였으며, 총 인용 횟수는 16000회 이상이며, H-index는 62입니다. 그 뿐만 아니라 학술회의에서 우수논문상을 10회 이상 수상한 경력을 가지고 있습니다. 더불어 중국 자동화 학회 자연과학 분야 1등상, 중국 차량공학 과학연구 진보특별상, 중국 국가과학연구진보 2등상, 국가 기술 발명 2등상 등을 포함한 다양한 수상 경력이 있습니다.

 

  국가 수준에서도 뛰어난 업적을 인정받아 국가급 고급 과학 기술 혁신 선도 인재상, 교통 운수 산업 분야의 청년 과학 기술 혁신 선도 인재상, 중국 자동차 산업 우수 청년 과학 인재상 등을 수상한 바 있습니다. 더불어 제1회 북경 자연과학 기금회에 선정되기도 했습니다.

 

  마지막으로 저자는 IEEE ITS Society BOG 위원 및 중국자동차공학회 청년 공학 위원회 초대 주임, 그리고 IEEE OJ ITS 선임부편집장과 IEEE Trans on ITS/IEEE ITS Mag 부편집장 등을 맡아 역임한 경력이 있습니다. 이러한 업적과 경험을 바탕으로 저자는 강화학습과 관련된 교육 및 연구 분야에서 높은 영향력을 발휘하고 있습니다.

 

 

책 목차

 

 

구매 링크

https://www.amazon.com/Reinforcement-Learning-Sequential-Decision-Optimal/dp/9811977836

 

Amazon.com

Enter the characters you see below Sorry, we just need to make sure you're not a robot. For best results, please make sure your browser is accepting cookies.

www.amazon.com

해당 서적은 위 아마존 링크에서 해외 직구를 통해 구매하실 수 있습니다.