[머신러닝] 6. 강화학습 (reinforcement learning)

강화학습 (reinforcement learning)

Reinforcement - 강화, 증강

강화학습의 핵심은 일단 해보는 것!!

지도학습 강화학습
배움 경험

1. 강화학습의 과정

[그림]

image-20200825012154745

이런 과정을 반복하면 판단력이 점점 강화됩니다.
이것이 현실에서 게임의 실력자가 되는 과정입니다.

생각해보면 배우지 않고도 결국에 잘하게 되는
많은 일들이 이런 과정을 통해서 이루어집니다.

강화학습은 이러한 과정을 모방해서
기계를 학습시키는 것입니다.

이 과정을 강화학습에서 사용하는 용어로만 바꾸면
여러분은 강화학습이 무엇인지 아는 사람이 되는것입니다.

[강화학습 용어]

image-20200825012446492

강화학습에서는 더 많은 보상을 받을 수 있는 정책을 만드는 것이 핵심

이렇게 만들어진 정책은 게임의 인공지능 플레이어를 만드는데 사용될 수 있다.
바둑으로 인간을 이긴 알파고가 바로 강화학습을 통해서 구현된 소프트웨어입니다.

자동차의 자율주행 기능도 강화학습을 이용해서 만들어집니다.

스스로 수련을 통해서 더 좋은 선택을 하는 기능이 필요하다면 강화학습을 연구해보세요.

경험할수록 알아서 똑똑해지는 기계를 만들 수 있습니다.