머신러닝 강화학습은 위와 같은 사이클로 동작한다. Agent는 테스트 환경을 관찰하여 데이터를 얻고(Observation), 그걸 바탕으로 결정을 내린다(Decision). 결정은 바로 행동으로 이어지고(Action), 행동이 테스트 의도와 맞을 경우 보상을 받는다(Reward). 이러한 과정의 반복을 통해 Agent는 어떤 결정과 행동이 가장 높은 결과를 내는지 학습한다. ML-Agents를 이용하여 간단한 머신러닝을 해보자. 파란색 네모는 Player Agent, 하얀색 구는 Goal이다. Player가 Goal에 도달하는 것이 목적인 게임이다. # MoveToGoalAgent.cs using Unity.MLAgents; public class MoveToGoalAgent : Agent { } Uni..