sysper b784c0fd750a4db78117c64e2f49c15e
원산지 | 해외 |
---|---|
개발자 | MineRL project |
저작권 | 알 수 없음 |
자료 출처 | https://minerl.io/ |
MineRL
간단하게 설명하자면, 특정 장소로 이동하는 것, 나무를 캐고 양을 사냥해 침대를 만드는 것, 고기를 굽는 것, 철 곡괭이를 만드는 것,
심지어는 다이아몬드를 캐는 것 등의 목표를 설정하여 인공지능을 학습시키는 것을 보조해주는 매우 방대한 데이터셋입니다.
이 논문에서 관련된 학술적인 설명을 볼 수 있습니다.
홈페이지 설명을 번역하자면,
상태를 나타내는 데이터가 매우 다양한 심층강화학습(deep RL)은 데이터들을 잘 활용하기가 어려워, 실제 세상의 문제에 적용시키기에는 한계가 있습니다. 이를 해결하기 위한 방법 중 하나는 인간의 행동 샘플을 사용하는 것입니다. 이는 그렇지 않은 경우보다 더 적은 수의 샘플을 필요로 하지만 아직 연구된 바가 적습니다. 컴퓨터 비전 및 자연어 처리 학계에서 입증된 바와 같이, 대규모의 데이터셋은 이와 관련하여 새로운 방법에 대한 실험 및 벤치마킹 플랫폼 역할을 함으로써 연구를 촉진시킬 수 있습니다.
그러나 강화학습 시뮬레이터와 호환되는 기존 데이터셋은 이전에 말한 인간의 행동 샘플을 활용하는 방법의 개발에 사용하기에 충분한 규모와 품질을 가지지 않습니다. 따라서 우리는 대규모 인간 샘플 데이터셋인 MineRL을 소개합니다. MineRL의 데이터셋은 동적인 3D 오픈 월드 환경인 Minecraft의 다양한 작업에 걸친 6천만 개 이상의 상태-동작 쌍으로 구성됩니다. 우리는 이를 통하여 Minecraft와 같은 환경에서의 강화학습의 어려움과 함께 MineRL이 그 안에서 주요 연구 과제를 해결하기 위한 기술을 개발할 수 있는 잠재력을 시사합니다.
홈페이지에서 학습에 필요한 데이터셋 및 다이아몬드 챌린지 등의 대회와 도큐먼트 등 자세한 설명을 확인할 수 있습니다.
대회 또한 주기적으로 개최되고 있으니, 관심있는 분들께서는 확인해보시길 바랍니다.
혹시나 마인크래프트를 활용한 (혹은 활용하지 않더라도) 강화 학습에 관심있는 분들이 계시다면 댓글 부탁드립니다. 수요가 있다면 강화학습 관련 강좌를 게시할 의향도 있습니다.
댓글이 없습니다.
새로운 댓글을 등록해 주세요!