반응형
https://arxiv.org/abs/2305.19165
https://sites.google.com/view/strategic-reasoning-llms/
1. 전략적 추론은 에이전트가 다양한 상황에서 다른 에이전트와 협력, 의사소통, 경쟁할 수 있도록 합니다. 기존의 전략 게임 해결 접근법은 광범위한 훈련에 의존하여, 새로운 시나리오나 게임에 일반화하지 못하는 전략을 만들어냅니다. 복잡하고 맥락이 풍부한 언어를 이해하고 생성할 수 있는 큰 언어 모델(Large Language Models, LLM)은 전략적 게임플레이 도구로서 강력할 수 있습니다.
2. 이 논문에서는 사전 훈련된 LLM을 몇 가지 샷의 사고 과정 예시와 함께 사용하여 AI 에이전트의 전략적 추론을 가능하게 하는 접근법을 소개합니다. 우리의 접근법은 상태, 가치, 믿음에 대해 추론하는 체계적으로 생성된 시연을 사용하여 모델을 유도합니다.
3. 단순한 행렬 게임의 광범위한 변형을 사용하여, 체계적으로 생성된 프롬프트에 기반한 전략이 새로운 게임 구조, 대체 목표, 숨겨진 정보에 거의 완벽하게 일반화된다는 것을 보여줍니다. 또한, 추가 훈련이나 미세 조정 없이도 우리의 접근법이 현실적인 시나리오에서 인간 같은 협상 전략을 이끌어낼 수 있음을 보여줍니다. 우리의 결과는 체계적인 추론 시연에 의해 지도된 LLM이 다양한 전략적 시나리오에 적응하고 뛰어날 수 있는 능력을 강조합니다.
'AI > etc' 카테고리의 다른 글
사전교육을 받은 트랜스포머의 새로운 모듈화 (0) | 2023.05.31 |
---|---|
PDF에서 텍스트를 읽는 최초의 ChatGPT 플러그인 출시 (0) | 2023.05.31 |
앤드류 응 "AI 발전이 더 빨라지도록 합시다" (0) | 2023.05.31 |
생성 후 선택: World Knowledge가 안내하는 개방형 시각적 질문 답변 (0) | 2023.05.31 |
과거를 상상하여 미래를 추론 (0) | 2023.05.30 |