AI/etc

언어 모델이 약한 에이전트를 가르칠 수 있습니까? 마음의 이론을 통해 학생들을 향상시키는 교사 설명

유로파물고기 2023. 6. 18. 22:53
반응형

https://arxiv.org/abs/2306.09299

 

Can Language Models Teach Weaker Agents? Teacher Explanations Improve Students via Theory of Mind

Large Language Models (LLMs) perform complex reasoning by generating explanations for their predictions. However, a complementary goal of explanations is to also communicate useful knowledge that improves weaker agents. Hence, we investigate whether LLMs a

arxiv.org

 

1. 대형 언어 모델(LLM)은 예측에 대한 설명을 생성하여 복잡한 추론을 수행합니다. 그러나 설명의 보완적인 목표는 또한 약한 에이전트들의 성능을 향상시키는 유용한 지식을 전달하는 것입니다. 따라서, 우리는 LLM이 약한 에이전트들에게 좋은 교사가 될 수 있는지를 조사합니다.

 

2. 특히, 두 LLM 에이전트 사이의 학생-교사 프레임워크를 고려하고, 교사가 학생의 성능을 향상시키기 위해 자연어 설명으로 언제, 어떻게 개입해야 하는지 연구합니다. 의사소통은 비용이 많이 들기 때문에, 교사가 데이터의 일부만 설명하도록 예산을 설정하고, 그 후에는 학생이 스스로 잘 수행할 수 있도록 합니다.

 

3. 우리는 먼저 교사 LLM이 실제로 학생의 추론에 개입하여 그들의 성능을 향상시킬 수 있다는 것을 보여줍니다. 다음으로, 교사가 학생의 특정한 설명을 개인화하여 비개인화된 교사를 능가하고, 설명된 데이터에서 학습하는 것이 미래의 설명되지 않은 데이터에서의 학생 성능을 향상시킨다는 것을 보여줍니다. 마지막으로, 우리는 고의적으로 학생들을 오도하는 잘못된 교사들이 학생들의 성능을 무작위 선택 수준으로 낮출 수 있다는 것을 확인합니다.