AI/Google&DeepMind

도구 제작자로서의 대규모 언어 모델

유로파물고기 2023. 5. 29. 10:51
반응형

설명

https://twitter.com/tianle_cai/status/1662988435114852352?s=20

 

트위터에서 즐기는 Tianle Cai

“LLMs can make their own tools just like humans🤖! Thrilled to share my intern work @Google. We introduced a closed-loop framework to let LLMs make and utilize reusable new tools🛠️ (implemented as programs). Paper: https://t.co/cOk3VZ47ka More det

twitter.com

 

https://arxiv.org/abs/2305.17126

 

Large Language Models as Tool Makers

Recent research shows the potential of enhancing the problem-solving ability of large language models (LLMs) through the use of external tools. However, prior work along this line depends on the availability of existing tools. In this work, we take an init

arxiv.org

1. 최근 연구는 외부 도구를 사용함으로써 대형 언어 모델(LLMs)의 문제 해결 능력을 향상시킬 수 있는 가능성을 보여주었습니다. 그러나 이전의 연구는 기존 도구의 유무에 크게 의존하고 있었습니다. 이번 연구에서는 LLMs As Tool Makers (LATM)라는 폐쇄 루프 프레임워크를 제안함으로써 이러한 의존성을 제거하는 방향으로 첫 단계를 밟습니다. 이는 LLMs가 문제 해결을 위한 재사용 가능한 도구를 스스로 만드는 곳입니다.

2. 우리의 접근법은 두 가지 주요 단계로 구성됩니다: 1) 도구 만들기: LLM이 주어진 작업을 위한 도구를 만드는 도구 제작자로 작동하며, 도구는 Python 유틸리티 함수로 구현됩니다. 2) 도구 사용하기: LLM이 문제 해결을 위해 도구 제작자가 만든 도구를 적용하는 도구 사용자로 작동합니다. 도구 사용자는 도구 제작자와 같은 LLM일 수도 있고 다른 LLM일 수도 있습니다.

3. 도구 제작이라는 과정은 LLM이 다른 요청에 적용할 수 있는 도구를 지속적으로 생성할 수 있도록 하여, 미래의 요청이 작업을 해결하는데 유리할 때 해당 API를 호출할 수 있게 합니다. 더불어, 도구 제작과 도구 사용 단계에서의 LLM 간의 노동 분배는 생성된 도구와 문제 해결의 품질을 저하시키지 않고 비용 효율성을 달성할 수 있는 기회를 제공합니다. 예를 들어, 도구 제작이 도구 사용보다 더 복잡한 능력을 요구한다는 것을 인지하고, 강력하면서도 자원 집약적인 모델을 도구 제작자로, 경량화되면서 비용 효율적인 모델을 도구 사용자로 적용할 수 있습니다. 우리는 다양한 복잡한 추론 작업, 비롯하여 Big-Bench 작업을 통해 접근 방식의 효과를 입증합니다. 도구 제작자로서의 GPT-4와 도구 사용자로서의 GPT-3.5를 사용하면, LATM은 도구 제작과 도구 사용 모두에 GPT-4를 사용하는 것과 동등한 성능을 달성할 수 있으면서, 추론 비용은 크게 줄일 수 있습니다.