LLM 챗봇의 기반은 instruction
을 따르도록 fine-tuning된 LLM이다. 이것은 사용자의 프롬프트나 메시지가 주어진 응답을 생성할 수 있다. 이러한 유형의 모델들은 instruction
이나 question
을 따르도록 조정된다.
A message or prompt returning a model response
하지만, LLM의 맥락은 오직 모델이 받는 가장 최근의 메세지에 제한되고 이전의 메세지나 응답은 고려하지 않는다. 그러나!! 챗봇은 여러 상호 작용을 통해 일어나는 사용자와의 대화를 유지할 수 있는 능력이 특징이다.
A baseline LLM’s context is limited to only the last message it receives
베이스라인 생성 모델을 작업하면서, 우리는 여러 상호작용을 단일 프롬프트에 쌓고 전체 대화의 기억을 생성할 수 있다.
Building a conversation by stitching multiple prompt-response pairs together
instruction
이 포함되어 있다.
context length
**에 도달할 때까지 상호 작용들에 대해 이 단계를 반복할 수 있습니다. context length
는 프롬프트와 응답에 의해 차지하는 총 토큰 수이며, 각 모델은 지원할 수 있는 최대 context length
를 가지고 있다.이 multi-turn 프레임워크는 챗봇에게 처음부터 끝까지 대화의 전체 맥락을 유지할 수 있는 능력을 제공한다.
Multi-turn conversations can happen when the full context is available
Quickstart
Defining a Preamable
Streaming the Chatbot Response
Building the Chat History