LLM 챗봇의 기반은 instruction을 따르도록 fine-tuning된 LLM이다. 이것은 사용자의 프롬프트나 메시지가 주어진 응답을 생성할 수 있다. 이러한 유형의 모델들은 instruction이나 question을 따르도록 조정된다.

A message or prompt returning a model response
하지만, LLM의 맥락은 오직 모델이 받는 가장 최근의 메세지에 제한되고 이전의 메세지나 응답은 고려하지 않는다. 그러나!! 챗봇은 여러 상호 작용을 통해 일어나는 사용자와의 대화를 유지할 수 있는 능력이 특징이다.

A baseline LLM’s context is limited to only the last message it receives
베이스라인 생성 모델을 작업하면서, 우리는 여러 상호작용을 단일 프롬프트에 쌓고 전체 대화의 기억을 생성할 수 있다.

Building a conversation by stitching multiple prompt-response pairs together
instruction이 포함되어 있다.
context length**에 도달할 때까지 상호 작용들에 대해 이 단계를 반복할 수 있습니다. context length는 프롬프트와 응답에 의해 차지하는 총 토큰 수이며, 각 모델은 지원할 수 있는 최대 context length를 가지고 있다.이 multi-turn 프레임워크는 챗봇에게 처음부터 끝까지 대화의 전체 맥락을 유지할 수 있는 능력을 제공한다.

Multi-turn conversations can happen when the full context is available

Quickstart

Defining a Preamable

Streaming the Chatbot Response
Building the Chat History