LLM은 텍스트를 한 번에 하나의 토큰씩 생성함. 이 토큰은 단일 문자, 단어 또는 구의 일부를 나타낼 수 있음. 일관된 텍스트 시퀀스를 생성하기 위해 모델은 다음에 생성할 가능성이 가장 높은 토큰을 예측함. 이러한 예측은 이전 단어와 각 잠재적 토큰에 할당된 확률 점수를 기반으로 함.
예를 들어, "내가 가장 좋아하는 열대 과일은 __."라는 문구에서 LLM은 "망고", "리치", "파파야" 또는 "두리안"과 같은 토큰으로 문장을 완성하기 시작할 수 있음. 각 토큰은 확률 점수를 부여받음. 다양한 토큰을 선택할 수 있는 경우, SynthID는 출력의 품질, 정확성 및 창의성을 손상시키지 않는 경우에 한해 각 예측된 토큰의 확률 점수를 조정할 수 있음.
이 과정은 생성된 텍스트 전반에 걸쳐 반복되므로, 하나의 문장은 열 개 이상의 조정된 확률 점수를 포함할 수 있으며, 한 페이지에는 수백 개가 포함될 수 있음. 모델의 단어 선택과 조정된 확률 점수의 최종 패턴은 워터마크로 간주됨.