Conventions
Base de format
Les endpoints de chat consomment et renvoient du JSON. En mode streaming, la reponse est diffusee en text/event-stream.
Champ model
Le champ model est obligatoire et doit suivre ce format:
text
group:<uuid>Exemple:
text
group:123e4567-e89b-12d3-a456-426614174000Messages
La requete attend un tableau messages.
Roles acceptes:
systemuserassistanttool
Regle importante:
- le tableau doit contenir au moins un message
user - le dernier message
userporte la demande en cours
Formats de contenu
Le champ content d’un message peut etre:
- une chaine
null- un tableau de blocs contenant des proprietes comme
typeettext
Streaming
Si stream vaut true, l’API renvoie des evenements SSE.
Le flux suit en pratique cette logique:
- un premier chunk initialise la reponse assistant
- des chunks ajoutent du texte dans
choices[0].delta.content - un chunk final ferme la reponse
- le flux se termine avec
data: [DONE]
metadata
Le champ metadata est optionnel. Il est utile notamment pour:
- fournir un identifiant
request_id - indiquer un mode via
metadata.mode
Valeurs de metadata.mode prises en charge:
autonormalorchsynth
Limites de saisie utiles
messages: entre 1 et 500 elementstemperature: entre0et2max_tokens: entre1et200000max_completion_tokens: entre1et200000
Si max_tokens et max_completion_tokens sont fournis ensemble, preferez max_completion_tokens pour exprimer clairement la limite souhaitee.