OpenAI-compatible
Документация API
Быстрый старт для /openapi/v1: получить список моделей, вызвать генерацию изображений и отправить chat completion.
AI Retry
OpenAI-compatible
Быстрый старт для /openapi/v1: получить список моделей, вызвать генерацию изображений и отправить chat completion.
Подставьте этот адрес в клиент или скрипт. Все примеры ниже используют его напрямую.
Создайте персональный ключ в настройках и передавайте его в заголовке Authorization: Bearer YOUR_API_KEY.
Quick Start
В AI Retry поле model всегда должно содержать slug модели из вашего каталога, а не маркетинговое название.
Откройте настройки аккаунта, создайте Bearer-ключ и сохраните его сразу после выдачи.
Запросите GET /openapi/v1/models и используйте точный id модели в поле model.
Для текста используйте /chat/completions, для изображений /images/generations.
Endpoints
Это те же эндпоинты, которые уже работают в сервере. Никакой отдельной версии документации здесь нет.
/openapi/v1/models
Список доступных моделей и их slug для поля model.
/openapi/v1/images/generations
Генерация изображений в OpenAI-совместимом формате. Передавайте prompt и параметры выбранной модели в теле запроса.
/openapi/v1/chat/completions
Текстовые и чат-модели. Сервис сам приводит messages к входной схеме выбранной модели.
Discovery
Запросите список моделей перед первой интеграцией. Slug в каталоге может отличаться от маркетингового названия модели.
Image
Пример ниже использует nano-banana через /images/generations. Если у вас включён другой slug, замените только значение поля model.
Chat
В примере используется gpt-5.4 как ожидаемый slug. Если в вашем каталоге модель включена под другим id, сначала проверьте /openapi/v1/models и замените поле model.
messages, а AI Retry сам собирает payload под схему выбранной текстовой модели.
Notes
Коротко о том, что важно при интеграции, чтобы не тратить время на первую отладку.
n в images
Сервис поддерживает только n=1. Если передать другое значение, API вернёт ошибку валидации.
response_format
Для изображений доступны url по умолчанию и b64_json, если нужен base64 вместо ссылки на файл.
max_tokens и temperature
Для chat completion они подставляются только если соответствующие поля есть в схеме выбранной модели.
При нехватке баланса сервер возвращает 402, при неизвестной модели 404, при таймауте генерации 504.