Создать транскрибацию
Транскрибирует аудиофайл и обрабатывает транскрипт через LLM. Возвращает уникальный id запроса и status.
Тело запроса
В зависимости от выбранного источника файла, вы будете использовать параметры URL или File. URL должен ссылаться на публично доступный файл на вашем/удаленном сервере.
Язык аудио. Укажите входной язык в формате ISO-639-1. Если ничего не указано, произойдет автоопределение по первым секундам аудио. Поддерживаемые коды языков: af, ar, az, be, bg, bs, ca, cs, cy, da, de, el, en, es, et, fa, fi, fr, gl, he, hi, hr, hu, hy, id, is, it, ja, kk, ko, lt, lv, mi, mk, ms, ne, nl, no, pl, pt, ro, ru, sk, sl, sr, sv, sw, th, tr, uk, vi, zh
Необязательная подсказка для определения специальной лексики или направления модели для правильной транскрибации имен и терминологии. Должна соответствовать входному языку.
Фильтр обнаружения голосовой активности, используемый для вырезания тишины и ускорения процесса транскрибации. Для файлов низкого уровня громкости или низкого качества рекомендуется выполнять запрос с опцией false.
Варианты: true или false.
По умолчанию модель будет диаризировать файл и возвращать транскрипт с текстом, распределенным по обнаруженным говорящим.
Варианты: true или false.
URL Webhook, который будет вызван методом POST для возврата результатов после завершения обработки или в случае ошибки. Сервис осуществляет 3 попытки доставки сообщения с задержкой в 60 секунд между попытками. При доставке результатов обработки status задачи изменяется на WEBHOOK_DELIVERED или WEBHOOK_FAILED, при доставке ошибок обработки статус не меняется.
Любое значение ID, необходимое для идентификации вашего исходного запроса, которое будет отправлено в Webhook при возврате результата. Параметр передается в заголовках запроса в параметре X-Callback-ID, а также в теле ответа.
🌐 Поддержка UTF-8: Unicode символы (кириллица, китайские, арабские и др.) автоматически кодируются в base64 с префиксом utf8-b64: для корректной передачи в HTTP заголовках. ASCII символы передаются как есть.
Пример: callback_id="тест123" становится X-Callback-ID: utf8-b64:0YLQtdGB0YIxMjM=
Используется вместе с callback_url. Базовый результат транскрибации содержит несогласованные и незавершённые предложения. Чтобы структурировать ответ на стороне API, вы можете применить модификаторы, либо при запросе вебхука, либо при обращении к эндпоинту для получения транскрибации. Подробнее о структуре модификаторов можно узнать в разделе "Результаты транскрибации". Если параметр установлен на одно из доступных значений, вебхук будет структурирован соответствующим образом.
Поддерживаемые модификаторы: paragraph_json, paragraph_text, plain_text, plain_json.
AI-резюме: Создать краткое изложение транскрипта с помощью ИИ после завершения транскрибации. Резюме создается на обнаруженном или указанном языке.
Типы резюме:
brief - 2-3 предложения с основной идеей (требуется ≥ ~1 минута аудио)
medium - 1-3 абзаца с ключевыми точками и результатами (требуется ≥ ~3-4 минуты аудио)
long - Структурированное детальное резюме с TL;DR, Executive Summary и детализированными разделами (требуется ≥ ~10 минут аудио)
Автоматическое понижение: Если транскрипт слишком короткий для запрошенного типа резюме, система автоматически понижает уровень (long → medium → brief) или пропускает, если все еще слишком короткий.
Статусы резюме: Проверьте summary_status в ответе: PENDING, IN_PROGRESS, COMPLETED, FAILED или SKIPPED.
Возвращает
Расширенное отслеживание статусов:
transcription_status - отслеживает процесс транскрибации
webhook_status - отслеживает доставку webhook (если указан callback_url)
status - устаревшее поле для обратной совместимости
Статусы транскрибации:
ACCEPTED - запрос принят API сервисом
IN_QUEUE - запрос в очереди на транскрибацию
IN_PROGRESS - запрос транскрибируется
TRANSCRIBED - транскрибация завершена, готов для callback
COMPLETED - полностью завершено (callback не нужен)
FAILED - ошибка транскрибации
Статусы webhook:
PENDING - webhook запланирован для доставки
DELIVERED - webhook успешно доставлен
FAILED - ошибка доставки webhook после повторных попыток
Статусы резюме (при запросе резюме):
summary_status - Отслеживает генерацию AI-резюме
summary - Текст сгенерированного резюме (только при статусе COMPLETED)
Значения статуса резюме:
PENDING - ожидание завершения транскрибации
IN_PROGRESS - идет генерация резюме
COMPLETED - резюме успешно создано
FAILED: {причина} - ошибка генерации резюме
SKIPPED: {причина} - транскрипт слишком короткий
Устаревшие значения статуса:
WEBHOOK_DELIVERED - обработка завершена, webhook доставлен
WEBHOOK_FAILED - ошибка доставки webhook