Создать транскрибацию
Транскрибирует аудиофайл и обрабатывает транскрипт через LLM. Возвращает уникальный id запроса и status.
Тело запроса
В зависимости от выбранного источника файла, вы будете использовать параметры URL или File. URL должен ссылаться на публично доступный файл на вашем/удаленном сервере.
Язык аудио. Укажите входной язык в формате ISO-639-1. Если ничего не указано, произойдет автоопределение по первым секундам аудио. Поддерживаемые коды языков: af, ar, az, be, bg, bs, ca, cs, cy, da, de, el, en, es, et, fa, fi, fr, gl, he, hi, hr, hu, hy, id, is, it, ja, kk, ko, lt, lv, mi, mk, ms, ne, nl, no, pl, pt, ro, ru, sk, sl, sr, sv, sw, th, tr, uk, vi, zh
Необязательная подсказка для определения специальной лексики или направления модели для правильной транскрибации имен и терминологии. Должна соответствовать входному языку.
Фильтр обнаружения голосовой активности, используемый для вырезания тишины и ускорения процесса транскрибации. Для файлов низкого уровня громкости или низкого качества рекомендуется выполнять запрос с опцией false.
Варианты: true или false.
По умолчанию модель будет диаризировать файл и возвращать транскрипт с текстом, распределенным по обнаруженным говорящим.
Варианты: true или false.
URL Webhook, который будет вызван методом POST для возврата результатов после завершения обработки или в случае ошибки. Сервис осуществляет 3 попытки доставки сообщения с задержкой в 60 секунд между попытками. При доставке результатов обработки status задачи изменяется на WEBHOOK_DELIVERED или WEBHOOK_FAILED, при доставке ошибок обработки статус не меняется.
Любое значение ID, необходимое для идентификации вашего исходного запроса, которое будет отправлено в Webhook при возврате результата. Параметр передается в заголовках запроса в параметре X-Callback-ID, а также в теле ответа.
🌐 Поддержка UTF-8: Unicode символы (кириллица, китайские, арабские и др.) автоматически кодируются в base64 с префиксом utf8-b64: для корректной передачи в HTTP заголовках. ASCII символы передаются как есть.
Пример: callback_id="тест123" становится X-Callback-ID: utf8-b64:0YLQtdGB0YIxMjM=
Используется вместе с callback_url. Базовый результат транскрибации содержит несогласованные и незавершённые предложения. Чтобы структурировать ответ на стороне API, вы можете применить модификаторы, либо при запросе вебхука, либо при обращении к эндпоинту для получения транскрибации. Подробнее о структуре модификаторов можно узнать в разделе "Результаты транскрибации". Если параметр установлен на одно из доступных значений, вебхук будет структурирован соответствующим образом.
Поддерживаемые модификаторы: paragraph_json, paragraph_text, plain_text, plain_json.
Возвращает
🔄 Расширенное отслеживание статусов (v2.1.1+):
• transcription_status - отслеживает процесс транскрибации
• webhook_status - отслеживает доставку webhook (если указан callback_url)
• status - устаревшее поле для обратной совместимости
Статусы транскрибации:
ACCEPTED - запрос принят API сервисом
IN_QUEUE - запрос в очереди на транскрибацию
IN_PROGRESS - запрос транскрибируется
TRANSCRIBED - транскрибация завершена, готов для callback
COMPLETED - полностью завершено (callback не нужен)
FAILED - ошибка транскрибации
Статусы webhook:
PENDING - webhook запланирован для доставки
DELIVERED - webhook успешно доставлен
FAILED - ошибка доставки webhook после повторных попыток
Устаревшие значения статуса:
WEBHOOK_DELIVERED - обработка завершена, webhook доставлен
WEBHOOK_FAILED - ошибка доставки webhook