— продукт · 01/05

Один движок.Много форм речи.

Распознавание, разметка дикторов, пунктуация, таймкоды, словари терминов и сводка — в одном API. Никаких отдельных модулей и склеек на коленке.

Что умеет движок

шесть модулей, один API

→ asr

Распознавание

Спонтанная речь, шумная среда, акценты. Переключение языков внутри одной записи.

ru · en · kz · uz · tj

→ diarization

Дикторы

До 16 голосов в одной записи. Разметка ролей без заранее записанных эталонов.

speaker-change · role-tag

→ punctuation

Пунктуация

Запятые, тире, прямая речь, абзацы — по смыслу, а не по паузам.

case restoration · paragraphs

→ timecodes

Таймкоды

Точность до 0.1 с на слово. Экспорт в SRT, VTT, ASS, EDL для монтажёров.

.srt · .vtt · .ass · .edl

→ glossary

Словари

Имена, аббревиатуры, отраслевые термины. Hot-loaded на запрос, без переобучения.

per-request · instant

→ summary

Сводка

Решения, действия, цифры — отдельным блоком. Формат задаёте шаблоном.

actions · decisions · numbers

Конвейер

~14× реального времени · одна видеокарта

01. Аудиолюбое · до 8 ч · 4 ГБ

02. VADотделяем речь от шума

03. ASRсобственная акустика + ЯМ

04. Diarizeдо 16 голосов

05. LLMпунктуация, сводка

Куда встраивается

все интеграции →

REST · JSON

API

Загрузка файлов и URL, webhooks на готовность, потоковая передача.

POST /v1/jobs
audio: "meeting.mp3"
lang:  "ru"
diarize: true
webhook: "…"

@aiasr_bot

Перешлите голосовое или аудио — получите текст и сводку прямо в чате.

12:43

voice · 0:34

«Перенесите встречу на четверг, 15:00.»

MCP

Для агентов

Claude, Cursor, Windsurf — расшифровка становится инструментом агента.

aiasr.transcribe({
  url,
  lang: "ru",
  diarize: true
})

Как мы считаем качество

WER на открытых русских датасетах · ниже — лучше

— чистая речь (GOLOS · test_clean)

aiasr v0.4

2.4%

crowd-model A

3.6%

open baseline (whisper-lg ru)

5.8%

— спонтанная речь (собственный бенч)

aiasr v0.4

3.1%

crowd-model A

5.2%

open baseline

8.7%

* измерения на 2.8 часа аудио, 12 дикторов, 3 акустических среды. Скрипт бенча — в репозитории.

Где живут данные

152-ФЗ

— cloud · 152-ФЗ

В российском контуре

Первичная обработка персональных данных в РФ. Анонимизация перед любой кросс-границей. Договор с оператором ПД, журнал доступа на запрос.

— on-prem

У вас в периметре

Docker-инсталляция в инфраструктуру заказчика. Нулевой отток аудио наружу, работает в air-gap, обновления — по регламенту клиента.

— попробуйте прямо сейчас

Первые 60 минут — на нас.

открыть студию →читать API-документацию