— продукт · 01/05

Один движок.Много форм речи.

Распознавание, разметка дикторов, пунктуация, таймкоды, словари терминов и сводка — в одном API. Никаких отдельных модулей и склеек на коленке.

01

Что умеет движок

→ asr

Распознавание

Спонтанная речь, шумная среда, акценты. Переключение языков внутри одной записи.

ru · en · kz · uz · tj
→ diarization

Дикторы

До 16 голосов в одной записи. Разметка ролей без заранее записанных эталонов.

speaker-change · role-tag
→ punctuation

Пунктуация

Запятые, тире, прямая речь, абзацы — по смыслу, а не по паузам.

case restoration · paragraphs
→ timecodes

Таймкоды

Точность до 0.1 с на слово. Экспорт в SRT, VTT, ASS, EDL для монтажёров.

.srt · .vtt · .ass · .edl
→ glossary

Словари

Имена, аббревиатуры, отраслевые термины. Hot-loaded на запрос, без переобучения.

per-request · instant
→ summary

Сводка

Решения, действия, цифры — отдельным блоком. Формат задаёте шаблоном.

actions · decisions · numbers
02

Конвейер

01. Аудиолюбое · до 8 ч · 4 ГБ
02. VADотделяем речь от шума
03. ASRсобственная акустика + ЯМ
04. Diarizeдо 16 голосов
05. LLMпунктуация, сводка
03

Куда встраивается

все интеграции →
REST · JSON

API

Загрузка файлов и URL, webhooks на готовность, потоковая передача.

POST /v1/jobs
audio: "meeting.mp3"
lang: "ru"
diarize: true
webhook: "…"
@aiasr_bot

Telegram

Перешлите голосовое или аудио — получите текст и сводку прямо в чате.

12:43
voice · 0:34
«Перенесите встречу на четверг, 15:00.»
MCP

Для агентов

Claude, Cursor, Windsurf — расшифровка становится инструментом агента.

aiasr.transcribe({
url,
lang: "ru",
diarize: true
})
04

Как мы считаем качество

— чистая речь (GOLOS · test_clean)
aiasr v0.4
2.4%
crowd-model A
3.6%
open baseline (whisper-lg ru)
5.8%
— спонтанная речь (собственный бенч)
aiasr v0.4
3.1%
crowd-model A
5.2%
open baseline
8.7%
* измерения на 2.8 часа аудио, 12 дикторов, 3 акустических среды. Скрипт бенча — в репозитории.
05

Где живут данные

— cloud · 152-ФЗ

В российском контуре

Первичная обработка персональных данных в РФ. Анонимизация перед любой кросс-границей. Договор с оператором ПД, журнал доступа на запрос.

— on-prem

У вас в периметре

Docker-инсталляция в инфраструктуру заказчика. Нулевой отток аудио наружу, работает в air-gap, обновления — по регламенту клиента.

— попробуйте прямо сейчас

Первые 60 минут — на нас.