Определение сервера...

Демонстрация потокового ввода звука и транскрибации

Описание API

API Reference

WS /ws

Потоковая передача аудио для транскрибации (VOSK)

Формат: аудио данные (PCM 16kHz)
Ответ: частичные/финальные результаты

WS /ws_file?user_uuid={uuid}

Потоковая запись аудио в файл

Параметры: user_uuid - ID пользователя
Ответ: file_uuid после завершения

POST /send_to_llm

Отправка текста в LLM

Параметры: text, template, recipient
recipient: local, deepseek
В качестве локальной LLM используется - Qwen2.5-32b-instruct.

POST /upload_file?user_uuid={uuid}

Загрузка аудио-файла на сервер

Параметры: user_uuid - ID пользователя
Формат: multipart/form-data
Ответ: file_uuid

POST /send_file_for_transcrib

Транскрибация сохраненного файла

Параметры: file_uuid, recipient
recipient: whisper, yandex, speech2text
Ответ: полный текст транскрибации

GET /get_file_list?user_uuid={uuid}

Получение списка файлов пользователя

Параметры: user_uuid - ID пользователя
Ответ: массив файлов с полями FILE_NAME, FILE_SIZE, CREATED_AT, FILE_UUID

GET /get_file?file_uuid={uuid}

Скачивание аудио-файла

Параметры: file_uuid - ID файла
Ответ: аудио-файл

GET /stream_file?file_uuid={uuid}

Стриминг аудио-файла для прослушивания

Параметры: file_uuid - ID файла
Ответ: аудио-поток

GET /del_file?file_uuid={uuid}

Удаление аудио-файла

Параметры: file_uuid - ID файла
Ответ: статус удаления

Используемые библиотеки

aiofiles==25.1.0, aiohttp==3.13.3, aiohttp-cors==0.8.1, av==16.1.0, boto3==1.42.57, ctranslate2==4.7.1, faster-whisper==1.2.1, huggingface_hub==1.4.1, httpx==0.28.1, langchain-classic==1.0.1, langchain-community==0.4.1, langchain-core==1.2.16, langchain-text-splitters==1.1.1, langsmith==0.7.7, numba==0.64.0, onnxruntime==1.24.2, openai-whisper==20250625, orjson==3.11.7, pydantic==2.12.5, pydantic-settings==2.13.1, pydub==0.25.1, python-dotenv==1.2.1, PyYAML==6.0.3, requests==2.32.5, rich==14.3.3, scipy==1.17.0, sounddevice==0.5.5, speech2text-client==0.1.5, SQLAlchemy==2.0.47, srt==3.5.3, tenacity==9.1.4, tiktoken==0.12.0, tokenizers==0.22.2, torch==2.10.0, tqdm==4.67.3, typer==0.24.1, vosk==0.3.45, websockets==16.0

Демонстрация

Live Demo

Мои аудио-файлы

Имя файла Размер Дата создания Действия
Нажмите "Обновить" для загрузки списка файлов

Прослушивание: файл