Перейти к основному содержанию

Как работает запись голоса?

Запись голоса активируется нажатием кнопки «Начать запись» в интерфейсе приложения. После этого приложение использует технологию VAD (Voice Activity Detection) и работает следующим образом:
  1. Детекция звука - приложение отслеживает уровень громкости и начинает запись, когда звук превышает порог в -40 дБ.
  2. Нарезка на чанки - если речь продолжается длительное время, аудио автоматически разбивается на фрагменты по 5 секунд. К каждому новому фрагменту добавляется последняя секунда из предыдущего - это защищает от обрезания слов на границе чанков.
  3. Определение конца фразы - когда наступает тишина длительностью более 0.5 секунды, текущий фрагмент считается завершённым и отправляется на расшифровку.
  4. Фильтрация шума - слишком короткие фрагменты (менее 0.5 секунды) игнорируются и не отправляются на обработку.

Какие источники звука записываются?

Приложение записывает звук с выбранного микрофона и системный звук. В настройках приложения можно выбрать нужный микрофон, а также настроить чувствительность для микрофона и системного звука.