Перейти к основному содержаниюКак работает запись голоса?
Запись голоса активируется нажатием кнопки «Начать запись» в интерфейсе приложения. После этого приложение использует технологию VAD (Voice Activity Detection) и работает следующим образом:
-
Детекция звука - приложение отслеживает уровень громкости и начинает запись, когда звук превышает порог в -40 дБ.
-
Нарезка на чанки - если речь продолжается длительное время, аудио автоматически разбивается на фрагменты по 5 секунд. К каждому новому фрагменту добавляется последняя секунда из предыдущего - это защищает от обрезания слов на границе чанков.
-
Определение конца фразы - когда наступает тишина длительностью более 0.5 секунды, текущий фрагмент считается завершённым и отправляется на расшифровку.
-
Фильтрация шума - слишком короткие фрагменты (менее 0.5 секунды) игнорируются и не отправляются на обработку.
Какие источники звука записываются?
Приложение записывает звук с выбранного микрофона и системный звук. В настройках приложения можно выбрать нужный микрофон, а также настроить чувствительность для микрофона и системного звука.