Saltar al contenido principal

Modos de grabación

Automático (VAD)

La grabación comienza automáticamente cuando hablas y se detiene durante las pausas. Perfecto para entrevistas continuas. Cómo funciona:
  1. La aplicación escucha el audio y espera a que el volumen supere el umbral
  2. Tan pronto como aparece el habla - comienza la grabación
  3. Cuando ocurre silencio - la grabación termina y se envía para transcripción
  4. Si el habla dura mucho tiempo, la grabación se divide automáticamente en partes (chunks)

Manual (Toggle)

Tú controlas el inicio y fin de la grabación con el atajo de teclado Ctrl+R. Adecuado cuando es importante grabar solo momentos específicos. La aplicación graba constantemente audio en un búfer de fondo. Cuando presionas Ctrl+R, estos segundos se agregan al inicio de la grabación - parte de la conversación antes de presionar aún se guardará.

Selección del modo de grabación

Abre la configuración (icono de engranaje en el menú lateral), sección “Grabación de audio”. Aquí puedes seleccionar el modo de grabación y configurar otros parámetros.

Configuración general

Fuente de audio

ModoDescripción
Audio del sistema + micrófonoGraba el audio del sistema (interlocutor) y el micrófono (tú). Perfecto para transcribir diálogos
Solo audio del sistemaGraba solo el audio del sistema. Útil si solo necesitas el habla del interlocutor
Solo micrófonoGraba solo el micrófono. Usa si el audio del sistema no es necesario o causa problemas

Micrófono

En la configuración, puedes seleccionar un micrófono específico. Si no está seleccionado - se usa el predeterminado del sistema.

Supresión de ruido

Elimina el ruido de fondo, los clics del teclado y otras interferencias. Se recomienda habilitar para una grabación de voz limpia, esto da un bonus a la precisión y calidad del reconocimiento de voz.

Configuración del modo automático (VAD)

Umbral de silencio

Sensibilidad a la voz. Valor más bajo - la aplicación reacciona a sonidos silenciosos. Valor más alto - solo el habla fuerte iniciará la grabación.
NivelEjemplos de sonidos
-75 dBRespiración
-65 dBRuido de fondo
-55 dBSusurro
-45 dBHabla silenciosa
-35 dBHabla normal
-25 dBHabla fuerte

Dividir en chunks

Divide automáticamente las grabaciones largas en archivos separados. Por qué es necesario: si el interlocutor habla durante un minuto sin pausas, y la pregunta ya se hizo al principio - la aplicación enviará la primera parte para transcripción y comenzará a generar una respuesta mientras el interlocutor aún está terminando.
Se recomienda habilitar si quieres obtener consejos antes, pero esto reduce la precisión del reconocimiento de voz.

Longitud del chunk

Duración máxima de un archivo de audio. Después de alcanzar este tiempo, la grabación se guardará y comenzará un nuevo chunk. Rango: de 5 a 10 segundos. Por defecto: 7 segundos.

Configuración del modo manual (Toggle)

Longitud del búfer

La aplicación graba constantemente audio en un búfer de fondo. Cuando presionas Ctrl+R, estos segundos se agregan al inicio de la grabación. Útil si no presionaste el atajo a tiempo. Rango: de 0 a 15 segundos. Por defecto: 4 segundos.

Preguntas frecuentes

La grabación se activa por ruido

Aumenta el umbral de silencio (por ejemplo, de -40 a -30 dB) o habilita la supresión de ruido.

Corta el inicio de las frases

En modo automático - disminuye el umbral de silencio. En modo manual - aumenta la longitud del búfer.

El audio del sistema no se está grabando

En macOS, necesitas permitir que la aplicación capture la pantalla en la configuración de seguridad.