Modos de grabación
Automático (VAD)
La grabación comienza automáticamente cuando hablas y se detiene durante las pausas. Perfecto para entrevistas continuas.
Cómo funciona:
- La aplicación escucha el audio y espera a que el volumen supere el umbral
- Tan pronto como aparece el habla - comienza la grabación
- Cuando ocurre silencio - la grabación termina y se envía para transcripción
- Si el habla dura mucho tiempo, la grabación se divide automáticamente en partes (chunks)
Manual (Toggle)
Tú controlas el inicio y fin de la grabación con el atajo de teclado Ctrl+R. Adecuado cuando es importante grabar solo momentos específicos.
La aplicación graba constantemente audio en un búfer de fondo. Cuando presionas Ctrl+R, estos segundos se agregan al inicio de la grabación - parte de la conversación antes de presionar aún se guardará.
Selección del modo de grabación
Abre la configuración (icono de engranaje en el menú lateral), sección “Grabación de audio”. Aquí puedes seleccionar el modo de grabación y configurar otros parámetros.
Configuración general
Fuente de audio
| Modo | Descripción |
|---|
| Audio del sistema + micrófono | Graba el audio del sistema (interlocutor) y el micrófono (tú). Perfecto para transcribir diálogos |
| Solo audio del sistema | Graba solo el audio del sistema. Útil si solo necesitas el habla del interlocutor |
| Solo micrófono | Graba solo el micrófono. Usa si el audio del sistema no es necesario o causa problemas |
Micrófono
En la configuración, puedes seleccionar un micrófono específico. Si no está seleccionado - se usa el predeterminado del sistema.
Supresión de ruido
Elimina el ruido de fondo, los clics del teclado y otras interferencias. Se recomienda habilitar para una grabación de voz limpia, esto da un bonus a la precisión y calidad del reconocimiento de voz.
Configuración del modo automático (VAD)
Umbral de silencio
Sensibilidad a la voz. Valor más bajo - la aplicación reacciona a sonidos silenciosos. Valor más alto - solo el habla fuerte iniciará la grabación.
| Nivel | Ejemplos de sonidos |
|---|
| -75 dB | Respiración |
| -65 dB | Ruido de fondo |
| -55 dB | Susurro |
| -45 dB | Habla silenciosa |
| -35 dB | Habla normal |
| -25 dB | Habla fuerte |
Dividir en chunks
Divide automáticamente las grabaciones largas en archivos separados.
Por qué es necesario: si el interlocutor habla durante un minuto sin pausas, y la pregunta ya se hizo al principio - la aplicación enviará la primera parte para transcripción y comenzará a generar una respuesta mientras el interlocutor aún está terminando.
Se recomienda habilitar si quieres obtener consejos antes, pero esto reduce la precisión del reconocimiento de voz.
Longitud del chunk
Duración máxima de un archivo de audio. Después de alcanzar este tiempo, la grabación se guardará y comenzará un nuevo chunk.
Rango: de 5 a 10 segundos. Por defecto: 7 segundos.
Configuración del modo manual (Toggle)
Longitud del búfer
La aplicación graba constantemente audio en un búfer de fondo. Cuando presionas Ctrl+R, estos segundos se agregan al inicio de la grabación. Útil si no presionaste el atajo a tiempo.
Rango: de 0 a 15 segundos. Por defecto: 4 segundos.
Preguntas frecuentes
La grabación se activa por ruido
Aumenta el umbral de silencio (por ejemplo, de -40 a -30 dB) o habilita la supresión de ruido.
Corta el inicio de las frases
En modo automático - disminuye el umbral de silencio. En modo manual - aumenta la longitud del búfer.
El audio del sistema no se está grabando
En macOS, necesitas permitir que la aplicación capture la pantalla en la configuración de seguridad.