Descripción de la frecuencia de muestreo, la profundidad de bits y la velocidad de bits

Y cómo afecta su calidad de audio.

Neurociencia??
Neurociencia??

En la industria de los audiófilos, hay una lista interminable de temas que generan debate. Los temas polémicos como los cables costosos y el audio de alta resolución (alta resolución) son algunos de los que irritan especialmente a la comunidad.

La definición de audio de alta resolución establece que cualquier archivo de música grabado con un frecuencia de muestreo y profundidad de bits más alto que 44,1 kHz/16 bits se considera audio de alta definición (HD).

Imagen de Sony
Imagen de Sony

En este artículo, cubriremos los fundamentos de la frecuencia de muestreo y la profundidad de bits junto con su impacto en la calidad de audio percibida.

También tocaremos otro concepto: tasa de bits. La tasa de bits, o tasa de bits, se usa comúnmente para describir la calidad de la transmisión de audio para los servicios de transmisión de música.

¿Cómo se graba el sonido digitalmente?

Cuando se produce sonido, crea una onda de presión que se propaga por el aire. Si el diafragma de un dispositivo de grabación, como un micrófono, está cerca, las ondas de presión en el aire crean una vibración en el diafragma. A través de la magia de los transductores, esta vibración, a su vez, crea una señal eléctrica que varía continuamente con las ondas en el aire.

Esta variación continua y proporcionada es de donde proviene el término «analógico».

La señal creada por el diafragma a menudo no es lo suficientemente fuerte por sí sola. Por lo general, un preamplificador primero aumenta la señal para que pueda grabarse de varias maneras.

A lo largo de la historia se han utilizado diversos materiales para registrar y almacenar señales analógicas. Esto incluye cera, discos de vinilo y cintas magnéticas. Finalmente, se introdujeron los registros digitales y se convirtieron en algo común.

Los sistemas digitales (unos y ceros) registran señales analógicas (valores continuamente variables) por muestreo a ellos.

Diferencia entre frecuencia de muestreo baja y frecuencia de muestreo alta
Diferencia entre una frecuencia de muestreo baja y una frecuencia de muestreo alta

Al tomar suficientes muestras de una señal analógica entrante y guardarla en la memoria, los registros digitales pueden capturar y luego reproducir dicha señal.

Una grabación de audio digital típica tiene hasta 44.100 muestras por segundo. Sin embargo, no es raro ver 96.000 muestras por segundo con algunos formatos de audio digital.

Hay varios tipos de métodos de muestreo, pero la modulación de código de pulso (PCM) es el estándar de facto.

¿Qué es la modulación de código de pulso?

PCM sirve como el estándar de la industria para almacenar ondas analógicas en formato digital. En un flujo PCM, la amplitud del audio se muestrea en un intervalo uniforme. ¡PCM no es propietario, por lo que cualquiera puede usarlo de forma gratuita!

Ejemplos de formatos de audio patentados son DTS, Atmos y Dolby Digital.

Sin embargo, es raro encontrar audio en formato PCM por dos motivos:

  • Tamaño del archivo
  • Compatibilidad de reproducción

Tamaño del archivo

Como PCM no está comprimido, el tamaño del archivo del audio grabado es enorme. Es posible comprimir archivos de audio utilizando algoritmos de compresión con pérdida o incluso sin pérdida para conservar la fidelidad del audio mientras se reduce el tamaño del archivo.

Dolby y DTS son compresiones de audio con pérdida que a menudo se usan para este propósito, ya que son capaces de reducir el tamaño de los archivos de audio PCM hasta en un 90 %.

Desafortunadamente, la forma en que Dolby y DTS codifican los canales PCM en un flujo de bits para almacenarlos y luego los decodifican para reproducirlos no es perfecta. El audio resultante, aunque más pequeño en tamaño de archivo, no siempre es tan limpio y nítido como el original, lo que resulta en una disminución de la precisión y la calidad.

Aquí es donde entran los formatos sin pérdida como Dolby Digital TrueHD y DTS-HD Master Audio. Son capaces de decodificar las señales de audio PCM exactamente como fueron capturadas originalmente.

Compatibilidad de reproducción

Desafortunadamente, los sistemas operativos (OS) populares no admiten la reproducción de archivos PCM de forma nativa. IBM y Microsoft definieron el formato de formato de audio de forma de onda (WAV) para el sistema operativo Windows, mientras que Apple utilizó el formato de archivo de intercambio de audio (AIFF) para el sistema operativo Macintosh. Ambos formatos son solo un envoltorio del formato de audio PCM con información de audio adicional como el perfil del autor y el título de la pista, etc.

Representación de fidelidad

La fidelidad/calidad de un flujo PCM está representada por dos atributos:

  • Frecuencia de muestreo
  • Profundidad de bits

Estos dos atributos indican qué tan precisa es la grabación digital con respecto a la señal analógica original.

¿Qué es la frecuencia de muestreo?

Piense en las películas animadas de hace un par de décadas.

Las películas eran solo diapositivas de imágenes fijas que se mostraban una tras otra para crear la ilusión de movimiento. La velocidad de la transición determinó la suavidad de la animación resultante. Cuanto más rápida sea la transición, mejor será la ilusión de animación.

La velocidad de las diapositivas cambiantes es como la velocidad de fotogramas cuando se trata de videos modernos.

La onda de sonido digital es como una instantánea de la señal de audio original
La onda de sonido digital es como una instantánea de la señal de audio original. Cuanto más se parezca la onda de sonido muestreada a la onda de sonido original, mayor será la fidelidad de la onda de sonido digital.

En las grabaciones de audio digital, la frecuencia de muestreo es análoga a la velocidad de fotogramas del video. Cuantos más datos de sonido (muestras) se recopilen por período de tiempo, más se acercarán al sonido analógico original los datos capturados.

Una frecuencia de muestreo más alta le dará una captura más precisa de la señal de audio original
Una frecuencia de muestreo más alta le dará una captura más precisa de la señal de audio original

En una grabación típica de CD de audio digital, la frecuencia de muestreo es 44.100 o 44,1 kHz. Si se pregunta por qué la frecuencia es tan alta cuando el oído humano solo puede escuchar frecuencias de hasta 20 kHz en el mejor de los casos. Es por el teorema de muestreo de Nyquist-Shannon.

Christopher D’Ambrose sitúa la capacidad auditiva de un adulto normal de mediana edad entre 12 y 14 kHz).

Teorema de Nyquist

Comúnmente conocido como el teorema de Nyquist o la frecuencia de Nyquist, establece que para evitar cualquier pérdida de información al muestrear digitalmente una señal, debe muestrear a una velocidad de al menos el doble de la frecuencia de señal más alta esperada.

En este caso, el uso de una frecuencia de muestreo de 44.100 muestras por segundo o 44,1 kHz permite una reproducción precisa de frecuencias de alrededor de 22 kHz.

Otros ejemplos de frecuencias de muestreo comunes son 8000 Hz en teléfonos y entre 96 000 Hz y 192 000 Hz para pistas de audio Blu-ray. También se utiliza una frecuencia de muestreo de 384 000 Hz en determinadas situaciones especiales, como cuando se graban animales que producen sonido ultrasónico.

¿Qué es la profundidad de bits?

La computadora almacena la información en 1 y 0. Esos valores binarios se llaman pedacitos. Cuanto mayor sea el número de bits indica más espacio para el almacenamiento de información.

Un número binario de 4 bits.  Tiempo de prueba: ¿Qué representa el binario anterior?
Un número binario de 4 bits. Tiempo de prueba: ¿Qué representa el binario anterior?

Cuando se muestrea una señal, necesita almacenar la información de audio muestreada en bits. Aquí es donde entra en juego la profundidad de bits. La profundidad de bits determina cuánta información se puede almacenar. Un muestreo con una profundidad de 24 bits puede almacenar más matices y, por lo tanto, más precisión que un muestreo con una profundidad de 16 bits.

Para ser más explícitos, veamos cuál es el número máximo de valores que puede almacenar cada profundidad de bits.

  • 16 bits: Podemos almacenar hasta 65,536 niveles de información
  • 24 bits: Podemos almacenar hasta 16,777,216 niveles de información

Puede ver la gran diferencia en la cantidad de valores posibles entre la profundidad de dos bits.

Gama dinámica

Otro factor importante que afecta la profundidad de bits es la gama dinámica de una señal Un audio digital de 16 bits tiene un rango dinámico máximo de 96dB mientras que una profundidad de 24 bits nos dará un máximo de 144dB.

El audio con calidad de CD se graba con una profundidad de 16 bits porque, en general, solo queremos tratar con un sonido lo suficientemente alto como para que lo escuchemos pero, al mismo tiempo, no lo suficientemente alto como para dañar el equipo o los tímpanos.

Una profundidad de bits de 16 bits para una frecuencia de muestreo de 44,1 kHz es suficiente para reproducir la frecuencia audible y el rango dinámico para la persona promedio, razón por la cual se convirtió en el formato de CD estándar.

¿Debe grabar siempre en 192 kHz/24 bits?

Aunque no hay límites para la frecuencia de muestreo y la profundidad de bits, 192 kHz/24 bits es el estándar de oro para el audio de alta resolución. (¡Ya hay fabricantes que promocionan la capacidad de profundidad de 32 bits, eeks!) Usaremos 192 kHz/24 bits como referencia para el pináculo de la fidelidad de grabación.

Entonces, ¿cuándo se requiere tal fidelidad?

Sabemos que cuanto mayor sea la frecuencia de muestreo y la profundidad de bits, más similar será nuestra señal digital a la señal analógica original. Pero también nos da espacio adicional para la cabeza.

Espacio adicional para la cabeza

Headroom se refiere a la diferencia entre el rango dinámico de la señal de audio y lo que permite la profundidad de bits. Es como conducir un camión de 3 metros de altura a través de un paso elevado con un espacio libre vertical de 5 metros. Esto le da 2 metros de altura libre para trabajar, en caso de que tenga que transportar una carga inusualmente alta.

El muestreo en 16 bits brinda a los ingenieros de audio un rango dinámico de 96db para trabajar. Por otro lado, 24 bits aumenta el rango dinámico hasta 144 db, aunque, en realidad, la mayoría de los equipos de audio solo pueden llegar a 125 db.

Con el headroom adicional, los ingenieros de audio pueden minimizar, si no eliminar, la posibilidad de un ruido excesivo o recorteque es cuando las ondas de sonido esencialmente se aplanan y causan una distorsión audible.

El recorte ocurrió cuando la señal eléctrica entrante no se puede representar completamente numéricamente. Esto puede suceder cuando la profundidad de bits es poco profunda.

Dado que el posible rango de señal de un equipo de audio profesional es mucho mayor que lo que la persona promedio puede escuchar, el uso de 24 bits permite a los profesionales del audio aplicar limpiamente los miles de efectos y operaciones involucrados en la mezcla y masterización de audio para que esté listo para su reproducción y distribución. .

Tamaño de archivo más grande

Además del headroom potencialmente redundante, una grabación de mayor fidelidad crea un tamaño de archivo mucho mayor.

Cálculo del tamaño del archivo

Solo para darle una idea de la diferencia en el tamaño del archivo, intentemos pensar en un escenario hipotético que involucre cinco minutos sin comprimir canción.

1) Primero, calcule la tasa de bits usando la fórmula frecuencia de muestreo * profundidad de bits * número de canales.

Suposición: audio estéreo de 2 canales
  • 44,1 kHz/16 bits: 44.100 x 16 x 2 = 1.411.200 bits por segundo (1.4Mbps)
  • 192 kHz/24 bits: 192 000 X 24 X 2 = 9 216 000 bits por segundo (9.2Mbps)

2) Utilizando la tasa de bits calculada, multiplíquelo por la duración de la grabación en segundos.

Divide megabit (Mb) por 8 para obtener megabyte (MB)
  • 44,1 kHz/16 bits: 1.4Mbps * 300s = 420Mb (52,5 MB)
  • 192 kHz/24 bits: 9.2MBps * 300s = 2760Mb (345 MB)

El audio grabado en 192 kHz/24 bits ocupará 6,5 veces más espacio de archivo que uno muestreado a 44,1 kHz/16 bits.

Entonces, ¿cuándo necesitas grabar en 192 kHz/24 bits?

Todo depende de lo que quieras hacer con la grabación de audio. ¿Quieres manipular la grabación y tienes almacenamiento de memoria ilimitado? Entonces 192kHz/24 bits debería ser una obviedad. Pero si tiene la intención de transmitir su música a sus oyentes, 192kHz/24 bits absorberá el ancho de banda de su oyente y aumentará su factura de Internet.

¿192 kHz/24 bits garantiza una experiencia auditiva superior?

No precisamente.

Chris Montgomery, ingeniero de audio profesional y fundador de la fundación Xiph.Org, brinda una explicación técnica y detallada sobre por qué el muestreo en 192 kHz/24 bits no necesariamente resulta en una experiencia auditiva superior.

Utiliza una combinación de procesamiento de señales y cómo los humanos percibimos el audio para ayudar a explicar por qué el muestreo en 192kHZ/24 bits no tiene sentido, al mismo tiempo que les da a los lectores una idea sobre cómo realizar sus propias pruebas de escucha en casa para tratar de verificar las cosas por su cuenta. .

El punto es disfrutar de la música, ¿verdad? La fidelidad de reproducción moderna es incomprensiblemente mejor que los ya excelentes sistemas analógicos disponibles hace una generación. ¿Es el extremo lógico algo más que otro problema del primer mundo? Quizás, pero las malas mezclas y codificaciones me molestan; me distraen de la música, y probablemente no estoy solo.
¿Por qué oponerse a la 24/192? Porque es una solución a un problema que no existe, un modelo de negocio basado en la ignorancia voluntaria y la estafa. Cuanto más se descontrola la pseudociencia en el mundo en general, más difícil es que la verdad supere a la veracidad… incluso si este es un ejemplo pequeño y relativamente insignificante.

Puedes consultar el artículo de Chris.

Nuestra opinión es que la ley de los rendimientos decrecientes se aplica a la frecuencia de muestreo/profundidad de bits. Una vez que alcanza un cierto umbral, la mejora marginal en la calidad del sonido se vuelve cada vez más pequeña hasta que se vuelve insignificante.

¿Qué es la tasa de bits?

La tasa de bits (o tasa de bits, si lo prefiere) se refiere a la cantidad de bits transmitidos o procesados ​​por segundo, minuto o cualquier unidad de tiempo que se utilice como medida.

Es algo así como la frecuencia de muestreo, pero en cambio, lo que se mide es la cantidad de bits en lugar de la cantidad de muestras.

La tasa de bits se usa más comúnmente en un contexto de reproducción/transmisión que en uno de grabación.

El término tasa de bits no es exclusivo de la industria del audio. También es frecuente en multimedia y redes. Sin embargo, en la música, una tasa de bits más alta se asocia comúnmente con una calidad más alta. Esto se debe a que cada bit en un archivo de audio captura un dato que podemos usar para reproducir el sonido original.

En esencia, cuantos más bits pueda caber en una unidad de tiempo, más cerca estará de recrear la onda de sonido continuamente variable original y, por lo tanto, más precisa será como representación de la canción.

Desafortunadamente, una tasa de bits más alta también significa un tamaño de archivo más grande, lo cual es un gran inconveniente cuando el espacio de almacenamiento y el ancho de banda son una preocupación, como con los servicios de transmisión de música como Apple Music y Spotify.

Servicios de transmisión de música

En la sección anterior, vemos que transmitir una canción de 5 minutos sin comprimir grabada en 44,1 kHz/16 bitstomará una tasa de bits de 1.4Mbps que es una cantidad significativa de ancho de banda.

Apple Music y Spotify evitan este problema de ancho de banda al comprimir el audio. Por supuesto, la compresión de archivos no viene sin consecuencias. Para empezar, Spotify limita la tasa de bits de los archivos de audio a 160 kbps para usuarios de escritorio y 96 kbps para usuarios móviles. Sin embargo, los suscriptores premium tienen la opción de escuchar audio de 320 kbps en una computadora de escritorio. Mientras tanto, los suscriptores de Apple Music están «limitados» a una tasa de bits de 256 kbps.

Calidad de transmisión de Spotify
Calidad de transmisión de Spotify
Apple Music y Spotify utilizan el formato AAC (Advanced Audio Coding) y el formato Ogg Vorbis, respectivamente, para sus servicios de transmisión de audio.
Spotify experimentó con la transmisión sin pérdidas en 2017, pero aún no se ha lanzado oficialmente.
Spotify experimentó con la transmisión sin pérdidas en 2017, pero aún no se ha lanzado oficialmente.

También hay servicios de transmisión de audio para aquellos que prefieren escuchar música con tasas de bits más altas.

Tanto TIDAL como Qobuz Sublime+ son ampliamente considerados los servicios de transmisión de audio para aquellos que prefieren la mejor calidad de transmisión de audio, con opciones de alta fidelidad disponibles por una suscripción mensual de $19.99.

TIDAL admite archivos FLAC de 44,1 kHz/16 bits que se pueden transmitir a una tasa de bits de 1411 kbps.

Tabla de calidad de sonido de marea
Tabla de calidad de sonido de marea

De los dos, la suscripción TIDAL Hi-Fi ofrece más valor por el dinero. Esto se debe a que obtiene acceso a una enorme biblioteca de archivos FLAC de alta calidad, así como a 50 000 canciones de calidad maestra comprimidas con la tecnología patentada Master Quality Authenticated (MQA) para una mejor calidad de sonido.

¿La alta tasa de bits garantiza una experiencia auditiva superior?

Dado nuestro ejemplo anterior, una canción típica de 44,1 kHz/16 bits de cinco minutos habría tenido un tamaño de archivo de más de 50 megabytes sin comprimir.

El códec MP3 se desarrolló para resolver este problema al permitir comprimir audio con calidad de CD sin pérdida de calidad. Los primeros codificadores de MP3 comenzaron con 128 kbps o 192 kbps antes de pasar finalmente a 320 kbps para competir con otros códecs. Sin embargo, en la transmisión de audio, se utilizan Ogg Vorbis (Spotify) y AAC (Apple Music).

Es de código abierto, de dominio público y ofrece alta calidad en relación con el ancho de banda necesario para transmitirlo. Probamos varios formatos de archivo diferentes e hicimos otro tiroteo hace un par de años, y el formato Ogg Vorbis resultó el primero.

La oscuridad del formato no es tan relevante en el sentido de que los usuarios nunca ven los archivos por sí mismos, por lo que si por alguna razón se destaca otro formato que ofrece un mejor retorno de la inversión, no es difícil cambiar a ese nuevo formato: el antiguo Vice de Spotify. Presidente.

Volviendo a la explicación de Chris Montgomery, ahora sabemos que cualquier cosa por encima de 192 kbps en un codificador decente realmente no importa: el oído humano promedio simplemente no es lo suficientemente preciso como para poder notar la diferencia.

Esto significa que cualquier música con una tasa de bits de 192 kbps o superior se vuelve indistinguible de su audio analógico original siempre que esté codificada correctamente en un archivo de audio Ogg, MP3, AAC o FLAC.

Por supuesto, esto no significa que una tasa de bits alta no sea útil. Ayuda a garantizar una experiencia auditiva superior. Sin embargo, esto solo se aplica en situaciones específicas. Por ejemplo, si tiene un sistema de audio Hi-Fi completo que puede aprovechar las mejoras mínimas en la calidad del audio al transmitir archivos de audio Hi-Fi.

En general, el oyente casual que usa auriculares promedio no se beneficiará de la transmisión de audio por encima de los 192 kbps.

Conclusión

En resumen, la frecuencia de muestreo es el número de muestras de audio grabadas por unidad de tiempo y la profundidad de bits mide la precisión con la que se codificaron las muestras. Finalmente, la tasa de bits es la cantidad de bits que se graban por unidad de tiempo.

Eso no fue tan difícil ahora, ¿verdad?

Con suerte, hemos ayudado a aclarar algunos de los misterios relacionados con la frecuencia de muestreo, la profundidad de bits y la velocidad de bits utilizando nuestra guía.

En el futuro, ahora debería poder pensar críticamente cuando alguien le diga cuánto más «claro» suena un archivo de audio en función de su proceso de codificación. Más importante aún, ahora debería resultarle más fácil encontrar los formatos de audio y los servicios de transmisión relevantes que satisfagan sus necesidades auditivas.

Deja un comentario