▷Fundamentos del audio digital II 🥇

Este artículo es una continuación del anterior Fundamentos del sonido digital y se recomienda que lo lea antes de continuar.

En el artículo anterior vimos cómo una onda de sonido se almacena como números binarios o sonido digital. Pero, ¿cuánto espacio necesito para almacenar una canción?

Espacio de almacenamiento

Como hemos visto, lo más importante es el tamaño de cada muestra (cuántos bits se utilizan en cada muestra) y el número de muestras que se toman. Cuanto más altas sean estas dos cantidades, más espacio se necesita.

Si tomamos como referencia la calidad de CD, tenemos que cada muestra necesita 16 bits (16b) o, lo que es lo mismo, 2 bytes (2B).

En un segundo de sonido se toman 44.100 muestras, por lo que necesitaremos 88.200 bytes para almacenar un segundo de audio con esta calidad.

La mayoría de los CD duraban 74 minutos, lo que equivale a 88.200 60 bytes × 74 segundos/minuto × 391,608 minutos = 391,6 millones de bytes, o 373,5 MB (XNUMX MiB).

Pero no olvidemos un pequeño detalle… la música en un CD es estéreo. Esto quiere decir que tenemos dos ondas sonoras, una para la izquierda y otra para la derecha, que no son iguales (si fueran iguales serían mono). Entonces necesitamos el doble, 783,2 MB (746,9 MiB). Y este era el tamaño normal de un CD.

Pero pensemos, esto fue escandaloso para la época (finales de los 70 y principios de los 80). Para no tener idea, el Macintosh original tenía una capacidad de disco de 400 kB, que es suficiente para almacenar poco más de 2 segundos de audio con calidad de CD.

Los disquetes de 3,5" eran capaces de almacenar 1,4 MB (unos 8 segundos) y se siguieron utilizando hasta principios de la década de 2000. Los discos duros de la década de 90 no podían almacenar el contenido de un CD o tal vez solo era al principio. por ser un modelo que lo superaba, pero a un precio prohibitivo para almacenar música.

Sonido comprimido

La solución fue reducir el espacio de almacenamiento requerido, de modo que con menos bytes pudiéramos almacenar la misma cantidad de música.

Así nació el popular Formato audio MP3, que se hizo muy popular a fines de la década de 90 y principios de la de 2000. El sonido generalmente se almacenaba usando 64 kb / s (en un CD de audio era 705.6 kb / s) para un canal de audio, 128 kb / s. s para estéreo (en un CD de audio de 1.411 kb/s). Esta es una reducción de 9x en el espacio requerido.

Esto es lo que se conoce como compresión con pérdida (con pérdida en inglés). Se basa en el hecho de que parte de la información de la onda original puede perderse porque es poco probable que esta pérdida tenga un impacto en el oyente, es decir, apenas lo notará. Así que el espacio requerido (y el ancho de banda para transmitir) se redujo a costa de perder algo de calidad.

A principios de los 2000 nació el formato AAC (Advanced Audio Coding), que es un formato estándar internacional ISO/IEC 13818-7. Su eficiencia es muy superior a la del MP3, además de utilizar un bitrate variable (VBR) que le permite adaptarse a cada momento de la canción y utilizar más o menos bits para codificarla. Esto significa que la mitad de la información debe ser utilizada para la misma calidad.

Este es el formato que ha elegido Apple para sus iPods, aunque al ser un estándar lo puedes encontrar como formato por defecto para muchos dispositivos, como Nintendo, PlayStation, XBox, etc... Además, soporta hasta 48 canales de audio, por lo que también es un estándar para archivos de vídeo MP4 (películas, documentales…) donde soporta el típico audio Dolby 5.1 o 7.1 para películas sin ningún problema.

Al comienzo de la tienda de música iTunes, se comenzaron a vender archivos AAC codificados a 64 kb/s por canal, es decir, 128 kb/s. Posteriormente, a principios de la década de 2010, pasó a 128 kb/s por canal (256 kb/s en estéreo).

Por lo tanto, el sonido comprimido con pérdida puede perder parte de la información a cambio de un importante ahorro de espacio (tanto para el almacenamiento como para la transmisión). ¿La música comprimida con pérdida es de menor calidad que el archivo original? Obviamente, la pregunta es, en qué punto ya no somos capaces de notar la diferencia.

Sonido sin pérdidas

El sonido sin comprimir traduce las muestras tomadas de la onda tal cual, como en el caso de los CD de audio, sin pérdida desde el momento en que se digitalizó.

También se han lanzado formatos de audio comprimidos lossless, es decir que permiten comprimir para que el archivo ocupe menos pero la información que contiene no se altera en absoluto (como si fuera un archivo .zip) aunque la compresión que consiguen es mucho menor que con compresión de pérdida, estamos hablando de comprimir el original a la mitad. En este caso tenemos formatos como ALAC (Apple Lossless Audio Codec) de Apple mismo o FLAC (Free Lossless Audio Codec) de Xiph.org, aunque hay más.

Hoy en día disponemos de discos que pueden almacenar mucha más información que hace 20 años, conexiones mucho más rápidas, por lo que utilizar formatos de audio lossless ya no tiene un coste tan elevado para el usuario.

El archivo de audio no es lo único importante

Nos enfocamos en cómo almacenamos los datos y cómo llegan a nuestro reproductor. Pero nuestros oídos no entienden los 1 y 0 digitales. Para escuchar el audio tenemos que convertirlo de nuevo a analógico (DAC) y acercarlo a nuestros oídos.

Por lo tanto, el dispositivo de conversión de digital a analógico juega un papel importante. Si suaviza la onda, elimina la distorsión, etc., generará una onda analógica mucho mejor y de mayor calidad. También el cable que viaja hasta nuestros auriculares o altavoces, si está blindado para reducir las interferencias (recordemos que una vez en el mundo analógico, estamos totalmente expuestos) y lo más importante, la calidad de los propios altavoces.

Podemos tener un archivo de audio original, tanto analógico como digital, de muy buena calidad, pero que no puede viajar y reproducirse fielmente a través de los altavoces, por lo que la calidad con la que llega a nuestros oídos será mucho peor.

Por tanto, el dispositivo del reproductor es primordial y, más importante aún, los altavoces, más que si la música llega en formato analógico o digital, sin pérdida de datos ni compresión con pérdida. No tiene sentido poner más datos en un archivo si el sistema de reproducción de audio no puede reproducirlos fielmente.

¿Cuál es la calidad de audio correcta?

Como hemos visto con las pantallas, el aumento de resolución hizo que la imagen fuera mejor, más fiel a la realidad. Pero llega un punto en el que ya no se nota la resolución, podemos aumentarla y la calidad de la imagen aumentará, pero no servirá de nada.

Al principio, pequeños aumentos en la calidad (resolución o frecuencia de muestreo) hacen una gran diferencia en la percepción del oyente, pero a medida que aumenta, cada vez, la diferencia en la percepción es menor. Además, ten en cuenta que muchos equipos de audio no tienen la calidad suficiente para transferir ese archivo tal cual al ser humano.

En archivos de audio AAC, pasar de 128 kb/s a 256 kb/s ya es difícil de distinguir para muchas personas, ya sea por su sensibilidad y/o costumbre, o por el equipo que utilizan para reproducir. Y siga subiendo desde aquí y busque sonido sin comprimir, ya sea una frecuencia de muestreo más alta o una resolución más alta es algo que aumentará mucho el tamaño del archivo, pero que pocas personas, y solo con un buen equipo, notarán.

Incluso si ya conocemos el poder del marketing. Recuerdo, cuando era pequeño, lo sorprendidos que estaban los compradores de nuevos televisores estéreo con esta característica cuando la transmisión de televisión era mono.

Os animo a probar, experimentar, desde un archivo de la mayor calidad posible o desde un CD. Prueba a comprimirlo con diferentes calidades y luego, sin saber cuál es cuál, escucha a ver si notas las diferencias. Esa cualidad de la que ya no notas nada, es la indicada para ti.