El sonido es una vibración, una onda, producida por todos los elementos de nuestro entorno, como el cristal cuando se golpea (y choca con otro), como la puerta cuando tocas con los nudillos para tocar... Y los parlantes son sistemas electromecánicos que generar una vibración a base de una corriente eléctrica y con la que somos capaces de imitar el sonido de la naturaleza, de imitar esa onda que generan los elementos físicos de nuestro entorno.
A finales del siglo XIX Edison inventó el fonógrafo, que era capaz de trasladar esas vibraciones que viajan en el aire (sonido) a un cilindro para luego reproducirlas de nuevo. El registro consistía en hacer vibrar el aire haciendo vibrar una aguja registradora que marcaba esa misma onda sobre una capa de aluminio que rodeaba el cilindro. Luego, moviendo el cilindro con una aguja lectora, vibró al pasar por la ranura que había grabado previamente. Esta vibración es lo que el oyente terminó sintiendo.
Y básicamente, así funciona un disco de vinilo, que popularizó el transfer de la segunda mitad del siglo XX.
Esta forma de grabar música se conoce como analógica (a diferencia de digital).
Sonido analógico
El sonido en el mundo real es analógico, la onda de sonido tiene infinitos valores, infinitos detalles. Cuando esta onda sonora viaja en un surco de un cilindro o disco, ese surco también tiene infinitos valores y detalles.
Hacía muchos años que no se grababa el sonido poniendo a un cantante frente a un fonógrafo. A medida que la industria progresó, "electrificó" el proceso. Ahora el cantante o instrumento generaba sus ondas frente a un micrófono, el cual convertía esas vibraciones del aire en una onda eléctrica, la cual viajaba a través de un cable hasta llegar a un aparato de audio, donde amplificaba, filtraba, mezclaba con el sonido de otros. micrófonos… y eventualmente viajaría (eléctricamente) a una grabadora, como un disco, y generaría un surco que recogería esa vibración.
El sonido analógico no solo se almacenaba en surcos. También se popularizó el uso de cintas magnéticas, que llegaron al mercado interno como "cassettes". Aquí, en lugar de un surco, teníamos una cinta con partículas magnéticas que se orientaban según un imán (cabeza) que se les indicaba. Entonces, para escuchar esa música, bastaba que el imán (cabeza) hiciera el proceso contrario, dejándose guiar por el campo magnético de las partículas de la cinta.
Y también se usaba para transmitir sonido por cable (teléfono) o radio, primero la AM y luego, más sofisticada, la FM que todavía hoy se usa con regularidad.
Problema de audio analógico
Así como el sonido analógico es capaz de reunir infinitos valores y detalles, también es infinitamente alterable por cualquier elemento externo.
Así, cuando el sonido viaja en forma de señal eléctrica a través del cable, desde el micrófono que lo recogió, se ve alterado por las interferencias electromagnéticas en la habitación, generadas por otros dispositivos (amplificadores, luces, cables eléctricos… ) así como por la resistencia eléctrica del propio cable.
Cuando llega al dispositivo receptor que lo procesa, también se ve afectado por la propia interferencia y por el propio equipo.
Al grabar haciendo un surco, éste se ve alterado por el material y su resistencia, el material de la aguja, su uso anterior, etc. Una vez grabado, el disco se altera tocándolo con las manos, tocándolo, tocando la aguja, el ambiente, la humedad, el calor… todo va alterando esa grabación y por tanto ese sonido.
Si hablamos de cintas magnéticas, la alteración de la información es muy sencilla: los campos magnéticos de altavoces, cables o la luz solar, provocan la alteración de la información, así como la humedad del ambiente en el que se almacena.
En el caso de la transmisión por radio, la exposición a cualquier interferencia y cambios en el sonido es mucho mayor, por lo que es el medio que ofrece menor calidad y es el más sensible.
Por no hablar del último paso de la cadena: el equipo lo lee, lo amplifica, lo envía a los ponentes y a los propios ponentes.
Por esta razón, la música analógica de calidad requiere equipos muy costosos y de alta calidad para tratar de minimizar (solo minimizar, no eliminar) todos estos efectos negativos. Por ejemplo cables apantallados para intentar reducir las interferencias eléctricas, conectores chapados en oro o cables especiales para reducir la resistencia, materiales muy caros y de gran calidad…
El otro gran problema son las copias: si copias el contenido, el contenido copiado ya no es el mismo que el original, está parcialmente deteriorado. Si de esa copia se hace otra copia, se deteriora cada vez más. Esto fue muy fácil de ver al copiar cintas VHS.
Sonido digital: resolución
En el mundo digital no hay infinitos grises, solo hay blanco y negro, sí o no, 1 o 0, sin posibilidades intermedias. Esta unidad mínima de información se conoce como bit [b]. Esto tiene una serie de problemas y una serie de ventajas.
Como el mundo real tiene más de 2 sonidos, dos colores, dos letras… es necesario juntar más bits y así representar más posibilidades.
Si tenemos 2 bits podemos almacenar 4 valores:
- 00 (0)
- 01 (1)
- 10 (2)
- 11 (3)
Si tenemos 3 bits serían 8 valores, 4 bits 16 valores… y así sucesivamente. La práctica habitual es utilizar grupos de 8 bits, que se denominan bytes [B].
Cuando se digitaliza una señal de sonido, se muestrea la onda para ver su valor en un momento específico y ese valor se convierte en un número (el número más cercano). Lugo se vuelve a muestrear y el siguiente valor se almacena y así sucesivamente. Esta función la realiza un dispositivo conocido como convertidor digital a analógico (ADC).
Según el número de bits que tengamos obtendremos una resolución más baja o más alta en la digitalización. Por ejemplo, si usamos 2 bits podríamos registrar 3 niveles diferentes (0 a 3). Cuantos más bits tengamos, más niveles diferentes podremos tener y más cierto será.
Supongamos una onda de sonido analógica que dura 1 segundo.
Digitalizamos esta onda con una resolución de 2 bits y tomamos 11 muestras en un segundo. Esto significa que como máximo podemos usar 4 valores diferentes.
Esto se almacenará como una secuencia de 11 números (se realizaron 11 muestras) de 2 bits cada uno.
Cuando convertimos esa información en una onda, tendremos que trabajar con la información que tenemos almacenada. Como puedes ver, no se parece mucho al original.
Sin embargo, si repetimos el proceso de digitalización con 4 bits, cada muestra podría tener uno de los 16 valores posibles, lo que hace que la onda sea más parecida a la original.
El precio a pagar por esta resolución más alta es el espacio ocupado en el almacenamiento. Con 4 bits ocupamos el doble que con 2 bits. Y aumentará a medida que agreguemos más bits.
Sonido digital: la frecuencia de muestreo.
El convertidor de analógico a digital toma una muestra de la onda en un momento específico y la convierte en un número. Pero almacenar música es necesario para tomar muestras de la onda a lo largo del tiempo.
En cuanto a la resolución, si tomamos pocas muestras usaremos pocos datos pero la onda final será muy diferente a la original. Si tomamos muchas muestras, la onda se parecerá más a la original pero ocupará más espacio.
El teorema de Shannon dice que debemos tomar al menos dos muestras en cada onda de la frecuencia más alta que queramos digitalizar. Si queremos digitalizar una frecuencia de 1.000 Hz, debemos muestrear al menos dos veces, a 2.000 Hz (o 2 kHz).
Sonido digital: ¿qué resolución y frecuencia elegimos?
Si queremos una calidad perfecta, es decir, que memoricemos un sonido idéntico a la curva analógica, ya que la curva analógica tiene infinitos niveles diferentes e infinitos detalles, necesitamos utilizar una resolución infinita. Además, tendríamos que muestrear infinitas veces en un segundo. Es imposible. Además, no habría suficiente espacio en todos los discos duros del planeta tierra para almacenar un segundo de sonido.
Lo lógico sería buscar el valor suficiente, es decir, el valor mínimo de resolución y frecuencia de muestreo que hace que el sonido sea tan bueno que el oído humano no pueda distinguirlo. Poner más no aporta nada, solo ocupa espacio y ancho de banda en su transmisión.
A fines de la década de 70 y principios de la de 80, se estableció el estándar para el CD (disco compacto), el primer sistema de audio digital masivo. En ese momento, se determinó que la resolución adecuada para alta calidad sería de 16 bits (65.536 valores diferentes). Sin embargo, en los estudios y en algunos archivos digitales que se comercializan podemos conseguir resoluciones de 24 o 32 bits.
Respecto a la frecuencia, se considera que el oído humano (de un joven que oye muy bien) es capaz de oír desde 20 Hz hasta 20.000 Hz (20 kHz) por lo que debemos muestrear al menos el doble de velocidad para cumplir. Cuando se definió el CD, se acordó que lo correcto era muestrear a 44,1 kHz. Por supuesto, se puede muestrear a una frecuencia más alta, como 48kHz, 96kHz, 192kHz...
Entonces, el estándar de un CD es asumir un valor entre 65.536 16 posibles (4 bits, tenga en cuenta que en el ejemplo usamos 16 bits, lo que supone solo 44.100 combinaciones) y XNUMX XNUMX veces por segundo.
Los beneficios del sonido digital
Aunque hemos visto que el sonido digital nunca puede tener la calidad teórica del sonido analógico, basta traspasar el umbral de lo perceptible para el oído humano para poder tener la misma calidad en la práctica.
La gran ventaja del sonido digital es que, a diferencia del analógico, no es sensible a las condiciones ambientales y no se deteriora. 0 no se puede convertir en 1 o 1 en 0 a menos que encontremos una enorme interferencia. Además, los sistemas digitales suelen contar con medidas de detección de errores, de forma que si el reproductor detecta que un sonido ha llegado de forma incorrecta, puede solicitar que se vuelva a leer.
Por tanto, la información puede viajar a través de un cable sin sufrir ninguna alteración con materiales más sencillos y económicos que el sonido analógico. No se requieren conectores especiales, solo que el cable sea capaz de transmitir el volumen de datos esperado.
Por otro lado, puedes hacer una copia exactamente igual que el original. Es decir, si el original dice 0011010 y la copia dice 0011010, la copia y el original son perfectamente iguales. Y así se pueden copiar desde la copia de la copia de la copia hasta el infinito sin perder calidad.
Por lo tanto, las ventajas del sonido digital son la inalterabilidad de la información y la capacidad de copiar sin pérdida. Evidentemente si cortamos un CD por la mitad, lo rayamos o creamos una capa de moho, no será legible, ni cero ni uno, pero siempre será mucho más inalterable que la información analógica.
Uno de los puntos donde se consigue una mayor diferencia es en la transmisión over-the-air (radio) que permite enviar la información sin ninguna alteración a diferencia de los medios analógicos.
Alguien dirá: pero en la TDT (televisión digital), por ejemplo, a veces hay defectos o la imagen. Esto se debe a que en la TDT no puedes pedir al emisor que te envíe la información que te ha llegado incorrectamente y por tanto debes utilizarla aunque no sea correcta. Pero si se consigue un mínimo de transmisión correcta, la imagen es la misma que se envió sin ninguna alteración.