PROYECTO K622

Segundo estudio. Primera parte.

ESTUDIO DINÁMICO COMPARADO PARA LAS VERSIONES DSD, CD, VINILO Y CINTA.

Este segundo estudio se va a concentrar en analizar las diferencias entre formatos desde el punto de vista de dinámica de cada muestra. Para ello se ha empleado el método ya descrito en el artículo "El Sonido Rudy Van Gelder" . Las comparaciones se van a presentar emparejadas, siendo la referencia entre ellas la muestra de sonido PCM-44.1 KHz-16 bits de la capa CD.

COMPARACIÓN DINÁMICA ENTRE LA CAPA CD Y LA GRABACIÓN A PCM DE LA CAPA DSD.

El primer par a comparar es el de la extracción directa de la capa CD del disco SACD y la grabación a PCM-96 KHz de la capa DSD del mismo disco. Se ha tomado, de uno de los dos canales de la señal estereo, una muestra de alrededor de 67 segundos y se ha alineado visualmente tras calcular las envolventes energéticas por transformada de Hilbert. El tiempo de integración en el cálculo de los valores RMS ha sido 50 ms y el salto entre integraciones ha sido de otros 50 ms (0% de solapamiento). A continuación se muestran las evoluciones dinámicas de ambas pistas y su diferencia.

 Figura 1. Curvas ETC de 0 a 20 segundos.

 Figura 2. Curvas ETC de 20 a 40 segundos.

 Figura 3. Curvas ETC de 40 a 60 segundos.

 Figura 4. Curvas ETC de 60 a 67 segundos.

A la vista de estas curvas se puede comprobar que, aparte de la pequeña diferencia de niveles (lógica por haberse grabado el DSD por salida analógica y por haberse ajustado manualmente el nivel de la grabación) a favor de la capa CD, las zonas donde destacan las diferencias entre pistas coinciden con los momentos de menor nivel de señal de la música. Los picos de la capa CD y de la capa DSD están a niveles parejos pero los valles de la curva RMS llegan más abajo en la capa CD que en la DSD. Es decir, el rango dinámico de la capa CD es mayor que en la capa DSD.

Para acotar más claramente estás diferencias vamos a representar la curva dinámica comparada[*], con el siguiente resultado:

 

 Figura 5. Representación dinámica comparada. El eje X representa los niveles de la capa CD y el eje Y el valor dinámico que la capa DSD presenta en el mismo instante de tiempo. Click en la imagen para agrandar.

El ajuste por regresión lineal de la representación de puntos nos indica que, efectivamente, la capa DSD está casi 1 dB (termino A de la regresión) por debajo de la capa CD. Además vemos que la relación dinámica de ambas señales es practicamente 1:1 (termino B del ajuste), salvo cuando la señal desciende a niveles RMS de menos de 40 dB. En ese momento la capa DSD presenta compresión de nivel frente a la capa CD. El rango dinámico RMS de la capa CD es de unos 40 dB y en la capa DSD de unos 4 dB menos.  

Si queremos progresar en este análisis, el siguiente paso es representar las curvas dinámicas comparadas filtradas por bandas de frecuencia. En este caso se han elegido bandas que abarcan una octava cada una (doble de frecuencia), salvo una última curva que va desde 22050 Hz hasta 44100 Hz y que se comentará en detalle más adelante.


Figura 6a

Figura 6b

Figura 6c

Figura 6d

Figura 6e

Figura 6f

Figura 6g

Figura 6h

Figura 6i

Figura 6j
Figuras 6a a 6j. Representaciones dinámicas comparadas para las señales filtradas en diez bandas de frecuencia. Click en cada imagen para agrandar. 

Del estudio de las Figuras 6x, se puede concluir que salvo en la última octava, donde la capa CD está comprimida en nivel con respecto a la capa DSD, en el resto ambas pistas son dinámicamente muy semejantes, con diferencias lejos de lo audible. La diferencia de niveles en el agudo de 10 KHz a 22 KHz quizás podría ser audible, aunque habría que comprobarlo mediante prueba de escucha.

La Figura 7 merece una explicación aparte. En este caso estamos filtrando de 22.5 KHz a 44.1 Hz. Este filtro aplicado a la capa CD y según demuestra el Teorema de Shannon, lo que produce es un filtrado por aliasing desde 44.1-22.05 = 22.05 KHz hasta 44.1-44.1 = 0 KHz. Es decir, filtramos la pista completa. Por lo tanto la curva dinámica comparada en el caso de la Figura 7 representa el contenido energético RMS en aproximadamente la octava más alta de la capa DSD-96 KHz frente a la dinámica completa de la capa CD.

Figura 7. Representación dinámicas comparada para las señales filtradas entre 22.05 KHz y 44.1 KHz. Click en cada imagen para agrandar. 

La Figura 7 nos muestra donde está el responsable del recorte dinámico de bajo nivel de la capa DSD. Presenta un contenido RMS en esta banda que constante a unos -53 dB y que es independiente de la dinámica musical (que está entre los -10 dB y los -53 dB). Es básicamente un ruido de fondo que hace que en la Figura 5 se vea esa compresión final a bajo nivel y que compensa sobradamente la expansión que aparece en la anterior banda de agudos (Figura 6j).

Como conclusión, queda mostrado que en este caso hay diferencias dinámicas entre ambas capas y que se concentran en los agudos extremos. De estas diferencias no creemos que puedan extraerse valoraciones cualitativas, más allá del descubrimiento del ruido de fondo de alta frecuencia de la capa DSD.

Vuelta a la introducción.
Segundo estudio. Segunda parte.

VOLVER A MATRIX-HIFI