Audibility of a CD-Estandar A/D/A Loop Inserted into High-Resolution Audio Playback*

Traducimos un interesante artículo aparecido en el AES donde se comparan los formatos de alta resolución (SACD) frente al estándar del CD.

 

E. BRAD MEYER, Miembro de la AES AND DAVID R. MORAN, Miembro de la AES
(EBradMeyer@att.net) (drmoran@aol.com)

Boston Audio Society, Lincoln, MA 01773, USA

Se habla y se escribe con frecuencia sobre la superioridad en la calidad de sonido en audio codificado con más bits y/o a tasas superiores de muestreo que el estándar 16-bit/44.1-kHz del CD. Los autores informan de una serie de tests doble-ciego y comparan la salida analógica de los reproductores de alta resolución, reproduciendo grabaciones en formato alta resolución, con la misma señal y pasada a través de un bucle (A/D/A loop) que se considera un “cuello de botella” del formato 16/44.1. Las pruebas se realizaron durante un período de más de un año, usando diferentes sistemas y una amplia selección de probadores. Los sistemas incluyeron costosos monitores profesionales y un sistema “high-end” con altavoces electrostáticos, cables y equipos de elevado coste.

Entre los probadores se contaron con ingenieros de grabación, estudiantes universitarios (cursando un programa de estudios dedicado a la grabación) y audiófilos con vasta experiencia. Los resultados de estas pruebas demuestran que el bucle de conversión A/D/A de 16/44.1 insertado en cualquiera de los sistemas de audio de alta resolución probados y con niveles de escucha normales, se considera indetectable para todos los que participaron en estas pruebas. El ruido que se genera del propio bucle de conversión, fue solamente audible a niveles de escucha muy elevados.


FUNDAMENTOS

Desde que se implantó el estándar para el formato de codificación por pulsos 16-bit/44.1-kHz hace más de 25 años, su calidad como medio de grabación ha sido objeto de constantes críticas, tanto desde la prensa de audio subjetivista como de profesionales del audio. Las quejas se concentraron mayoritariamente en definir el sonido percibido como frío, estéril, “digital”, falto de profundidad. Sin embargo, pruebas ciegas efectuadas entre los CD´s y sus fuentes originales en formato de cinta, revelaron que esas percepciones eran infundadas. El estándar CD era transparente tanto como si la fuente original era analógica o digital.

Mientras, las tecnologías digitales avanzaron, y en los últimos años, dos nuevas tecnologías de alta resolución, el Super-Audio CD (SACD) y el DVD-Audio emergieron como alternativas al CD.

La capacidad de incrementar el rango dinámico que otorga la extensión de bits para realizar el estéreo no ha sido cuestionada, y adicionalmente, ambos sistemas son multicanales, ciertamente una ventaja potencial para la reproducción de audio doméstica. Pero, dejando de lado estas reconocidas ventajas, ambos sistemas fueron presentados como un medio superior para la reproducción de sonido. Tal y como se asegura en estas páginas [1].

Una de las críticas audiófilas mas antiguas y comunes ha sido que el CD carece de la resolución necesaria para reproducir todos los detalles de la música grabada….. El mundo del audio de alta calidad considera al CD como “el cuello de botella”…..El audio de alta resolución proporciona mejor sonido que el CD, y se evidencia a través de que estos formatos proporcionan potencialmente un rango mas amplio en la respuesta de frecuencia y una mayor dinámica…Los anecdotarios dicen que a mayores tasas de muestreo, “suena mejor”. Los comentarios más típicos son que con tasas de muestreo mas altas, el sonido es mas claro, más suave, mejora la definición de los graves, es más “natural”. Dada la experiencia del autor [1], tasas de muestreo más altas pueden ayudar a mejorar la discriminación entre planos sonoros (más o menos profundos), gracias a una mayor separación de instrumentos, estos suenan más claros y más “redondos”.

Las publicaciones, tanto subjetivistas como las de ingeniería de grabación declararon repetidamente que ambos formatos ofrecen obvias mejoras sonoras sobre el estándar del CD. Dichas afirmaciones demuestran el desconocimiento de trabajos previos de investigación [2]-[4], y todas esas publicaciones se centran en un solo parámetro: la potencialmente mayor extensión del rango de frecuencias que ofrece la grabación en alta resolución. (>20kHz).

Sin embargo, todo indica que la calidad del CD es adecuada, y de hecho, Plenge [2], al inicio de la era del CD, insinúa que el rango de frecuencias del CD es mayor de lo necesario.

 

LAS PRUEBAS

A pesar de lo que se les atribuye, ni el SACD ni el DVD-A, hasta donde los autores conocen, han sido objeto de pruebas ciegas controladas sobre la superioridad de los nuevos formatos sobre el CD, o al menos no se han publicado los resultados.

Con la publicación de las descripciones hechas por Stuart [1] en este periódico, estaba claro que debíamos de una buena vez por todas cerrar este capítulo científicamente.

En este reporte se describen las comparativas doble-ciego de un sistema estéreo de alta resolución contra la misma señal analógica pasadas a través de un lazo A/D/A (o sea, conversión AD/DA) [ver Fig. 1].

Al contrario de previas investigaciones, nuestras pruebas fueron diseñadas para que fuera posible revelar cualquier tipo de diferencia audible entre formato de alta resolución y el CD, diferencias que en muchos casos, y de acuerdo a las distintas publicaciones que así lo sostienen, ocurren dentro del comúnmente aceptado rango de frecuencias audibles (20Hz-20kHz). Las (teóricas) ventajas sonoras de las señales de alta resolución no deberían sobrevivir a la degradación aplicada por medio del bucle a 16/44.1 actuando como cuello de botella, por tanto, se deberían escuchar evidentes diferencias.

Con la cooperación de aproximadamente 60 miembros del BAS (Boston Audio Society) y muchas otras personas implicadas, se llevaron a cabo varias series de pruebas de audición, tipo, doble-ciego a lo largo de un período de aproximadamente un año. Muchos tipos de músicas incluidas las vocales fueron elegidas como fuentes, desde música clásica (coral, cámara, piano, sinfónicas) hasta jazz, pop y rock.
Entre los sujetos probadores se incluyeron tanto hombres como mujeres de todas las edades, con varios niveles de experiencia en música y audio; muchos fueron profesionales del audio o estudiantes avanzados de arte.

La mayoría de las pruebas fueron efectuadas usando un par de conocidos y bien estimados altavoces toda-banda “full range” en una sala ubicada en área rural, con un nivel de ruido ambiente de aprox, 19dBA SPL y con toda la electrónica encendida (ver Fig. 2).

También efectuamos pruebas con el mismo sistema en otras salas: en un estudio de masterización en las cercanías de Boston, equipados con voluminosos monitores de estudio de 4 vías, una sala de una universidad local, también equipada con grandes monitores alimentados con mucha potencia en una sala dedicada (los sujetos en esta prueba fueron estudiantes de esta universidad), y en un domicilio particular con una sala “High-End”, equipada con reconocidos altavoces electrostáticos acompañados de carísimas electrónicas y cables.

En todas las ocasiones, los sujetos probadores fueron sometidos a pruebas un tanto informales para determinar los límites de escucha de altas frecuencias de cada uno y así, poder conocer, si existiese alguna relación entre este parámetro y la capacidad de escuchar diferencias. Para el lazo de 16/44.1, usamos un grabador de CD profesional con capacidad de monitorado en tiempo real. Los niveles en ambos canales fueron ajustados en un margen de +/-0.1dB usando una etapa analógica de ganancia ajustable de muy alto rendimiento, que se encontraba siempre en el camino de la señal de 16/44.1.

El conmutador de audio usado fue el ABX CS-5 (ver fig. 3). El audio de alta resolución ofrece un nivel de ruido digital mas bajo, luego los niveles de SPL son un factor significativo. Ahora bien, ¿tiene esto alguna consecuencia práctica dadas las técnicas de compresión modernas y el ruido base en micrófonos, pre-amplificadores y mesas de mezcla?

Encontramos que la mayoría de las grabaciones en SACD y DVD-A produjeron lo que podría expresarse como “reproducción realística” (esto es, los sujetos probadores escucharon las grabaciones claramente, con timbres naturales, a niveles altos y en un escala apropiada pero sin llegar a molestar) en un sistema con una ganancia tal que en tercios de octava de 1Khz contenía un nivel medio de -16dBFS lo cual, produjo un SPL en la posición de escucha de 85dB no compensado (sin filtrado).


Fig. 1. Diagrama de bloque del test doble-ciego para la comparación en la reproducción de alta resolución frente a la señal de dos canales (estéreo) a través del lazo de conversión 16/44. (Dibujado por Roy Allison.)


En ocasiones, con algunas grabaciones de música clásica conteniendo un rango dinámico muy amplio, los niveles llegaron a superar en 5-7 dB los 85dB, llegando a los 90-92 dB).
La señal de referencia utilizada para producir los 85dB de SPL se puede obtener en la página web de la Boston Audio Society.

El barrido “sweep” de frecuencias utilizado al mismo nivel de reproducción a manera de test para determinar los límites de escucha en alta frecuencias de los probadores, también están disponibles en la misma página web: www.bostonaudiosociety.org/media.

LOS RESULTADOS

Los resultados para detectar el bucle 16/44.1 en la reproducción de un SACD/DVD-A fueron los que arrojan la cifra del 49.82%. De donde se efectuaron 554 pruebas y 276 fueron las respuestas correctas. Las únicas excepciones fueron en condiciones de prueba sin señal y con alta ganancia en los sistemas, donde la diferencia de ruido de fondo entre las dos tecnologías, la moderna y la antigua, eran audibles. A medida que las pruebas avanzaban, clasificábamos los resultados permanentemente para establecer una relación entre edad, sexo, experiencia o límites de audición de altas frecuencias. No se pudo establecer ninguna relación.

Específicamente y escuchando música a niveles normales tal y como aquí se describen, los audiófilos y/o los profesionales en la materia obtuvieron 246 aciertos en 467 pruebas, es decir, un acierto del 52,7%. El sexo femenino obtuvo 18 aciertos de 48 pruebas, un 37,5%. Los probadores capaces de escuchar frecuencias por encima de 15Khz obtuvieron 116 aciertos de 256 pruebas, un 45,3%. Los jóvenes entre los 14 y 25 años de edad, también obtuvieron un resultado acertado de 116 entre 256 pruebas, un 45,3%. El mejor resultado obtenido en una sola prueba fue 8 de 10, aún lejos del nivel aceptable para la prueba, el 95%.

Hubieron 2 resultados obtenidos de 7 sobre 10, todas las demás pruebas fueron inferiores al 70% de aciertos. Además, ninguno de los sistemas más caros y cuidadosamente escogidos (sistemas que pertenecen a audiófilos apasionados, estudiantes de la materia y/o experimentados profesionales de grabación) revelaron diferencias detectables escuchando música a los niveles previamente descriptos.

En una de las pruebas con 2 sujetos, aumentamos el nivel de ganancia en 14dB sobre el nivel de referencia y probamos ambas fuentes sin señal, para comprobar si el nivel de ruido de fondo del CD era o no audible. A pesar de que uno de los 2 sujetos tenia dudas sobre su capacidad para escuchar este ruido, ambos acertaron 10 sobre 10 al detectar el formato CD. Aún no hemos determinado el límite inferior audible de este ruido. Con ganancias de mas de 14dB sobre la referencia, detectar el mayor ruido de fondo del CD era fácil y con total seguridad. Pruebas con otros sujetos no fueron necesarias.

Fig. 2. Posición de escucha para la mayoría de las pruebas.

Las fuentes de alta resolución (SACD/DVD-A) a +14dB sobre la referencia eran incómodas de escuchar, a veces, inescuchables e insoportablemente altas y sobre todo, en los discos CD modernos con masterizaciones agresivas lo fueron aún más. Ruidos de sala y/o los ruidos de pre-amplificadores en casi todas las grabaciones, enmascararon el ruido de fondo del 16/44.1, si bien encontramos una o dos producciones en las cuales era detectable una diferencia en el ruido de sala a ganancias de +20dB o más y por encima del nivel de referencia. A tan altas ganancias, también pudimos escuchar pequeños errores de decodificación en todos excepto en los más caros reproductores de alta resolución.

De las muchas y variadas grabaciones utilizadas concluimos que prácticamente ninguna grabación musical, vocal, instrumental o solista excede de la capacidad de una buena grabación en formato de CD y reproducida por medio de nuestro bucle de conversión. El CD tiene un adecuado ancho de banda y suficiente rango dinámico para cualquier tipo de reproducción doméstica y es, en una extraña ocasión y situación en la que exista tanto silencio, como para mostrar el ruido de fondo de nuestro bucle A/D/A de 16 bits (el cual no era un bucle optimizado ya que carece de corrector de ruidos) aún a ganancias superiores a nuestra referencia.


CONCLUSIONES

Hemos analizado todos los resultados de las pruebas por tipo de música y canciones específicas, tipos de tecnología de alta resolución, antigüedad de la grabación y edad del probador, sexo, experiencia y capacidad de escucha. Ninguna de estas variables han demostrado relación alguna con los resultados o con las diferencias entre las respuestas y el azar. Los trabajos anteriormente citados, algunos de ellos fueron elaborados al comienzo de la era del CD e incluyendo otros mas recientes, coincidían con nuestro resultado.

Aprovechando el ímpetu de la moda “alta resolución” y las anécdotas a lo largo de la última década al respecto y culminando con las palabras de Stuart, sentimos la necesidad de ir mas allá y realizar un conciso, un preciso y claro test doble ciego con ajuste de niveles para determinar si la tecnología 16/44.1 degradaría el sonido audible de los mejores discos de alta resolución que pudiéramos encontrar. Utilizamos una amplia y variada selección de probadores serios, realizamos nuestras pruebas utilizando diferentes tipos de reproductores, sistemas y salas de alta calidad, y nos tomamos el tiempo que consideramos necesario para establecer la calidad del estándar CD. Ahora bien, es muy difícil utilizar resultados negativos para probar la imposibilidad de escuchar un fenómeno o proceso determinado. Siempre existe la remota posibilidad que un sistema diferente o un par de oídos muy finos podría detectar alguna diferencia. Pero hemos compilado suficientes datos, utilizando diversos sistemas y probadores suficientemente capaces como para determinar que la carga de la prueba ahora se ha trasladado a quienes afirmen lo contrario. Quienes mantengan en el futuro que el sistema 16/44.1 degrada las señales de alta resolución deberían soportarlo mediante pruebas doble ciego debidamente controladas y documentadas.

NOTA SOBRE LAS GRABACIONES EN ALTA RESOLUCION

A pesar de que nuestras pruebas no aportan credibilidad a las afirmaciones sobre las ventajas de los formatos de alta resolución en estéreo, la impresión inicial y sostenida durante la duración de dichas pruebas fue que “prácticamente todas las grabaciones en SACD y DVD-A sonaron mejores que la mayoría de los CD´s, algunos incluso mucho mejor”.

Si no hubiéramos “degradado” el sonido de estas grabaciones a “calidad CD” y hubiésemos optado por pruebas del tipo doble ciego para detectar diferencias audibles entre formatos, sin duda, hubiéramos estado tentados de adjudicar esta superioridad al proceso de grabación utilizado en estos formatos. Las probables razones a las cuales se debe la alta calidad de estas grabaciones se discutieron con algunos de los ingenieros que trabajan actualmente en este campo.

 


Fig. 3. Fotografía de las condiciones del test.

Este segmento de negocios es un nicho de mercado en el cual los usuarios finales son preseleccionados, tanto por sus capacidades auditivas, como por su disposición a comprar equipos y sistemas caros, ajustarlos correctamente y escucharlos detenidamente en un ambiente de bajo ruido. Dado que, de cierta manera, estas grabaciones no han suscitado el interés de los consumidores de forma masiva, los ingenieros y los productores han obtenido la libertad de producir grabaciones que suenen tan bien como son capaces de hacerlas sonar, sin utilizar compresión o ecualizar la señal para que se adapten a sistemas de baja gama y condiciones de escucha regulares. Estas grabaciones aparentemente están realizadas con el mayor cuidado y dedicación por parte de los ingenieros que intentan obtener el mejor resultado según sus propios gustos y el de sus clientes. Al menos, así parece ser en todos los sellos. Los discos de alta resolución no tienen, en una amplísima mayoría, la música contenida dentro de los últimos 20 o incluso 10 dB del rango dinámico disponible, tal y como muchos CDs lo tienen hoy por hoy.

Nuestras pruebas indican que todas estas grabaciones podrían haberse sido lanzadas en formato CD convencional y sin notarse ninguna diferencia audible. Sin embargo, no tendrían aceptación entre los que poseen sistemas y hábitos de escucha que permitan se aprecien estas características. El secreto, al menos para la música en 2 canales, parece no estar en las grabaciones de altos vuelos sino en el mercado de altos vuelos...( Entiéndase que el secreto está en asociar lo “mejor” a un “alto precio”)


REFERENCIAS

[1] J. R. Stuart, “Coding for High-Resolution Audio
Systems,” J. Audio Eng. Soc., vol. 52, pp. 117–144 (2004
Mar.).
[2] G. Plenge, H. Jakubowski, and P. Scho¨ne, “Which
Bandwidth Is Necessary for Optimal Sound Transmission?,”
J. Audio Eng. Soc., vol. 28, pp. 114–119 (1980 Mar.).
[3] T. Nishiguchi, K. Hamasaki, M. Iwaki, and A.
Ando, “Perceptual Discrimination between Musical
Sounds with and without Very High Frequency Components,”
presented at the 115th Convention of the Audio
Engineering Society, J. Audio Eng. Soc. (Abstracts), vol.,
51, p. 1222 (2003 Dec.), convention paper 5876.
[4] D. Blech and M. Yang, “DVD-Audio versus SACD:
Perceptual Discrimination of Digital Coding Formats,”
presented at the 116th Convention of the Audio Engineering
Society, Berlin, Germany, 2004 May 8–11, convention
paper 6086.


LOS AUTORES

E. B. Meyer
D. R. Moran

Brad Meyer was born in Baltimore, MD, in 1942 and received a B.A. degree from Harvard College, Cambridge, MA. He has been recording concerts since the late 1950s and worked making measurements, calibrating instruments, reducing data, writing reports, and learning acoustics at Bolt Beranek and Newman from 1966 to 1972. He started his own company, Point One Audio, in the late 1970s. He does location recording and digital editing of classical and some folk material. Mr. Meyer has been on the executive committee of the AES Boston Section since the early 1980s and served two years as its chair. In addition to his past duties as writer and sometime editor of the Boston Audio Society Speaker newsletter and Society president, he has published audio
articles for the Boston Phoenix, High Fidelity, Stereo Review, and Stereophile.

 

 

 

David Moran was born in Springfield, OH, in 1947. He studied history and literature at the University of Rochester, NY and Brandeis University, Waltham, MA, where he received a B.A. degree. He has an M.A. degree in literature from Columbia University, New York.
He is a writer and editor, with particular interest in audio, music, and technology. He was audio editor (also managing editor) of the Boston Phoenix during the 1970s and worked for dbx engineering through the 1980s. He has been president of the Boston Audio Society and editor of its BAS Speaker newsletter, and has reviewed loudspeakers for CD Review, Digital Audio, Speaker Builder, Car Stereo Review, and currently for Sensible Sound magazine and the BAS Speaker. He also has annotated and produced CDs and written about music (classical and popular) for publications from the Boston Globe, Phoenix, and Herald to Stereo Review, has received two NEA fellowships for
classical criticism, and recently helped edit the NPR Listeners’
Encyclopedia of Classical Music. He currently works as a technical writer at BBN Technologies in Cambridge, MA.

 


_

ENGINEERING REPORTS AUDIBILITY OF CD-STANDARD A/D/A LOOP
J. Audio Eng. Soc., Vol. 55, No. 9, 2007 September 779


*Manuscrito recibido el 19/10 -2006, revisado el 5/4 y el 15/6 - 2007 2006 Octubre 19; revisado 2007 abril/junio 15.