Audibility of a CD-Estandar A/D/A Loop Inserted into High-Resolution Audio Playback*
Traducimos un interesante artículo aparecido en el AES donde se comparan los formatos de alta resolución (SACD) frente al estándar del CD.
E. BRAD MEYER, Miembro de la AES AND DAVID R. MORAN,
Miembro de la AES
(EBradMeyer@att.net) (drmoran@aol.com)
Boston Audio Society, Lincoln, MA 01773, USA
Se habla y se escribe con frecuencia sobre la superioridad en la calidad de sonido en audio codificado con más bits y/o a tasas superiores de muestreo que el estándar 16-bit/44.1-kHz del CD. Los autores informan de una serie de tests doble-ciego y comparan la salida analógica de los reproductores de alta resolución, reproduciendo grabaciones en formato alta resolución, con la misma señal y pasada a través de un bucle (A/D/A loop) que se considera un “cuello de botella” del formato 16/44.1. Las pruebas se realizaron durante un período de más de un año, usando diferentes sistemas y una amplia selección de probadores. Los sistemas incluyeron costosos monitores profesionales y un sistema “high-end” con altavoces electrostáticos, cables y equipos de elevado coste. Entre los probadores se contaron con ingenieros de grabación, estudiantes universitarios (cursando un programa de estudios dedicado a la grabación) y audiófilos con vasta experiencia. Los resultados de estas pruebas demuestran que el bucle de conversión A/D/A de 16/44.1 insertado en cualquiera de los sistemas de audio de alta resolución probados y con niveles de escucha normales, se considera indetectable para todos los que participaron en estas pruebas. El ruido que se genera del propio bucle de conversión, fue solamente audible a niveles de escucha muy elevados. |
FUNDAMENTOS
Desde que se implantó el estándar para el formato de codificación
por pulsos 16-bit/44.1-kHz hace más de 25 años, su calidad como
medio de grabación ha sido objeto de constantes críticas, tanto
desde la prensa de audio subjetivista como de profesionales del audio. Las quejas
se concentraron mayoritariamente en definir el sonido percibido como frío,
estéril, “digital”, falto de profundidad. Sin embargo, pruebas
ciegas efectuadas entre los CD´s y sus fuentes originales en formato de
cinta, revelaron que esas percepciones eran infundadas. El estándar CD
era transparente tanto como si la fuente original era analógica o digital.
Mientras, las tecnologías digitales avanzaron, y en los últimos
años, dos nuevas tecnologías de alta resolución, el Super-Audio
CD (SACD) y el DVD-Audio emergieron como alternativas al CD.
La capacidad de incrementar el rango dinámico que otorga la extensión
de bits para realizar el estéreo no ha sido cuestionada, y adicionalmente,
ambos sistemas son multicanales, ciertamente una ventaja potencial para la reproducción
de audio doméstica. Pero, dejando de lado estas reconocidas ventajas,
ambos sistemas fueron presentados como un medio superior para la reproducción
de sonido. Tal y como se asegura en estas páginas [1].
Una de las críticas audiófilas mas antiguas y comunes ha sido que el CD carece de la resolución necesaria para reproducir todos los detalles de la música grabada….. El mundo del audio de alta calidad considera al CD como “el cuello de botella”…..El audio de alta resolución proporciona mejor sonido que el CD, y se evidencia a través de que estos formatos proporcionan potencialmente un rango mas amplio en la respuesta de frecuencia y una mayor dinámica…Los anecdotarios dicen que a mayores tasas de muestreo, “suena mejor”. Los comentarios más típicos son que con tasas de muestreo mas altas, el sonido es mas claro, más suave, mejora la definición de los graves, es más “natural”. Dada la experiencia del autor [1], tasas de muestreo más altas pueden ayudar a mejorar la discriminación entre planos sonoros (más o menos profundos), gracias a una mayor separación de instrumentos, estos suenan más claros y más “redondos”.
Las publicaciones, tanto subjetivistas como las de ingeniería de grabación
declararon repetidamente que ambos formatos ofrecen obvias mejoras sonoras sobre
el estándar del CD. Dichas afirmaciones demuestran el desconocimiento
de trabajos previos de investigación [2]-[4], y todas esas publicaciones
se centran en un solo parámetro: la potencialmente mayor extensión
del rango de frecuencias que ofrece la grabación en alta resolución.
(>20kHz).
Sin embargo, todo indica que la calidad del CD es adecuada, y de hecho, Plenge
[2], al inicio de la era del CD, insinúa que el rango de frecuencias
del CD es mayor de lo necesario.
LAS PRUEBAS
A pesar de lo que se les atribuye, ni el SACD ni el DVD-A, hasta donde los
autores conocen, han sido objeto de pruebas ciegas controladas sobre la superioridad
de los nuevos formatos sobre el CD, o al menos no se han publicado los resultados.
Con la publicación de las descripciones hechas por Stuart [1] en este
periódico, estaba claro que debíamos de una buena vez por todas
cerrar este capítulo científicamente.
En este reporte se describen las comparativas doble-ciego de un sistema estéreo
de alta resolución contra la misma señal analógica pasadas
a través de un lazo A/D/A (o sea, conversión AD/DA) [ver Fig.
1].
Al contrario de previas investigaciones, nuestras pruebas fueron diseñadas
para que fuera posible revelar cualquier tipo de diferencia audible entre formato
de alta resolución y el CD, diferencias que en muchos casos, y de acuerdo
a las distintas publicaciones que así lo sostienen, ocurren dentro del
comúnmente aceptado rango de frecuencias audibles (20Hz-20kHz). Las (teóricas)
ventajas sonoras de las señales de alta resolución no deberían
sobrevivir a la degradación aplicada por medio del bucle a 16/44.1 actuando
como cuello de botella, por tanto, se deberían escuchar evidentes diferencias.
Con la cooperación de aproximadamente 60 miembros del BAS (Boston Audio
Society) y muchas otras personas implicadas, se llevaron a cabo varias series
de pruebas de audición, tipo, doble-ciego a lo largo de un período
de aproximadamente un año. Muchos tipos de músicas incluidas las
vocales fueron elegidas como fuentes, desde música clásica (coral,
cámara, piano, sinfónicas) hasta jazz, pop y rock.
Entre los sujetos probadores se incluyeron tanto hombres como mujeres de todas
las edades, con varios niveles de experiencia en música y audio; muchos
fueron profesionales del audio o estudiantes avanzados de arte.
La mayoría de las pruebas fueron efectuadas usando un par de conocidos
y bien estimados altavoces toda-banda “full range” en una sala ubicada
en área rural, con un nivel de ruido ambiente de aprox, 19dBA SPL y con
toda la electrónica encendida (ver Fig. 2).
También efectuamos pruebas con el mismo sistema en otras salas: en un
estudio de masterización en las cercanías de Boston, equipados
con voluminosos monitores de estudio de 4 vías, una sala de una universidad
local, también equipada con grandes monitores alimentados con mucha potencia
en una sala dedicada (los sujetos en esta prueba fueron estudiantes de esta
universidad), y en un domicilio particular con una sala “High-End”,
equipada con reconocidos altavoces electrostáticos acompañados
de carísimas electrónicas y cables.
En todas las ocasiones, los sujetos probadores fueron sometidos a pruebas un tanto informales para determinar los límites de escucha de altas frecuencias de cada uno y así, poder conocer, si existiese alguna relación entre este parámetro y la capacidad de escuchar diferencias. Para el lazo de 16/44.1, usamos un grabador de CD profesional con capacidad de monitorado en tiempo real. Los niveles en ambos canales fueron ajustados en un margen de +/-0.1dB usando una etapa analógica de ganancia ajustable de muy alto rendimiento, que se encontraba siempre en el camino de la señal de 16/44.1.
El conmutador de audio usado fue el ABX CS-5 (ver fig. 3). El audio de alta
resolución ofrece un nivel de ruido digital mas bajo, luego los niveles
de SPL son un factor significativo. Ahora bien, ¿tiene esto alguna consecuencia
práctica dadas las técnicas de compresión modernas y el
ruido base en micrófonos, pre-amplificadores y mesas de mezcla?
Encontramos que la mayoría de las grabaciones en SACD y DVD-A produjeron
lo que podría expresarse como “reproducción realística”
(esto es, los sujetos probadores escucharon las grabaciones claramente, con
timbres naturales, a niveles altos y en un escala apropiada pero sin llegar
a molestar) en un sistema con una ganancia tal que en tercios de octava de 1Khz
contenía un nivel medio de -16dBFS lo cual, produjo un SPL en la posición
de escucha de 85dB no compensado (sin filtrado).
Fig. 1. Diagrama de bloque del test doble-ciego para la comparación en
la reproducción de alta resolución frente a la señal de
dos canales (estéreo) a través del lazo de conversión 16/44.
(Dibujado por Roy Allison.)
En ocasiones, con algunas grabaciones de música clásica conteniendo
un rango dinámico muy amplio, los niveles llegaron a superar en 5-7 dB
los 85dB, llegando a los 90-92 dB).
La señal de referencia utilizada para producir los 85dB de SPL se puede
obtener en la página web de la Boston Audio Society.
El barrido “sweep” de frecuencias utilizado al mismo nivel de reproducción
a manera de test para determinar los límites de escucha en alta frecuencias
de los probadores, también están disponibles en la misma página
web: www.bostonaudiosociety.org/media.
LOS RESULTADOS
Los resultados para detectar el bucle 16/44.1 en la reproducción de
un SACD/DVD-A fueron los que arrojan la cifra del 49.82%. De donde se efectuaron
554 pruebas y 276 fueron las respuestas correctas. Las únicas excepciones
fueron en condiciones de prueba sin señal y con alta ganancia en los
sistemas, donde la diferencia de ruido de fondo entre las dos tecnologías,
la moderna y la antigua, eran audibles. A medida que las pruebas avanzaban,
clasificábamos los resultados permanentemente para establecer una relación
entre edad, sexo, experiencia o límites de audición de altas frecuencias.
No se pudo establecer ninguna relación.
Específicamente y escuchando música a niveles normales tal y como
aquí se describen, los audiófilos y/o los profesionales en la
materia obtuvieron 246 aciertos en 467 pruebas, es decir, un acierto del 52,7%.
El sexo femenino obtuvo 18 aciertos de 48 pruebas, un 37,5%. Los probadores
capaces de escuchar frecuencias por encima de 15Khz obtuvieron 116 aciertos
de 256 pruebas, un 45,3%. Los jóvenes entre los 14 y 25 años de
edad, también obtuvieron un resultado acertado de 116 entre 256 pruebas,
un 45,3%. El mejor resultado obtenido en una sola prueba fue 8 de 10, aún
lejos del nivel aceptable para la prueba, el 95%.
Hubieron 2 resultados obtenidos de 7 sobre 10, todas las demás pruebas
fueron inferiores al 70% de aciertos. Además, ninguno de los sistemas
más caros y cuidadosamente escogidos (sistemas que pertenecen a audiófilos
apasionados, estudiantes de la materia y/o experimentados profesionales de grabación)
revelaron diferencias detectables escuchando música a los niveles previamente
descriptos.
En una de las pruebas con 2 sujetos, aumentamos el nivel de ganancia en 14dB sobre el nivel de referencia y probamos ambas fuentes sin señal, para comprobar si el nivel de ruido de fondo del CD era o no audible. A pesar de que uno de los 2 sujetos tenia dudas sobre su capacidad para escuchar este ruido, ambos acertaron 10 sobre 10 al detectar el formato CD. Aún no hemos determinado el límite inferior audible de este ruido. Con ganancias de mas de 14dB sobre la referencia, detectar el mayor ruido de fondo del CD era fácil y con total seguridad. Pruebas con otros sujetos no fueron necesarias.
Fig. 2. Posición de escucha para la mayoría de las pruebas.
Las fuentes de alta resolución (SACD/DVD-A) a +14dB sobre la referencia eran incómodas de escuchar, a veces, inescuchables e insoportablemente altas y sobre todo, en los discos CD modernos con masterizaciones agresivas lo fueron aún más. Ruidos de sala y/o los ruidos de pre-amplificadores en casi todas las grabaciones, enmascararon el ruido de fondo del 16/44.1, si bien encontramos una o dos producciones en las cuales era detectable una diferencia en el ruido de sala a ganancias de +20dB o más y por encima del nivel de referencia. A tan altas ganancias, también pudimos escuchar pequeños errores de decodificación en todos excepto en los más caros reproductores de alta resolución.
De las muchas y variadas grabaciones utilizadas concluimos que prácticamente ninguna grabación musical, vocal, instrumental o solista excede de la capacidad de una buena grabación en formato de CD y reproducida por medio de nuestro bucle de conversión. El CD tiene un adecuado ancho de banda y suficiente rango dinámico para cualquier tipo de reproducción doméstica y es, en una extraña ocasión y situación en la que exista tanto silencio, como para mostrar el ruido de fondo de nuestro bucle A/D/A de 16 bits (el cual no era un bucle optimizado ya que carece de corrector de ruidos) aún a ganancias superiores a nuestra referencia.
CONCLUSIONES
Hemos analizado todos los resultados de las pruebas por tipo de música y canciones específicas, tipos de tecnología de alta resolución, antigüedad de la grabación y edad del probador, sexo, experiencia y capacidad de escucha. Ninguna de estas variables han demostrado relación alguna con los resultados o con las diferencias entre las respuestas y el azar. Los trabajos anteriormente citados, algunos de ellos fueron elaborados al comienzo de la era del CD e incluyendo otros mas recientes, coincidían con nuestro resultado.
Aprovechando el ímpetu de la moda “alta resolución” y las anécdotas a lo largo de la última década al respecto y culminando con las palabras de Stuart, sentimos la necesidad de ir mas allá y realizar un conciso, un preciso y claro test doble ciego con ajuste de niveles para determinar si la tecnología 16/44.1 degradaría el sonido audible de los mejores discos de alta resolución que pudiéramos encontrar. Utilizamos una amplia y variada selección de probadores serios, realizamos nuestras pruebas utilizando diferentes tipos de reproductores, sistemas y salas de alta calidad, y nos tomamos el tiempo que consideramos necesario para establecer la calidad del estándar CD. Ahora bien, es muy difícil utilizar resultados negativos para probar la imposibilidad de escuchar un fenómeno o proceso determinado. Siempre existe la remota posibilidad que un sistema diferente o un par de oídos muy finos podría detectar alguna diferencia. Pero hemos compilado suficientes datos, utilizando diversos sistemas y probadores suficientemente capaces como para determinar que la carga de la prueba ahora se ha trasladado a quienes afirmen lo contrario. Quienes mantengan en el futuro que el sistema 16/44.1 degrada las señales de alta resolución deberían soportarlo mediante pruebas doble ciego debidamente controladas y documentadas.
NOTA SOBRE LAS GRABACIONES EN ALTA RESOLUCION
A pesar de que nuestras pruebas no aportan credibilidad a las afirmaciones
sobre las ventajas de los formatos de alta resolución en estéreo,
la impresión inicial y sostenida durante la duración de dichas
pruebas fue que “prácticamente todas las grabaciones en SACD y
DVD-A sonaron mejores que la mayoría de los CD´s, algunos incluso
mucho mejor”.
Si no hubiéramos “degradado” el sonido de estas grabaciones
a “calidad CD” y hubiésemos optado por pruebas del tipo doble
ciego para detectar diferencias audibles entre formatos, sin duda, hubiéramos
estado tentados de adjudicar esta superioridad al proceso de grabación
utilizado en estos formatos. Las probables razones a las cuales se debe la alta
calidad de estas grabaciones se discutieron con algunos de los ingenieros que
trabajan actualmente en este campo.
Fig. 3. Fotografía de las condiciones del test.
Este segmento de negocios es un nicho de mercado en el cual los usuarios finales son preseleccionados, tanto por sus capacidades auditivas, como por su disposición a comprar equipos y sistemas caros, ajustarlos correctamente y escucharlos detenidamente en un ambiente de bajo ruido. Dado que, de cierta manera, estas grabaciones no han suscitado el interés de los consumidores de forma masiva, los ingenieros y los productores han obtenido la libertad de producir grabaciones que suenen tan bien como son capaces de hacerlas sonar, sin utilizar compresión o ecualizar la señal para que se adapten a sistemas de baja gama y condiciones de escucha regulares. Estas grabaciones aparentemente están realizadas con el mayor cuidado y dedicación por parte de los ingenieros que intentan obtener el mejor resultado según sus propios gustos y el de sus clientes. Al menos, así parece ser en todos los sellos. Los discos de alta resolución no tienen, en una amplísima mayoría, la música contenida dentro de los últimos 20 o incluso 10 dB del rango dinámico disponible, tal y como muchos CDs lo tienen hoy por hoy.
Nuestras pruebas indican que todas estas grabaciones podrían haberse sido lanzadas en formato CD convencional y sin notarse ninguna diferencia audible. Sin embargo, no tendrían aceptación entre los que poseen sistemas y hábitos de escucha que permitan se aprecien estas características. El secreto, al menos para la música en 2 canales, parece no estar en las grabaciones de altos vuelos sino en el mercado de altos vuelos...( Entiéndase que el secreto está en asociar lo “mejor” a un “alto precio”)
REFERENCIAS
[1] J. R. Stuart, “Coding for High-Resolution Audio
Systems,” J. Audio Eng. Soc., vol. 52, pp. 117–144 (2004
Mar.).
[2] G. Plenge, H. Jakubowski, and P. Scho¨ne, “Which
Bandwidth Is Necessary for Optimal Sound Transmission?,”
J. Audio Eng. Soc., vol. 28, pp. 114–119 (1980 Mar.).
[3] T. Nishiguchi, K. Hamasaki, M. Iwaki, and A.
Ando, “Perceptual Discrimination between Musical
Sounds with and without Very High Frequency Components,”
presented at the 115th Convention of the Audio
Engineering Society, J. Audio Eng. Soc. (Abstracts), vol.,
51, p. 1222 (2003 Dec.), convention paper 5876.
[4] D. Blech and M. Yang, “DVD-Audio versus SACD:
Perceptual Discrimination of Digital Coding Formats,”
presented at the 116th Convention of the Audio Engineering
Society, Berlin, Germany, 2004 May 8–11, convention
paper 6086.
LOS AUTORES
E. B. Meyer |
D. R. Moran |
Brad Meyer was born in Baltimore, MD, in 1942 and received a B.A.
degree from Harvard College, Cambridge, MA. He has been recording
concerts since the late 1950s and worked making measurements, calibrating
instruments, reducing data, writing reports, and learning acoustics
at Bolt Beranek and Newman from 1966 to 1972. He started his own company,
Point One Audio, in the late 1970s. He does location recording and
digital editing of classical and some folk material. Mr. Meyer has
been on the executive committee of the AES Boston Section since the
early 1980s and served two years as its chair. In addition to his
past duties as writer and sometime editor of the Boston Audio Society
Speaker newsletter and Society president, he has published audio
|
David Moran was born in Springfield,
OH, in 1947. He studied history and literature at the University of
Rochester, NY and Brandeis University, Waltham, MA, where he received
a B.A. degree. He has an M.A. degree in literature from Columbia University,
New York. |
_
ENGINEERING REPORTS AUDIBILITY OF CD-STANDARD A/D/A LOOP
J. Audio Eng. Soc., Vol. 55, No. 9, 2007 September 779
*Manuscrito recibido el 19/10 -2006, revisado el 5/4 y el 15/6 - 2007 2006 Octubre
19; revisado 2007 abril/junio 15.