Profundidad de bits de audio

Ir a: navegación, búsqueda de
Una señal analógica (en rojo) codificada a 4 bits PCM digital las muestras (en azul); la profundidad de bits es 4, entonces la amplitud de cada muestra es uno de los 16 valores posibles.

En audio digital usando modulación por impulsos codificados (PCM), profundidad de bits es el número de brocas de la información en cada uno muestra, y corresponde directamente a la resolución de cada muestra. Ejemplos de profundidad de bits Compact Disc Digital Audio, que utiliza 16 bits por muestra, y DVD-Audio y Disco Blu-ray que puede soportar hasta 24 bits por muestra.

En implementaciones básicas, variaciones en la profundidad de bits afectan principalmente el nivel de ruido de error de cuantización— por lo tanto el relación señal / ruído (SNR) y rango dinámico. Sin embargo, las técnicas tales como el tramado, forma de ruido y sobremuestreo mitigar estos efectos sin cambiar la profundidad de bits. También afecta la profundidad de bits tasa de bits y el tamaño del archivo.

Profundidad de bits sólo es significativa en referencia a un PCM señal digital. Non-PCM formatos, tales como tipo de compresión formatos como MP3, AAC y Vorbis, no tienen asociados poco profundo. Por ejemplo, mp3, cuantificación se realiza en muestras PCM que se han transformado en la dominio de la frecuencia.

Contenido

  • 1 Resolución binario
    • 1.1 Coma flotante
  • 2 Cuantización
    • 2.1 Procesamiento de audio
  • 3 "Dither"
  • 4 Rango dinámico
    • 4.1 Sobremuestreo
    • 4.2 Forma de ruido
  • 5 Aplicaciones
  • 6 Poco ritmo y tamaño de archivo
  • 7 Véase también
  • 8 Notas
  • 9 Referencias

Resolución binario

Una señal PCM es una secuencia de muestras de audio digitales que contiene los datos que proporciona la información necesaria para reconstruir el original señal analógica. Cada muestra representa el amplitud de la señal en un punto específico en el tiempo y las muestras están uniformemente espaciados en el tiempo. La amplitud es la única información almacenada explícitamente en la muestra, y típicamente se almacena como un número entero o un coma flotante número, codificado como un número binario con un número fijo de dígitos: de la muestra profundidad de bits.

Aumenta la resolución de enteros binarios exponencial medida que aumenta la longitud de palabra. Agregar un poquito de dobles la resolución, añadiendo dos cuádruples y así sucesivamente. El número de posibles valores que pueden ser representadas por una profundidad de bits enteros puede calcularse mediante el uso de 2n, donde n es la profundidad de bits.[1] Por lo tanto, un 16-bit el sistema tiene una resolución de 65.536 (216) valores posibles.

Normalmente se almacenan los datos audio PCM como firmado números en complemento a dos formato.[2]

Coma flotante

Muchos audio formatos de archivo y estaciones de trabajo de audio digitales (DAW) ahora soportan formatos PCM con muestras representadas por coma flotante números. Tanto el WAV formato de archivo y la AIFF formatos de archivos compatibles PCM de punto flotante[3][4] y DAWs principales tales como Pro Tools, Razón, FL Studio, y Ableton Live apoyo variadas capacidades de procesamiento de punto flotante.[5][6][7][8]

A diferencia de enteros, cuyo patrón de bits es una serie única de bits, punto flotante de un número en su lugar se compone de campos separados cuya relación matemática forma un número. El estándar más común es Coma flotante IEEE que se compone de tres patrones: un bit de signo que representa el número es positivo o negativo, un exponente y un mantisa que es criado por el exponente. La mantisa se expresa como un fracción binaria en formatos de punto flotantes de IEEE base dos.[9]

Cuantización

Los límites de profundidad de bits del relación señal / ruído (SNR) de la señal reconstruida hasta un nivel máximo determinado por Cuantización error. La profundidad de bits no tiene impacto en la respuesta de frecuencia, que está limitada por la frecuencia de muestreo.

Ruido de cuantización es un modelo del error de cuantización introducida por el muestreo durante el proceso conversión de analógico a digital (ADC). Es un error de redondeo entre la tensión de entrada analógica de la ADC y el valor de salida digitalizado. El ruido es no lineal y dependiente de la señal.

Un 8-bit número binario del valor diez base 149 con LSB resaltada.

En un ADC ideal, donde el error de cuantificación se distribuye uniformemente entre \scriptstyle{\pm \frac{1}{2}} bit menos significativo (LSB) y donde la señal tiene una distribución uniforme cubren todos los niveles de cuantificación, la relación señal a ruido cuantización (SQNR) puede calcularse a partir

\mathrm{SQNR} = 20 \log_{10}(2^Q) \approx 6.02 \cdot Q\ \mathrm{dB} \,\!

donde Q es el número de bits de cuantificación y el resultado se mide en decibelios (dB).[10][11]

24-bit audio digital tiene un SNR teórica máxima de 144 dB, comparado con 96 dB para 16-bit; Sin embargo, a partir de 2007 tecnología del convertidor de audio digital se limita a un SNR de aproximadamente 124 dB (21 bits)[12] debido a limitaciones reales en circuito integrado diseño. Aún así, aproximadamente coincide con el rendimiento del ser humano sistema auditivo.[13][14]

Relación señal / ruído y resolución de las profundidades de bits
brocas # SNR Valores enteros posible (por ejemplo) Base diez gama firmado (por ejemplo)
4 24,08 dB 16 −8 a + 7
8 48,16 dB 256 −128 a +127
11[15] 66,22 dB 2048 −1024 a +1023
16 dB 96,33 65.536 −32, 768 a +32,767
20 dB 120,41 1.048.576 −524, 288 a +524,287
24 dB 144,49 16,777,216 −8, 388, 608 a +8,388,607
32 192,66 dB 4,294,967,296 −2, 147, 483, 648 a +2,147,483,647
48 dB 288,99 281,474,976,710,656 −140, 737, 488, 355, 328 a +140,737,488,355,327
64 385,32 dB 18.446.744.073.709.551.616 −9, 223, 372, 036, 854, 775, 808 a +9,223,372,036,854,775,807

La resolución de las muestras de punto flotante es menos sencilla que muestras entero, pero el beneficio se presenta en la mayor precisión de los valores bajos. En representación de punto flotante, el espacio entre los dos valores adyacentes es de la misma proporción que el espacio entre cualquier otros dos valores adyacentes, mientras que en la representación de un entero, el espacio entre los valores adyacentes se pone más grande en proporción a las señales de bajo nivel. Esto aumenta el SNR porque la exactitud de una señal de alto nivel será igual a la precisión de una señal idéntica a un nivel inferior.[16]

Las ventajas y desventajas entre punto flotante y enteros es que el espacio entre los grandes valores de punto flotante es mayor que el espacio entre los grandes valores de la misma profundidad de bits. Un punto flotante grande resultado número resulta en un error mayor que redondeo un pequeño número de punto flotante, mientras que un número entero de redondeo será siempre en el mismo nivel de error de redondeo. En otras palabras, números enteros tienen redondear es uniforme, siempre redondeando el LSB en 0 o 1 y punto flotante tiene SNR es uniforme, el nivel de ruido de cuantización es siempre de una cierta proporción a nivel de la señal.[16] Un punto flotante piso de ruido se levantará como la señal se eleva y caída como la señal cae, dando como resultado una varianza audible si la profundidad de bits es bastante baja.[17]

Procesamiento de audio

Mayoría de las operaciones de procesamiento de audio digital implica requantization de muestras y así introduce error de redondeo adicional análogo al error de cuantización original introducido durante el análogo a la conversión digital. Para evitar el error más grande que el error implícito de redondeo durante ADC, cálculos durante el proceso deben realizarse en mayores precisiones que las muestras de entrada.[18]

Procesamiento de señal digital Las operaciones (DSP) pueden realizarse en cualquier punto fijo o precisión de punto flotante. En cualquier caso, la precisión de cada operación es determinado por la precisión de las operaciones de hardware utilizado para realizar cada paso del proceso y no la resolución de los datos de entrada. Por ejemplo, en x 86 los procesadores, las operaciones se realiza en 32 o 64 bits de precisión y fijo de punto flotante punto operaciones en 16, 32 o 64 bits resolución. En consecuencia, todo el proceso realizado en hardware basado en Intel llevará a cabo en 16, 32 o 64 bits precisión enteros, o 32 o 64 bits flotante punto precisión independientemente del formato de fuente. Sin embargo, si la memoria es un lujo, software todavía optará a la salida de audio de 16 o 24 bits de resolución más baja después del procesamiento de precisión más alta.

Punto fijo procesadores de señal digital a menudo apoyo inusual palabra tamaños y precisiones con el fin de apoyar las resoluciones señal específica. Por ejemplo, la Motorola 56000 Chip DSP utiliza tamaños de palabra de 24 bits, 24 bits multiplicadores y acumuladores de 56 bits para realizar multiplicar-acumular las operaciones en dos muestras de 24 bits sin desbordamiento o redondeo.[19] En dispositivos que no soportan grandes acumuladores, las operaciones de punto fijo pueden ser implícitamente redondeadas, reducción de precisión inferior a la de las muestras de entrada.

Errores compuesto por varias etapas de DSP a un ritmo que depende de las operaciones realizadas. Para pasos de procesamiento no correlacionados en datos de audio sin un desplazamiento de DC, errores se asumen para ser aleatorio con media cero. Bajo esta premisa, la desviación estándar de la distribución representa la señal de error, y error del quantization escalas con la raíz cuadrada del número de operaciones.[20] Los altos niveles de precisión son necesarios para los algoritmos que involucran procesamiento repetido, tales como convolución.[18] Los altos niveles de precisión también son necesarios en algoritmos recursivos, tales como respuesta impulsiva infinita Filtros (IIR).[21] En el caso particular de filtros IIR, error de redondeo puede degradar la respuesta de frecuencia y causar inestabilidad.[18]

"Dither"

Artículo principal: "Dither"

El ruido introducido por error de cuantización, incluyendo redondeo errores y pérdida de precisión introducido durante el procesamiento de audio, puede ser mitigado mediante la adición de una pequeña cantidad de ruido aleatorio, llamado "dither", a la señal antes de cuantificar. El tramado elimina la granularidad del error de cuantización, dando una distorsión muy baja, pero a expensas de un ligeramente levantada piso de ruido. Medido utilizando ITU-R 468 ponderación de ruido, esto es aproximadamente 66 dB abajo nivel de alineación, o 84 dB debajo de digital escala completa, que es algo más baja que el nivel de ruido de micrófono en la mayoría de las grabaciones y por lo tanto no tiene importancia en audio de 16 bits (véase Programa de nivel para saber más sobre esto).

audio de 24 bits no requiere tramado, como el nivel de ruido del convertidor digital siempre es más fuerte que el nivel requerido de cualquier "dither" que podría aplicarse. audio de 24 bits teóricamente podría codificar 144 dB de rango dinámico, pero no ADCs existen que puede proporcionar más ~ 125 dB.[22]

"Dither" también puede utilizarse para aumentar el rango dinámico efectivo. El percibido rango dinámico de 16-bit audio puede ser tan alta como con forma de ruido de 120 dB "dither", aprovechándose de la respuesta en frecuencia del oído humano.[23]

Rango dinámico

Rango dinámico es la diferencia entre la señal más grande y más pequeña de un sistema puede grabar o reproducir. Sin tramado, el rango dinámico se correlaciona con el piso de ruido de cuantización. Por ejemplo, resolución de entero de 16 bits permite un rango dinámico de unos 96 dB.

Con mayores profundidades de bits durante estudios de grabación acomoda el mayor rango dinámico. Si el rango dinámico de la señal es inferior al permitido por la profundidad de bits, la grabación tiene espacio librey cuanto mayor sea la profundidad de bits, el espacio más que está disponible. Esto reduce el riesgo de recorte sin encontrar errores de cuantificación en bajos volúmenes.

Con la correcta aplicación del tramado, sistemas digitales pueden reproducir señales con niveles más bajos que su resolución permitiría normalmente, extendiendo el alcance dinámico más allá del límite impuesto por la resolución.[24]

El uso de técnicas tales como sobremuestreo y forma de ruido puede ampliar el rango dinámico de audio muestreado moviendo el error de cuantificación de la banda de frecuencia de interés.

Sobremuestreo

Artículo principal: Sobremuestreo

Sobremuestreo es un método alternativo para aumentar el audio de rango dinámico de PCM sin cambiar el número de bits por muestra.[25] En sobremuestreo, muestras de audio se adquieren a un múltiplo de la frecuencia de muestreo deseada. Porque se asume el error del quantization a distribuirse uniformemente con frecuencia, gran parte del error de cuantificación se desplaza a frecuencias ultrasónicas y puede ser eliminado por el convertidor digital a analógico durante la reproducción.

Un aumento equivalente a n bits adicionales de resolución, una señal debe ser sobremuestreada por

 \mathrm{number\ of\ samples} = (2^n)^2 = 2^{2n}.

Por ejemplo, un ADC de 14 bits puede producir audio 48kHz 16 bits si opera en 16 x sobremuestreo o 768 kHz. PCM sobremuestreada intercambia por lo tanto menos bits por muestra más muestras para obtener la misma resolución.

Forma de ruido

Artículo principal: Forma de ruido

Sobremuestreo una señal produce ruido de cuantización igual por unidad de ancho de banda en todas las frecuencias y un rango dinámico que mejora con sólo la raíz cuadrada de la relación de sobremuestreo. Forma de ruido es una técnica que añade ruido adicional en las frecuencias más altas que anula algún error en las frecuencias bajas, lo que resulta en un aumento mayor en rango dinámico cuando sobremuestreo. Para nruido TH-orden que forma, el rango dinámico de una señal de Shaping es mejorado por un adicional 6ndB en relación con sobremuestreo sin forma de ruido.[26] Por ejemplo, para un audio analógico de 20 kHz muestreado en sobremuestreo x 4 con segundo ruido orden formar, se incrementa el rango dinámico de 30 dB. Por lo tanto una señal de 16 bits muestreada a 176 kHz tendría igual resolución como una señal de 21 bits muestreada a 44,1 kHz sin forma de ruido.

Forma de ruido es comúnmente implementado con modulación Delta-Sigma. Usando modulación Delta-Sigma, Super Audio CD Obtiene 120 dB SNR a frecuencias de audio usando 1-bit audio con 64 x sobremuestreo.

Aplicaciones

Profundidad de bits es una propiedad fundamental de las implementaciones de audio digitales y hay una variedad de situaciones donde es una medida.

Bits por muestra y aplicaciones de ejemplo
Aplicación Descripción Formatos de audio
CD-DA (Libro rojo)[27] Medios digitales 16-bit LPCM
DVD-Audio[28] Medios digitales 16, 20 y 24 bits LPCM[Nota 1]
Super Audio CD[29] Medios digitales 1-bit Direct Stream Digital (PDM)
Audio de disco Blu-ray[30] Medios digitales 16, 20 y 24 bits LPCM y otros[Nota 2]
DV audio[31] Medios digitales PCM comprimido de 12 bits y 16 bits PCM sin comprimir
UIT-T Recomendación G.711[32] Estándar para la compresión telefonía 8-bit PCM con companding[Nota 3]
NICAM-1, 2-NICAM y NICAM-3[33] Estándares de compresión para difusión 10, 11 y 10 bits PCM respectivamente, con comprensión-expansión[Nota 4]
Ardour[34] DAW por Paul Davis y La comunidad de Ardour "Todos los datos de muestra se mantiene internamente en 32 bits flotantes formato punto..."
Pro Tools 11[35] DAW por Avid Technology 16 y 24 bits o sesiones de punto flotante de 32 bits y 64 bits de punto flotante mezcla
Logic Pro X[36] DAW por Apple Inc. proyectos de 16 y 24 bits
GarageBand 11 (versión 6)[37] DAW por Apple Inc. 16 bits por defecto con grabación de 24 bits instrumentos reales
9 en vivo[8] DAW por Ableton Live punto flotante de 32 bits de mezcla
Razón 7[38] DAW por Propellerhead Software 16, 20 y 24 bits I/O, aritmética de punto flotante de 32 bits y 64 bits Resumen

Poco ritmo y tamaño de archivo

Profundidad de bits afecta tasa de bits y el tamaño del archivo. Tasa de bits se refiere a la cantidad de datos, específicamente pedacitos, transmitidos o recibidos por segundo.

Véase también

  • Mediciones del sistema de audio
  • Profundidad de color— concepto correspondiente para imágenes digitales
  • Número efectivo de bits

Notas

  1. ^ DVD-Audio también soporta opcional Meridian Lossless Packing, un compresión sin pérdida esquema.
  2. ^ Blu-ray compatible con una variedad de formatos no-LPCM pero todos se ajustan a una combinación de 16, 20 y 24 bits por muestra.
  3. ^ UIT-T especifica el Ley y Μ-law comprensión-expansión algoritmos, comprimiendo abajo de 13 y 14 bits respectivamente.
  4. ^ Sistemas de NICAM 1, 2 y 3 comprimen de 13, 14 y 14 bits respectivamente.

Referencias

  1. ^ Thompson, Dan (2005). Audio comprensión. Berklee Press. ISBN 978-0-634-00959-4.
  2. ^ Smith, julio (2007). "Modulación por impulsos codificados (PCM)". Matemáticas de la discreta Fourier transforma (DFT) con el libro en línea de aplicaciones de Audio, segunda edición,. 22 de octubre de 2012.
  3. ^ Kabal, Peter (03 de enero de 2011). "Especificaciones del formato de archivo de audio, onda especificaciones". La Universidad de McGill. 10 de agosto de 2013.
  4. ^ Kabal, Peter (03 de enero de 2011). "Especificaciones de formato de archivo de audio, AIFF / AIFF-C Especificaciones". La Universidad de McGill. 10 de agosto de 2013.
  5. ^ Campbell, Robert (2013). Pro Tools 10 técnicas de producción de música avanzada, pág. 247. Cengage Learning. 12 de agosto de 2013.
  6. ^ Wherry, Mark (marzo de 2012). "Avid Pro Tools 10".. Sonido en sonido. 10 de agosto de 2013.
  7. ^ Precio, Simon (octubre de 2005). "La razón mezcla Masterclass". Sonido en sonido. 10 de agosto de 2013.
  8. ^ a b "Ableton Reference Manual versión 9, 15. Mezcla". Ableton Live. 2013. 26 de agosto de 2013.
  9. ^ Smith, Steven (1997 – 1998). "Guía del científico y del ingeniero para señales digitales de procesamiento, capítulo 4 – Software DSP / Floating Point (números reales)". www.dspguide.com. 10 de agosto de 2013.
  10. ^ Ver Signal-to-noise ratio #Fixed punto
  11. ^ Walt Kester (2007). "Tomando el misterio de la tristemente célebre fórmula" SNR = 6.02N + 1.76dB, "y qué te importa". Analog Devices. Programa archivado de la original en 16 de junio de 2011. 26 de julio de 2011.
  12. ^ "PCM4222". 21 de abril de 2011.
  13. ^ D. R. Campbell. "Aspectos del oído humano". 21 de abril de 2011. "El rango dinámico del oído humano es [aproximadamente] 120 dB"
  14. ^ "Sensibilidad del oído humano". Programa archivado de la original en 04 de junio de 2011. 21 de abril de 2011. "El rango dinámico práctico podría decirse que es desde el umbral de audición al umbral del dolor [130 dB]"
  15. ^ Esta es la profundidad de bits que el Frambuesa Pi utiliza cuando se conduce el modulador de ancho de pulso de su chip BCM2835[citación necesitada]
  16. ^ a b Smith, Steven (1997 – 1998). "El científico y de Ingeniero Guía de procesamiento, capítulo 28 – procesadores de señal Digital de señal Digital / fijo versus punto flotante". www.dspguide.com. 10 de agosto de 2013.
  17. ^ Moorer, James (septiembre de 1999). "Procesamiento de 48 bits enteros gana 32 bits flotante para aplicaciones de Audio profesionales". www.jamminpower.com. 12 de agosto de 2013.
  18. ^ a b c Tomarakos, John. "LA RELACIÓN DEL TAMAÑO DE PALABRA DE DATOS DE CALIDAD DE SEÑAL Y RANGO DINÁMICO EN APLICACIONES DE PROCESAMIENTO DE AUDIO DIGITAL". www.Analog.com. Sistemas analógicos. 16 de agosto de 2013.
  19. ^ "DSP56001A". Freescale. 15 de agosto de 2013.
  20. ^ Smith, Steven. "el científico y de Ingeniero Guide to Digital Signal Processing". 4 ch.. 19 de agosto de 2013.
  21. ^ Carletta, Joan (2003). "Determinación de precisiones apropiados para señales en filtros IIR punto fijo". DAC. OAI: 10.1.1.92.1266.
  22. ^ Elegir a un ADC audio de alto rendimiento -"Estaba buscando el mejor rango dinámico ADC audio podría encontrar" y más alto son 123 dB de rango dinámico
  23. ^ Montgomery, Chris (25 de marzo de 2012). "24/192 music Downloads.. .y por qué ellos no tiene sentido". Xiph.org. 26 de mayo de 2013. "Con el uso de forma" dither ", que se mueve energía ruido de cuantización en frecuencias donde es más difícil de oír, el rango dinámico efectivo de 16 bit audio alcanza 120dB en la práctica, más de quince veces más profundo que la reclamación 96dB. 120dB es mayor que la diferencia entre un mosquito en algún lugar en la misma habitación y un taladro a pie... o la diferencia entre una habitación 'insonorizada' desierta y un sonido bastante fuerte para causar daños auditivos en segundos. 16 bits es suficiente para almacenar todo lo que oyes y será suficiente para siempre. "
  24. ^ "Tramado en la conversión de analógico a Digital". e2v semiconductores. 2007. 26 de julio de 2011.
  25. ^ Kester, Walt. "Sobremuestreo interpolando DACs". Analog Devices. 19 de agosto de 2013.
  26. ^ "B.1 primer y segundo orden"ruido formar bucles". 19 de agosto de 2013.
  27. ^ "Base de conocimientos de Sweetwater, Masterlink: ¿Qué es un CD de"Libro rojo"?". www.Sweetwater.com. Sweetwater. 27 de abril de 2007. 25 de agosto de 2013.
  28. ^ "Comprensión DVD-Audio" (PDF). Sonic Solutions. 25 de agosto de 2013.
  29. ^ Shapiro, L. (02 de julio de 2001). "Sonido envolvente, página 10". ExtremeTech. 26 de agosto de 2013.
  30. ^ "Papel formato Blu-ray Disc, 2.B Audio Visual especificaciones del formato solicitud para BD-ROM versión 2.4 blanco" (PDF). Blu-ray Disc Association. Abril de 2010. 25 de agosto de 2013.
  31. ^ Puhovski, Nenad (abril de 2000). "DV – UNA HISTORIA DE ÉXITO". www.Stanford.edu. 26 de agosto de 2013.
  32. ^ "G.711: pulso modulación de código (PCM) de las frecuencias de voz" (PDF). Unión Internacional de telecomunicaciones. 25 de agosto de 2013.
  33. ^ "Las señales de sonido DIGITAL: señales acústicas de pruebas para comparar el desempeño de cinco sistemas de comprensión-expansión de alta calidad". Departamento de investigación de la BBC. Agosto de 1978. 26 de agosto de 2013.
  34. ^ "Características clave de ardor". Comunidad de ardor. 2014. 08 de abril de 2014.
  35. ^ "Documentación de pro Tools Pro Tools Reference Guide" (ZIP/PDF). Ávido. 2013. 26 de agosto de 2013.
  36. ^ "Logic Pro X - guía del usuario" (PDF). Apple. De enero de 2010. 26 de agosto de 2013.
  37. ^ "GarageBand 11: configure la resolución de audio". Apple. 13 de marzo de 2012. 26 de agosto de 2013.
  38. ^ "Razón 7 operación Manual" (PDF). Propellerhead Software. 2013. 26 de agosto de 2013.
  • Ken C. Pohlmann (15 de febrero de 2000). Principios de Audio Digital (4ª ed.). Profesional de la McGraw-Colina. ISBN978-0-07-134819-5.

Otras Páginas

Obtenido de"https://en.copro.org/w/index.php?title=Audio_bit_depth&oldid=616622107"