Menú
Es gratis
registro
casa  /  Problemas/ Configuraciones que afectan la calidad del audio digital. Los mejores formatos de música para calidad de sonido Variedad de formatos de audio digital

Parámetros que afectan la calidad de la grabación de audio digital. Los mejores formatos de música para calidad de sonido Variedad de formatos de audio digital

Objetivos:

educativo:

  • Familiarícese con la tecnología de codificación binaria de archivos Wav
  • Aprende a resolver problemas para determinar el volumen de un archivo de audio WAV

Discretización temporal - un proceso en el que, durante la codificación de una señal de audio continua, una onda de sonido se divide en pequeñas secciones de tiempo separadas, y para cada una de esas secciones se establece un cierto valor de amplitud. Cuanto mayor sea la amplitud de la señal, más fuerte será el sonido.

Profundidad de audio (profundidad de codificación) -número de bits por codificación de audio.

Niveles de volumen (niveles de señal)- el sonido puede tener diferentes niveles de volumen. El número de niveles de volumen diferentes se calcula mediante la fórmula norte= 2 I dondeI- profundidad del sonido.

Frecuencia de muestreo - el número de mediciones del nivel de la señal de entrada por unidad de tiempo (por 1 segundo). Cuanto mayor sea la frecuencia de muestreo, más preciso será el procedimiento de codificación binaria. La frecuencia se mide en hercios (Hz). 1 medida en 1 segundo -1 Hz.

1000 medidas en 1 segundo 1 kHz. Indique la frecuencia de muestreo con la letraD. Para la codificación, elija una de las tres frecuencias:44,1 kHz, 22,05 kHz, 11,025 kHz.

Se cree que el rango de frecuencia que escucha una persona es de 20 Hz a 20 kHz.

Calidad de codificación binaria -un valor que está determinado por la profundidad de codificación y la tasa de muestreo.

Adaptador de audio (tarjeta de sonido) - un dispositivo que convierte las vibraciones eléctricas de la frecuencia del sonido en un código binario numérico cuando se ingresa sonido y viceversa (de un código numérico a vibraciones eléctricas) cuando se reproduce sonido.

Especificaciones del adaptador de audio:frecuencia de muestreo y profundidad de bit de registro).

Capacidad de registro - el número de bits en el registro del adaptador de audio. Cuanto mayor sea la profundidad de bits, menor será el error de cada conversión individual de la magnitud de la corriente eléctrica en un número y viceversa. Si la profundidad de bits es I, luego al medir la señal de entrada, 2I = norte valores diferentes.

Tamaño de archivo de audio mono digital (A) se mide por la fórmula:

A= D* T* I/8 , dondeD - frecuencia de muestreo (Hz),T- tiempo de sonido o grabación de sonido,Iprofundidad de bits del registro (resolución). Esta fórmula mide el tamaño en bytes.

Tamaño de archivo de audio estéreo digital (A) se mide por la fórmula:

A=2* D* T* I/8 , la señal se graba para dos altavoces, ya que los canales de sonido izquierdo y derecho se codifican por separado.

Es útil que los estudiantes entreguen la tabla 1, que muestra cuántos MB ocupará el minuto codificado de información de audio a diferentes frecuencias de muestreo:

Algoritmo 1 (Calcular el volumen de información de un archivo de audio):

1) averiguar cuántos valores se leen en la memoria durante el sonido del archivo;

2) averiguar la profundidad de bits del código (cuántos bits en memoria ocupa cada valor medido);

3) multiplicar los resultados;

4) traducir el resultado a bytes;

5) convertir el resultado a K bytes;

6) traducir el resultado a M bytes;

Algoritmo 2 (Calcula el tiempo de reproducción del archivo).

1) Convertir el volumen de información del archivo a K bytes.

2) Convertir el volumen de información del archivo en bytes.

3) Convertir el volumen de información del archivo en bits.

4) Averigüe cuántos valores se midieron en total (Divida el volumen de información en bits por la capacidad del código).

5) Calcular el número de segundos de sonido. (Divida el resultado anterior por la frecuencia de muestreo).

1. Tamaño del archivo digital

Nivel 3"

1. Determinar el tamaño (en bytes) de un archivo de audio digital cuyo tiempo de reproducción es de 10 segundos a una frecuencia de muestreo de 22,05 kHz y una resolución de 8 bits. El archivo no está comprimido.

Solución:

Fórmula para calcular el tamaño. (en bytes) archivo de audio digital: A= D* T* I/8.

Para convertir a bytes, el valor resultante debe dividirse por 8 bits.

22,05 kHz = 22,05 * 1000 Hz = 22050 Hz

A= D* T* I/8 = 22050 x 10 x 8/8 = 220500 bytes.

Respuesta: el tamaño del archivo es de 220500 bytes.

2. Determine la cantidad de espacio de almacenamiento para un archivo de audio digital que tiene un tiempo de reproducción de dos minutos con una frecuencia de muestreo de 44,1 kHz y una resolución de 16 bits.

Solución:

A= D* T* I/8. - la cantidad de memoria para almacenar el archivo de audio digital.

44100 (Hz) x 120 (s) x 16 (bit) / 8 (bit) = 10584000 bytes = 10335,9375 KB = 10,094 MB.

Respuesta: ≈ 10 Mb

Nivel 4"

3. El usuario dispone de una memoria de 2,6 MB. Necesitas grabar un archivo de audio digital con una duración de 1 minuto. ¿Cuál debería ser la frecuencia de muestreo y la profundidad de bits?

Solución:

Fórmula para calcular la frecuencia de muestreo y la profundidad de bits: D * I \u003d A / T

(memoria en bytes) : (tiempo de reproducción en segundos):

2,6 MB = 2726297,6 bytes

D* I \u003d A / T \u003d 2726297,6 bytes: 60 \u003d 45438,3 bytes

D=45438.3 bytes: yo

La profundidad de bits del adaptador puede ser de 8 o 16 bits. (1 byte o 2 bytes). Por lo tanto, la frecuencia de muestreo puede ser 45438,3 Hz = 45,4 kHz ≈ 44,1kHz- frecuencia de muestreo característica estándar, o 22719,15 Hz = 22,7 kHz ≈ 22,05kHz- frecuencia de muestreo característica estándar

Responder:

Frecuencia de muestreo

Profundidad de bits del adaptador de audio

1 opción

22,05kHz

16 bits

opcion 2

44,1kHz

8 bits

4. La cantidad de memoria libre en el disco es de 5,25 MB, la profundidad de bits de la tarjeta de sonido es de 16. ¿Cuál es la duración del sonido de un archivo de audio digital grabado con una frecuencia de muestreo de 22,05 kHz?

Solución:

Fórmula para calcular la duración del sonido: T=A/D/I

(tamaño de la memoria en bytes) : (frecuencia de muestreo en Hz) : (profundidad de bits de la tarjeta de sonido en bytes):

5,25 MB = 5505024 bytes

5505024 bytes: 22050 Hz: 2 bytes = 124,8 s
Respuesta: 124,8 segundos

5. Un minuto de grabación de un archivo de audio digital ocupa 1,3 MB en el disco, la profundidad de bits de la tarjeta de sonido es 8. ¿Cuál es la frecuencia de muestreo del sonido?

Solución:

Fórmula de frecuencia de muestreo: D =A/T/I

(tamaño de la memoria en bytes) : (tiempo de grabación en segundos) : (profundidad de bits de la tarjeta de sonido en bytes)

1,3 MB = 1363148,8 bytes

1363148,8 bytes: 60:1 = 22719,1 Hz

Respuesta: 22,05 kHz

6. Dos minutos de grabación de audio digital ocupan 5,1 MB de espacio en disco. Frecuencia de muestreo - 22050 Hz. ¿Cuál es el bitness del adaptador de audio?

Solución:

La fórmula para calcular la profundidad de bits es: (memoria en bytes): (tiempo de reproducción en segundos): (frecuencia de muestreo):

5, 1 MB = 5347737,6 bytes

5347737,6 bytes: 120 s: 22050 Hz = 2,02 bytes = 16 bits

Respuesta: 16 bits

7. La cantidad de memoria libre en el disco es de 0,01 GB, la profundidad de bits de la tarjeta de sonido es de 16. ¿Cuál es la duración del sonido de un archivo de audio digital grabado con una frecuencia de muestreo de 44100 Hz?

Solución:

Fórmula para calcular la duración del sondeo T=A/D/I

(tamaño de la memoria en bytes) : (frecuencia de muestreo en Hz) : (profundidad de bits de la tarjeta de sonido en bytes)

0,01 GB = 10737418,24 bytes

10737418,24 bytes: 44100: 2 = 121,74 s = 2,03 min
Respuesta: 20,3 minutos

8. Estime el volumen de información de un archivo de audio mono con una duración de 1 minuto. si la "profundidad" de la codificación y la frecuencia de muestreo de la señal de audio son iguales, respectivamente:
a) 16 bits y 8 kHz;
b) 16 bits y 24 kHz.

Solución:

pero).

16 bits x 8000 = 128 000 bits = 16 000 bytes = 15,625 KB/s

15,625 KB/s x 60 s = 937,5 KB

B).
1) El volumen de información de un archivo de sonido con una duración de 1 segundo es igual a:
16 bits x 24 000 = 384 000 bits = 48 000 bytes = 46,875 KB/s
2) El volumen de información de un archivo de sonido con una duración de 1 minuto es igual a:
46,875 KB/s x 60 s = 2812,5 KB = 2,8 MB

Respuesta: a) 937,5 KB; b) 2,8 MB

Nivel 5"

Se utiliza la tabla 1

9. ¿Cuánto espacio de almacenamiento se requiere para almacenar un archivo de audio digital de alta calidad con un tiempo de reproducción de 3 minutos?

Solución:

Se logra una alta calidad de sonido con una frecuencia de muestreo de 44,1 kHz y una profundidad de bits del adaptador de audio de 16.
La fórmula para calcular la cantidad de memoria es: (tiempo de grabación en segundos) x (profundidad de bits de la tarjeta de sonido en bytes) x (frecuencia de muestreo):
180 s x 2 x 44100 Hz = 15876000 bytes = 15,1 MB
Respuesta: 15,1 MB

10. El archivo de audio digital contiene una grabación de audio de baja calidad (el sonido es oscuro y amortiguado). ¿Cuál es la duración del sonido de un archivo si su volumen es de 650 KB?

Solución:

Para un sonido sombrío y apagado, los siguientes parámetros son característicos: frecuencia de muestreo: 11,025 kHz, profundidad de bits del adaptador de audio: 8 bits (consulte la tabla 1). Entonces T=A/D/I. Traduzcamos el volumen a bytes: 650 KB = 665600 bytes

T=665600 bytes/11025 Hz/1 byte ≈60,4 s

Respuesta: la duración del sonido es de 60,5 s

Solución:

El volumen de información de un archivo de sonido con una duración de 1 segundo es igual a:
16 bits x 48 000 x 2 = 1 536 000 bits = 187,5 KB (multiplicado por 2 desde estéreo).

El volumen de información de un archivo de sonido con una duración de 1 minuto es igual a:
187,5 KB/s x 60 s ≈ 11 MB

Respuesta: 11MB

Respuesta: a) 940 KB; b) 2,8 MB.

12. Calcula el tiempo de reproducción de un archivo de audio mono si, con codificación de 16 bits y una frecuencia de muestreo de 32 kHz, su volumen es igual a:
a) 700 KB;
b) 6300 KB

Solución:

pero).
1) El volumen de información de un archivo de sonido con una duración de 1 segundo es igual a:


700 KB: 62,5 KB/s = 11,2 s

B).
1) El volumen de información de un archivo de sonido con una duración de 1 segundo es igual a:
16 bits x 32 000 = 512 000 bits = 64 000 bytes = 62,5 KB/s
2) El tiempo de reproducción de un archivo de audio mono de 700 KB es:
6300 KB: 62,5 KB/s = 100,8 s = 1,68 min

Respuesta: a) 10 segundos; b) 1,5 min.

13. Calcula cuántos bytes de información ocupa un solo segundo de una grabación estéreo en un CD (frecuencia 44032 Hz, 16 bits por valor). ¿Cuánto dura un minuto? ¿Cuál es la capacidad máxima del disco (suponiendo una duración máxima de 80 minutos)?

Solución:

Fórmula para calcular la cantidad de memoria A= D* T* I:
(tiempo de grabación en segundos) * (profundidad de bits de la tarjeta de sonido en bytes) * (frecuencia de muestreo). 16 bits - 2 bytes.
1) 1s x 2 x 44032 Hz = 88064 bytes (1 segundo CD estéreo)
2) 60s x 2 x 44032 Hz = 5283840 bytes (CD estéreo de 1 minuto)
3) 4800s x 2 x 44032 Hz = 422707200 bytes = 412800 KB = 403,125 MB (80 minutos)

Respuesta: 88064 bytes (1 segundo), 5283840 bytes (1 minuto), 403,125 MB (80 minutos)

2. Definición de calidad de sonido.

Para determinar la calidad del sonido, debe encontrar la frecuencia de muestreo y usar la tabla No. 1

256 (2 8) niveles de intensidad de señal - calidad de sonido de transmisión de radio, usando 65536 (2 16) niveles de intensidad de señal - calidad de sonido de CD de audio. La frecuencia de mayor calidad corresponde a la música grabada en el CD. La magnitud de la señal analógica se mide en este caso 44.100 veces por segundo.

Nivel 5"

13. Determine la calidad del sonido (calidad de transmisión, calidad media, calidad de CD de audio) si sabe que el volumen de un archivo de audio mono con una duración de sonido de 10 segundos. es igual a:
a) 940 KB;
b) 157 KB.

(, pág. 76, núm. 2.83)

Solución:

pero).
1) 940 KB = 962560 bytes = 7700480 bits
2) 7700480 bps: 10 segundos = 770048 bps
3) 770048 bps: 16 bits = 48128 Hz - frecuencia de muestreo - cerca de los 44,1 kHz más altos
Respuesta: calidad de CD de audio

B).
1) 157 KB = 160768 bytes = 1286144 bits
2) 1286144 bits: 10 segundos = 128614,4 bps
3) 128614,4 bps: 16 bits = 8038,4 Hz
Respuesta: calidad de transmisión

Respuesta: a) calidad de CD; b) la calidad de la emisión.

14. Determine la longitud del archivo de sonido que cabrá en un disquete de 3,5”. Tenga en cuenta que se asignan 2847 sectores de 512 bytes para el almacenamiento de datos en dicho disquete.
a) con baja calidad de sonido: mono, 8 bits, 8 kHz;
b) con alta calidad de sonido: estéreo, 16 bits, 48 ​​kHz.

(, pág. 77, núm. 2.85)

Solución:

pero).



8 bits x 8000 = 64 000 bits = 8000 bytes = 7,8 KB/s
3) El tiempo de reproducción de un archivo de audio mono de 1423,5 KB es:
1423,5 KB: 7,8 KB/s = 182,5 s ≈ 3 min

B).
1) El volumen de información de un disquete es igual a:
2847 sectores x 512 bytes = 1457664 bytes = 1423,5 KB
2) El volumen de información de un archivo de sonido con una duración de 1 segundo es igual a:
16 bits x 48 000 x 2 = 1 536 000 bits = 192 000 bytes = 187,5 KB/s
3) El tiempo de reproducción de un archivo de audio estéreo de 1423,5 KB es:
1423,5 KB: 187,5 KB/s = 7,6 s

Respuesta: a) 3 minutos; b) 7,6 segundos.

3. Codificación de audio binario.

Al resolver problemas, utiliza el siguiente material teórico:

Para codificar audio, la señal analógica que se muestra en la figura es

el plano se divide en líneas verticales y horizontales. La división vertical es muestreo de señal analógica (frecuencia de medición de señal), la división horizontal es cuantización por nivel Esos. cuanto más fina es la cuadrícula, mejor se aproxima el sonido analógico con la ayuda de números. La cuantificación de ocho bits se utiliza para digitalizar el habla ordinaria (conversaciones telefónicas) y las transmisiones de radio de onda corta. Dieciséis bits: para digitalizar música y transmisiones de radio VHF (onda ultracorta).

Nivel 3"

15. La señal de audio analógica se muestreó primero usando 256 niveles de intensidad de señal (calidad de sonido de transmisión) y luego usando 65536 niveles de intensidad de señal (calidad de sonido de CD de audio). ¿Cuántas veces difieren los volúmenes de información del sonido digitalizado? (, pág. 77, núm. 2.86)

Solución:

La longitud del código de una señal analógica con 256 niveles de intensidad de señal es de 8 bits, mientras que con 65536 niveles de intensidad de señal es de 16 bits. Dado que la longitud del código de una señal se ha duplicado, los volúmenes de información del sonido digitalizado difieren en un factor de 2.

Respuesta: 2 veces.

Nivel "4"

16. Según el teorema de Nyquist-Kotelnikov, para que una señal analógica se reconstruya con precisión a partir de su representación discreta (a partir de sus muestras), la frecuencia de muestreo debe ser al menos el doble de la frecuencia de audio máxima de esta señal.

  • ¿Cuál debería ser la frecuencia de muestreo del audio humano?
  • ¿Cuál debería ser mayor: la frecuencia de muestreo del habla o la frecuencia de muestreo del sonido de una orquesta sinfónica?

Propósito: introducir a los estudiantes en las características del hardware y software para trabajar con sonido. Actividades: extraer conocimientos de un curso de física (o trabajar con libros de referencia). (, p. ??, tarea 2)

Solución:

Se cree que el rango de frecuencia que escucha una persona es de 20 Hz a 20 kHz. Por lo tanto, de acuerdo con el teorema de Nyquist-Kotelnikov, para que una señal analógica sea restaurada con precisión a partir de su representación discreta (a partir de sus muestras), la frecuencia de muestreo debe ser al menos el doble de la frecuencia de audio máxima de esta señal. La frecuencia de sonido máxima que escucha una persona es de -20 kHz, lo que significa que el aparato ra y el software deben proporcionar una frecuencia de muestreo de al menos 40 kHz y, más precisamente, 44,1 kHz. El procesamiento por computadora del sonido de una orquesta sinfónica implica una tasa de muestreo más alta que el procesamiento del habla, ya que el rango de frecuencia en el caso de una orquesta sinfónica es mucho mayor.

Respuesta: no menos de 40 kHz, la frecuencia de muestreo de una orquesta sinfónica es mayor.

Nivel 5"

17. La figura muestra el sonido de 1 segundo de voz grabado por la grabadora. Codifíquelo en un código digital binario con una frecuencia de 10 Hz y una longitud de código de 3 bits. (, p. ??, tarea 1)

Solución:

La codificación de 10 Hz significa que tenemos que medir el tono 10 veces por segundo. Elijamos momentos equidistantes de tiempo:

Una longitud de código de 3 bits significa 2 3 = 8 niveles de cuantificación. Es decir, como código numérico para el tono en cada momento seleccionado, podemos establecer una de las siguientes combinaciones: 000, 001, 010, 011, 100, 101, 110, 111. Solo hay 8 de ellos, por lo tanto , el tono se puede medir en 8 "niveles":

Vamos a “redondear” los valores de tono al nivel inferior más cercano:

Usando este método de codificación, obtendremos el siguiente resultado (los espacios están establecidos para facilitar la lectura): 100 100 000 011 111 010 011 100 010 110.

Nota. Es aconsejable llamar la atención de los estudiantes sobre la inexactitud con que el código transmite el cambio de amplitud. Es decir, la frecuencia de muestreo de 10 Hz y el nivel de cuantificación de 2 3 (3 bits) son demasiado pequeños. Normalmente, para el sonido (voz), se elige una frecuencia de muestreo de 8 kHz, es decir, 8000 veces por segundo, y un nivel de cuantificación de 2 8 (código de 8 bits de longitud).

Respuesta: 100 100 000 011 111 010 011 100 010 110.

18. Explique por qué el nivel de cuantización es, junto con la frecuencia de muestreo, una de las principales características de la representación del sonido en un ordenador. Objetivos: consolidar la comprensión de los estudiantes de los conceptos de "exactitud de representación de datos", "error de medición", "error de representación"; revise la codificación binaria y la longitud del código con los estudiantes. Tipo de actividad: trabajo con definiciones de conceptos. (, p. ??, tarea 3)

Solución:

En geometría, física, tecnología, existe el concepto de "precisión de medida", estrechamente relacionado con el concepto de "error de medida". Pero también está el concepto "precisión de representación". Por ejemplo, sobre la altura de una persona, se puede decir que él: a) sobre. 2 m, b) poco más de 1,7 m, c) igual a 1 m 72 cm, d) igual a 1 m 71 cm 8 mm. Es decir, se pueden utilizar 1, 2, 3 o 4 dígitos para indicar el crecimiento medido.
Lo mismo es cierto para la codificación binaria. Si solo se utilizan 2 bits para registrar el tono en un momento determinado, incluso si las mediciones fueran precisas, solo se pueden transmitir 4 niveles: bajo (00), por debajo del promedio (01), por encima del promedio (10), alto (11). Si usa 1 byte, puede transferir 256 niveles. Cómo mayor nivel de cuantificación, o, que es lo mismo que Cuantos más bits se asignan para registrar el valor medido, con mayor precisión se transmite el valor.

Nota. Cabe señalar que la herramienta de medición también debe soportar el nivel de cuantificación seleccionado (no tiene sentido representar la longitud medida con una regla con divisiones decimétricas con precisión milimétrica).

El oído humano percibe el sonido en frecuencias que van desde las 20 vibraciones por segundo (sonido bajo) hasta las 20.000 vibraciones por segundo (sonido alto).

Una persona puede percibir el sonido en una amplia gama de intensidades, en la que la intensidad máxima es 10 14 veces mayor que la mínima (cien mil billones de veces). Se utiliza una unidad especial para medir la intensidad de un sonido. "decibel"(dbl) (Cuadro 5.1). Una disminución o aumento del volumen del sonido de 10 dB corresponde a una disminución o aumento de la intensidad del sonido de 10 veces.

Muestreo de tiempo de sonido. Para que una computadora procese el audio, una señal de audio continua debe convertirse en una forma digital discreta mediante el muestreo de tiempo. Una onda de sonido continua se divide en pequeñas secciones de tiempo separadas, para cada una de esas secciones se establece un cierto valor de intensidad de sonido.

Así, la dependencia continua de la sonoridad del sonido en el tiempo A(t) es reemplazada por una secuencia discreta de niveles de sonoridad. En el gráfico, esto parece reemplazar una curva suave con una secuencia de "pasos" (Fig. 1.2).


Arroz. 1.2. Muestreo de audio temporal

Frecuencia de muestreo. Se utiliza un micrófono conectado a la tarjeta de sonido para grabar audio analógico y convertirlo a formato digital. La calidad del sonido digital recibido depende del número de mediciones del nivel de volumen del sonido por unidad de tiempo, es decir, frecuencia de muestreo. Cuantas más mediciones se realicen en 1 segundo (cuanto mayor sea la frecuencia de muestreo), con mayor precisión la "escalera" de la señal de audio digital repite la curva de la señal de diálogo.

Tasa de muestreo de audio es el número de mediciones de volumen de sonido en un segundo.

La tasa de muestreo de audio puede oscilar entre 8.000 y 48.000 mediciones de volumen de sonido por segundo.

Profundidad de codificación de audio. A cada "paso" se le asigna un cierto valor del nivel de volumen del sonido. Los niveles de sonoridad del sonido pueden considerarse como un conjunto de posibles estados N, para cuya codificación se necesita cierta cantidad de información I, que se denomina profundidad de codificación del sonido.

Profundidad de codificación de audio es la cantidad de información necesaria para codificar niveles discretos de sonoridad de audio digital.

Si se conoce la profundidad de codificación, el número de niveles de volumen de sonido digital se puede calcular mediante la fórmula N = 2 I . Si la profundidad de codificación de audio es de 16 bits, entonces el número de niveles de sonoridad de audio es:

N = 2 I = 2 16 = 65536.

Durante el proceso de codificación, a cada nivel de volumen de sonido se le asigna su propio código binario de 16 bits, el nivel de sonido más bajo corresponderá al código 0000000000000000 y el más alto - 1111111111111111.

La calidad del sonido digitalizado. Cuanto mayor sea la frecuencia y la profundidad de muestreo del sonido, mejor será la calidad del sonido digitalizado. La calidad más baja de audio digitalizado, correspondiente a la calidad de la comunicación telefónica, se obtiene a una frecuencia de muestreo de 8000 veces por segundo, profundidad de muestreo de 8 bits y grabación de una pista de audio (modo "mono"). La máxima calidad de sonido digitalizado, correspondiente a la calidad de un CD de audio, se logra con una frecuencia de muestreo de 48.000 veces por segundo, una profundidad de muestreo de 16 bits y grabación de dos pistas de audio (modo estéreo).

Debe recordarse que cuanto mayor sea la calidad del sonido digital, mayor será el volumen de información del archivo de sonido. Puede estimar el volumen de información de un archivo de sonido estéreo digital con una duración de sonido de 1 segundo con una calidad de sonido media (16 bits, 24.000 mediciones por segundo). Para hacer esto, la profundidad de codificación debe multiplicarse por el número de mediciones por 1 segundo y multiplicarse por 2 (sonido estéreo):

16 bits × 24 000 × 2 = 768 000 bits = 96 000 bytes = 93,75 KB.

editores de sonido Los editores de sonido le permiten no solo grabar y reproducir sonido, sino también editarlo. El sonido digitalizado se presenta en los editores de sonido de forma visual, por lo que las operaciones de copiar, mover y eliminar partes de la pista de audio se pueden realizar fácilmente con el mouse. Además, puede superponer pistas de audio una encima de otra (mezclar sonidos) y aplicar varios efectos acústicos (eco, reproducción inversa, etc.).

Los editores de sonido le permiten cambiar la calidad del audio digital y el tamaño del archivo de audio cambiando la frecuencia de muestreo y la profundidad de codificación. El audio digitalizado se puede guardar sin comprimir en archivos de audio en un formato universal WAV o en formato comprimido MP3.

Al guardar sonido en formatos comprimidos, se descartan las frecuencias sonoras de baja intensidad que resultan “excesivas” para la percepción humana y coinciden en el tiempo con frecuencias sonoras de alta intensidad. El uso de este formato le permite comprimir archivos de audio docenas de veces, pero conduce a una pérdida irreversible de información (los archivos no se pueden restaurar en su forma original).

preguntas de examen

1. ¿Cómo afectan la frecuencia de muestreo y la profundidad de codificación a la calidad del audio digital?

Tareas para la autorrealización

1.22. Una tarea con una respuesta selectiva. La tarjeta de sonido produce una codificación binaria de la señal de audio analógica. ¿Cuánta información se necesita para codificar cada uno de los 65 536 niveles posibles de intensidad de la señal?
1) 16 bits; 2) 256 bits; 3) 1 bit; 4) 8 bits.

1.23. Pregunta con una respuesta detallada. Estime el volumen de información de archivos de audio digital con una duración de 10 segundos a la profundidad de codificación y frecuencia de muestreo de la señal de audio, proporcionando la calidad de sonido mínima y máxima:
a) mono, 8 bits, 8000 mediciones por segundo;
b) estéreo, 16 bits, 48.000 medidas por segundo.

1.24. Pregunta con una respuesta detallada. Determine la longitud de un archivo de audio que cabrá en un disquete de 3,5" (tenga en cuenta que se asignan 2847 sectores de 512 bytes cada uno para almacenar datos en dicho disquete):
a) con baja calidad de sonido: mono, 8 bits, 8000 medidas por segundo;
b) con alta calidad de sonido: estéreo, 16 bits, 48.000 medidas por segundo.

Codificación de audio.

Tipos de tareas:

1. Tamaño del archivo de audio digital (mono y estéreo).

Al resolver problemas, los estudiantes se basan en los siguientes conceptos:

Discretización Temporal - un proceso en el que, durante la codificación de una señal de audio continua, una onda de sonido se divide en pequeñas secciones de tiempo separadas, y para cada una de esas secciones se establece un cierto valor de amplitud. Cuanto mayor sea la amplitud de la señal, más fuerte será el sonido.

Profundidad de audio (profundidad de codificación) -número de bits por codificación de audio.

Niveles de volumen (niveles de señal)- el sonido puede tener diferentes niveles de volumen. El número de niveles de volumen diferentes se calcula mediante la fórmula norte= 2 I dondeI- profundidad del sonido.

Frecuencia de muestreo - el número de mediciones del nivel de la señal de entrada por unidad de tiempo (por 1 segundo). Cuanto mayor sea la frecuencia de muestreo, más preciso será el procedimiento de codificación binaria. La frecuencia se mide en hercios (Hz). 1 medida en 1 segundo -1 Hz.

1000 medidas en 1 segundo 1 kHz. Indique la frecuencia de muestreo con la letraD. Para la codificación, elija una de las tres frecuencias:44,1 kHz, 22,05 kHz, 11,025 kHz.

Se cree que el rango de frecuencia que escucha una persona es de 20 Hz a 20 kHz.

Calidad de codificación binaria -un valor que está determinado por la profundidad de codificación y la tasa de muestreo.

Adaptador de audio (tarjeta de sonido) - un dispositivo que convierte las vibraciones eléctricas de la frecuencia del sonido en un código binario numérico cuando se ingresa sonido y viceversa (de un código numérico a vibraciones eléctricas) cuando se reproduce sonido.

Especificaciones del adaptador de audio:frecuencia de muestreo y profundidad de bit de registro).

Capacidad de registro - el número de bits en el registro del adaptador de audio. Cuanto mayor sea la profundidad de bits, menor será el error de cada conversión individual de la magnitud de la corriente eléctrica en un número y viceversa. Si la profundidad de bits es I, luego al medir la señal de entrada, 2I = norte valores diferentes.

Tamaño de archivo de audio mono digital (A) se mide por la fórmula:

A= D* T* I/8 , dondeDfrecuencia de muestreo (Hz),T– tiempo de sonido o grabación de sonido,Iprofundidad de bits del registro (resolución). Esta fórmula mide el tamaño en bytes.

Tamaño de archivo de audio estéreo digital (A) se mide por la fórmula:

A=2* D* T* I/8 , la señal se graba para dos altavoces, ya que los canales de sonido izquierdo y derecho se codifican por separado.

Es útil que los estudiantes entreguen la tabla 1, que muestra cuántos MB ocupará el minuto codificado de información de audio a diferentes frecuencias de muestreo:

Tipo de señal

Frecuencia de muestreo, kHz

estéreo de 16 bits

mono de 16 bits

mono de 8 bits

1. Tamaño del archivo digital

Nivel 3"

1. Determinar el tamaño (en bytes) de un archivo de audio digital cuyo tiempo de reproducción es de 10 segundos a una frecuencia de muestreo de 22,05 kHz y una resolución de 8 bits. El archivo no está comprimido. (, página 156, ejemplo 1)

Solución:

Fórmula para calcular el tamaño. (en bytes) archivo de audio digital: A= D* T* I/8.

Para convertir a bytes, el valor resultante debe dividirse por 8 bits.

22,05 kHz = 22,05 * 1000 Hz = 22050 Hz

A= D* T* I/8 = 22050 x 10 x 8/8 = 220500 bytes.

Respuesta: el tamaño del archivo es de 220500 bytes.

2. Determine la cantidad de espacio de almacenamiento para un archivo de audio digital que tiene un tiempo de reproducción de dos minutos con una frecuencia de muestreo de 44,1 kHz y una resolución de 16 bits. (, pág. 157, núm. 88)

Solución:

A= D* T* I/8. – la cantidad de memoria para almacenar el archivo de audio digital.

44100 (Hz) x 120 (s) x 16 (bit) / 8 (bit) = byte = 10335,9375 KB = 10,094 MB.

Respuesta: ≈ 10 Mb

Nivel 4"

3. El usuario dispone de una memoria de 2,6 MB. Necesitas grabar un archivo de audio digital con una duración de 1 minuto. ¿Cuál debería ser la frecuencia de muestreo y la profundidad de bits? (, pág. 157, núm. 89)

Solución:

Fórmula para calcular la frecuencia de muestreo y la profundidad de bits: D * I \u003d A / T

(memoria en bytes) : (tiempo de reproducción en segundos):

2,6 MB = 26 bytes

D * I \u003d A / T \u003d 26 bytes: 60 \u003d 45438.3 bytes

D=45438.3 bytes: yo

La profundidad de bits del adaptador puede ser de 8 o 16 bits. (1 byte o 2 bytes). Por lo tanto, la frecuencia de muestreo puede ser 45438,3 Hz = 45,4 kHz ≈ 44,1kHz– frecuencia de muestreo característica estándar, o 22719,15 Hz = 22,7 kHz ≈ 22,05kHz- frecuencia de muestreo característica estándar

Responder:

Frecuencia de muestreo

Profundidad de bits del adaptador de audio

1 opción

22,05kHz

16 bits

opcion 2

44,1kHz

8 bits

4. La cantidad de espacio libre en disco es de 5,25 MB, la profundidad de bits de la tarjeta de sonido es de 16. ¿Cuál es la duración del sonido de un archivo de audio digital grabado con una frecuencia de muestreo de 22,05 kHz? (, pág. 157, núm. 90)

Solución:

Fórmula para calcular la duración del sonido: T=A/D/I

(tamaño de la memoria en bytes) : (frecuencia de muestreo en Hz) : (profundidad de bits de la tarjeta de sonido en bytes):

5,25 MB = 5505024 bytes

5505024 bytes: 22050 Hz: 2 bytes = 124,8 s
Respuesta: 124,8 segundos

5. Un minuto de grabación de un archivo de audio digital ocupa 1,3 MB en el disco, la profundidad de bits de la tarjeta de sonido es 8. ¿Cuál es la frecuencia de muestreo del sonido? (, pág. 157, núm. 91)

Solución:

Fórmula de frecuencia de muestreo: D =A/T/I

(tamaño de la memoria en bytes) : (tiempo de grabación en segundos) : (profundidad de bits de la tarjeta de sonido en bytes)

1,3 MB = 18 bytes

18 bytes: 60:1 = 22719,1 Hz

Respuesta: 22,05 kHz

6. Dos minutos de grabación de audio digital ocupan 5,1 MB de espacio en disco. Frecuencia de muestreo - 22050 Hz. ¿Cuál es el bitness del adaptador de audio? (, pág. 157, núm. 94)

Solución:

La fórmula para calcular la profundidad de bits es: (memoria en bytes): (tiempo de reproducción en segundos): (frecuencia de muestreo):

5, 1 MB = 56 bytes

56 bytes: 120 seg: 22050 Hz = 2,02 bytes = 16 bits

Respuesta: 16 bits

7. La cantidad de memoria libre en el disco es de 0,01 GB, la profundidad de bits de la tarjeta de sonido es de 16. ¿Cuál es la duración del sonido de un archivo de audio digital grabado con una frecuencia de muestreo de 44100 Hz? (, pág. 157, núm. 95)

Solución:

Fórmula para calcular la duración del sondeo T=A/D/I

(tamaño de la memoria en bytes) : (frecuencia de muestreo en Hz) : (profundidad de bits de la tarjeta de sonido en bytes)

0,01 GB = 0,24 bytes

24 bytes: 44100: 2 = 121,74 seg = 2,03 min
Respuesta: 20,3 minutos

8. Estime el volumen de información de un archivo de audio mono con una duración de 1 minuto. si la "profundidad" de la codificación y la frecuencia de muestreo de la señal de audio son iguales, respectivamente:
a) 16 bits y 8 kHz;
b) 16 bits y 24 kHz.

(, pág. 76, núm. 2.82)

Solución:

pero).
16 bits x 8000 = 128 000 bits = 16 000 bytes = 15,625 KB/s
15,625 KB/s x 60 s = 937,5 KB

B).
1) El volumen de información de un archivo de sonido con una duración de 1 segundo es igual a:
16 bits x = 384000 bits = 48000 bytes = 46,875 KB/s
2) El volumen de información de un archivo de sonido con una duración de 1 minuto es igual a:
46,875 KB/s x 60 s = 2812,5 KB = 2,8 MB

Respuesta: a) 937,5 KB; b) 2,8 MB

Nivel 5"

Se utiliza la tabla 1

9. ¿Cuánto espacio de almacenamiento se requiere para almacenar un archivo de audio digital de alta calidad con un tiempo de reproducción de 3 minutos? (, pág. 157, núm. 92)

Solución:

Se logra una alta calidad de sonido con una frecuencia de muestreo de 44,1 kHz y una profundidad de bits del adaptador de audio de 16.
La fórmula para calcular la cantidad de memoria es: (tiempo de grabación en segundos) x (profundidad de bits de la tarjeta de sonido en bytes) x (frecuencia de muestreo):
180 s x 2 x 44100 Hz = byte = 15,1 MB
Respuesta: 15,1 MB

10. El archivo de audio digital contiene una grabación de audio de baja calidad (el sonido es oscuro y amortiguado). ¿Cuál es la duración del sonido de un archivo si su volumen es de 650 KB? (, pág. 157, núm. 93)

Solución:

Para un sonido sombrío y apagado, los siguientes parámetros son característicos: frecuencia de muestreo: 11,025 kHz, profundidad de bits del adaptador de audio: 8 bits (consulte la tabla 1). Entonces T=A/D/I. Traduzcamos el volumen a bytes: 650 KB = 665600 bytes

T=665600 bytes/11025 Hz/1 byte ≈60,4 s

Respuesta: la duración del sonido es de 60,5 s

Solución:

El volumen de información de un archivo de sonido con una duración de 1 segundo es igual a:
16 bits xx 2 = 1 bit = 187,5 KB (multiplicado por 2 desde estéreo).

El volumen de información de un archivo de sonido con una duración de 1 minuto es igual a:
187,5 KB/s x 60 s ≈ 11 MB

Respuesta: 11MB

Respuesta: a) 940 KB; b) 2,8 MB.

12. Calcula el tiempo de reproducción de un archivo de audio mono si, con codificación de 16 bits y una frecuencia de muestreo de 32 kHz, su volumen es igual a:
a) 700 KB;
b) 6300 KB

(, pág. 76, núm. 2.84)

Solución:

pero).
1) El volumen de información de un archivo de sonido con una duración de 1 segundo es igual a:

700 KB: 62,5 KB/s = 11,2 s

B).
1) El volumen de información de un archivo de sonido con una duración de 1 segundo es igual a:
16 bits x = 512000 bits = 64000 bytes = 62,5 KB/s
2) El tiempo de reproducción de un archivo de audio mono de 700 KB es:
6300 KB: 62,5 KB/s = 100,8 s = 1,68 min

Respuesta: a) 10 segundos; b) 1,5 min.

13. Calcula cuántos bytes de información ocupa un solo segundo de una grabación estéreo en un CD (frecuencia 44032 Hz, 16 bits por valor). ¿Cuánto dura un minuto? ¿Cuál es la capacidad máxima del disco (suponiendo una duración máxima de 80 minutos)? (, p. 34, ejercicio No. 34)

Solución:

Fórmula para calcular la cantidad de memoria A= D* T* I:
(tiempo de grabación en segundos) * (profundidad de bits de la tarjeta de sonido en bytes) * (frecuencia de muestreo). 16 bits - 2 bytes.
1) 1s x 2 x 44032 Hz = 88064 bytes (1 segundo CD estéreo)
2) 60s x 2 x 44032 Hz = 5283840 bytes (CD estéreo de 1 minuto)
3) 4800s x 2 x 44032 Hz = bytes = 412800 KB = 403,125 MB (80 minutos)

Respuesta: 88064 bytes (1 segundo), 5283840 bytes (1 minuto), 403,125 MB (80 minutos)

2. Definición de calidad de sonido.

Para determinar la calidad del sonido, debe encontrar la frecuencia de muestreo y usar la tabla No. 1

niveles de intensidad de la señal: la calidad del sonido de la transmisión de radio, utilizando 65 niveles de intensidad de la señal: la calidad del sonido del CD de audio. La frecuencia de mayor calidad corresponde a la música grabada en el CD. La magnitud de la señal analógica se mide en este caso 44.100 veces por segundo.

Nivel 5"

13. Determine la calidad del sonido (calidad de transmisión, calidad media, calidad de CD de audio) si sabe que el volumen de un archivo de audio mono con una duración de sonido de 10 segundos. es igual a:
a) 940 KB;
b) 157 KB.

(, pág. 76, núm. 2.83)

Solución:

pero).
1) 940 KB = 962560 bytes = 7700480 bits
2) 7700480 bps: 10 segundos = 770048 bps
3) 770048 bps: 16 bits = 48128 Hz - frecuencia de muestreo - cerca de los 44,1 kHz más altos
Respuesta: calidad de CD de audio

B).
1) 157 KB = 160768 bytes = 1286144 bits
2) 1286144 bits: 10 segundos = 4 bps
3) 4 bps: 16 bits = 8038,4 Hz
Respuesta: calidad de transmisión

Respuesta: a) calidad de CD; b) la calidad de la emisión.

14. Determine la longitud del archivo de sonido que cabrá en un disquete de 3,5”. Tenga en cuenta que se asignan 2847 sectores de 512 bytes para el almacenamiento de datos en dicho disquete.
a) con baja calidad de sonido: mono, 8 bits, 8 kHz;
b) con alta calidad de sonido: estéreo, 16 bits, 48 ​​kHz.

(, pág. 77, núm. 2.85)

Solución:

pero).

8 bits x 8000 = bits = 8000 bytes = 7,8 KB/s
3) El tiempo de reproducción de un archivo de audio mono de 1423,5 KB es:
1423,5 KB: 7,8 KB/s = 182,5 s ≈ 3 min

B).
1) El volumen de información de un disquete es igual a:
2847 sectores x 512 bytes = 1457664 bytes = 1423,5 KB
2) El volumen de información de un archivo de sonido con una duración de 1 segundo es igual a:
16 bits xx 2 = 1 bit = byte = 187,5 KB/s
3) El tiempo de reproducción de un archivo de audio estéreo de 1423,5 KB es:
1423,5 KB: 187,5 KB/s = 7,6 s

Respuesta: a) 3 minutos; b) 7,6 segundos.

3. Codificación de audio binario.

Al resolver problemas, utiliza el siguiente material teórico:

Para codificar audio, la señal analógica que se muestra en la figura es

el plano se divide en líneas verticales y horizontales. La división vertical es el muestreo de la señal analógica (frecuencia de medición de la señal), la división horizontal es cuantización por nivel Es decir, cuanto más fina es la cuadrícula, mejor se aproxima el sonido analógico con la ayuda de los números. La cuantificación de ocho bits se utiliza para digitalizar el habla ordinaria (conversaciones telefónicas) y las transmisiones de radio de onda corta. Dieciséis bits: para digitalizar música y transmisiones de radio VHF (onda ultracorta).

Nivel 3"

15. La señal de audio analógica se muestreó primero usando 256 niveles de intensidad de señal (calidad de sonido de transmisión) y luego usando 65536 niveles de intensidad de señal (calidad de sonido de CD de audio). ¿Cuántas veces difieren los volúmenes de información del sonido digitalizado? (, pág. 77, núm. 2.86)

Solución:

La longitud del código de una señal analógica con 256 niveles de intensidad de señal es de 8 bits, mientras que con 65536 niveles de intensidad de señal es de 16 bits. Dado que la longitud del código de una señal se ha duplicado, los volúmenes de información del sonido digitalizado difieren en un factor de 2.

Respuesta: 2 veces.

Nivel "4"

16. Según el teorema de Nyquist-Kotelnikov, para que una señal analógica se reconstruya con precisión a partir de su representación discreta (a partir de sus muestras), la frecuencia de muestreo debe ser al menos el doble de la frecuencia de audio máxima de esta señal.

· ¿Cuál debería ser la frecuencia de muestreo del audio humano?

· ¿Cuál debería ser mayor: la frecuencia de muestreo del habla o la frecuencia de muestreo del sonido de una orquesta sinfónica?

Propósito: introducir a los estudiantes en las características del hardware y software para trabajar con sonido. Actividades: extraer conocimientos de un curso de física (o trabajar con libros de referencia). (, p. ??, tarea 2)

Solución:

Se cree que el rango de frecuencia que escucha una persona es de 20 Hz a 20 kHz. Por lo tanto, de acuerdo con el teorema de Nyquist-Kotelnikov, para que una señal analógica sea restaurada con precisión a partir de su representación discreta (a partir de sus muestras), la frecuencia de muestreo debe ser al menos el doble de la frecuencia de audio máxima de esta señal. La frecuencia de sonido máxima que escucha una persona es de -20 kHz, lo que significa que el aparato ra y el software deben proporcionar una frecuencia de muestreo de al menos 40 kHz y, más precisamente, 44,1 kHz. El procesamiento por computadora del sonido de una orquesta sinfónica implica una tasa de muestreo más alta que el procesamiento del habla, ya que el rango de frecuencia en el caso de una orquesta sinfónica es mucho mayor.

Respuesta: no menos de 40 kHz, la frecuencia de muestreo de una orquesta sinfónica es mayor.

Nivel 5"

17. La figura muestra el sonido de 1 segundo de voz grabado por la grabadora. Codifíquelo en un código digital binario con una frecuencia de 10 Hz y una longitud de código de 3 bits. (, p. ??, tarea 1)

Solución:

La codificación de 10 Hz significa que tenemos que medir el tono 10 veces por segundo. Elijamos momentos equidistantes de tiempo:

Una longitud de código de 3 bits significa 23 = 8 niveles de cuantificación. Es decir, como código numérico para el tono en cada momento seleccionado, podemos establecer una de las siguientes combinaciones: 000, 001, 010, 011, 100, 101, 110, 111. Solo hay 8 de ellos, por lo tanto , el tono se puede medir en 8 "niveles":

Vamos a “redondear” los valores de tono al nivel inferior más cercano:

Usando este método de codificación, obtenemos el siguiente resultado (los espacios se establecen para facilitar la lectura):

Nota. Es aconsejable llamar la atención de los estudiantes sobre la inexactitud con que el código transmite el cambio de amplitud. Es decir, la frecuencia de muestreo de 10 Hz y el nivel de cuantificación de bits) son demasiado bajos. Normalmente, para el sonido (voz), se selecciona una frecuencia de muestreo de 8 kHz, es decir, 8000 veces por segundo, y un nivel de cuantificación de 28 (código de 8 bits de longitud).

Responder:

18. Explique por qué el nivel de cuantización es, junto con la frecuencia de muestreo, una de las principales características de la representación del sonido en un ordenador. Objetivos: consolidar la comprensión de los estudiantes de los conceptos de "exactitud de representación de datos", "error de medición", "error de representación"; revise la codificación binaria y la longitud del código con los estudiantes. Tipo de actividad: trabajo con definiciones de conceptos. (, p. ??, tarea 3)

Solución:

En geometría, física, tecnología, existe el concepto de "precisión de medida", estrechamente relacionado con el concepto de "error de medida". Pero también está el concepto "precisión de representación". Por ejemplo, sobre la altura de una persona, se puede decir que él: a) sobre. 2 m, b) poco más de 1,7 m, c) igual a 1 m 72 cm, d) igual a 1 m 71 cm 8 mm. Es decir, se pueden utilizar 1, 2, 3 o 4 dígitos para indicar el crecimiento medido.
Lo mismo es cierto para la codificación binaria. Si solo se utilizan 2 bits para registrar el tono en un momento determinado, incluso si las mediciones fueran precisas, solo se pueden transmitir 4 niveles: bajo (00), por debajo del promedio (01), por encima del promedio (10), alto (11). Si usa 1 byte, puede transferir 256 niveles. Cómo mayor nivel de cuantificación, o, que es lo mismo que Cuantos más bits se asignan para registrar el valor medido, con mayor precisión se transmite el valor.

Nota. Cabe señalar que la herramienta de medición también debe soportar el nivel de cuantificación seleccionado (no tiene sentido representar la longitud medida con una regla con divisiones decimétricas con precisión milimétrica).

Respuesta: cuanto mayor sea el nivel de cuantificación, con mayor precisión se transmitirá el sonido.

Literatura:

[ 1] Informática. Cuaderno-taller en 2 tomos / Ed. , : Tomo 1. - Laboratorio de Conocimientos Básicos, 1999 - 304 p.: il.

Taller de Informática y Tecnologías de la Información. Libro de texto para instituciones educativas /,. – M.: Binom. Laboratorio del Conocimiento, 20s.: enfermo.

Informática en la escuela: Suplemento a la revista “Informática y Educación”. N° 4 - 2003. - M.: Educación e Informática, 2003. - 96 p.: il.

et al.. Cultura de la información: codificación de la información. modelos de información. Grade 9-10: Un libro de texto para instituciones de educación general. - 2ª ed. - M.: Avutarda, 1996. - 208 p.: il.

Senokosov sobre informática para escolares. - Ekaterimburgo: "U-Factoria", 2003. - 346. p54-56.

La dependencia del volumen, así como del tono del sonido, de la intensidad y frecuencia de la onda sonora.

hercios(indicado por Hz o Hz): una unidad de medida para la frecuencia de procesos periódicos (por ejemplo, oscilaciones).
1 Hz significa una ejecución de dicho proceso en un segundo: 1 Hz = 1/s.

Si tenemos 10 Hz, esto significa que tenemos diez ejecuciones de dicho proceso en un segundo.

El oído humano puede percibir el sonido en frecuencias que van desde 20 vibraciones por segundo (20 Hertz, sonido bajo) hasta 20 000 vibraciones por segundo (20 kHz, sonido alto).

Además, una persona puede percibir el sonido en un amplio rango de intensidades, en el que la intensidad máxima es 1014 veces mayor que la mínima (cien mil billones de veces).

Para medir el volumen del sonido, se inventó y utilizó una unidad especial " decibel" (dB)

Una disminución o aumento del volumen del sonido de 10 dB corresponde a una disminución o aumento de la intensidad del sonido de 10 veces.

Volumen del sonido en decibeles

Para que los sistemas informáticos procesen el audio, una señal de audio continua debe convertirse en una forma digital discreta mediante muestreo temporal.

Para hacer esto, una onda de sonido continua se divide en pequeñas secciones de tiempo separadas, para cada una de esas secciones se establece un cierto valor de intensidad de sonido.

Así, la dependencia continua de la sonoridad del sonido en el tiempo A(t) es reemplazada por una secuencia discreta de niveles de sonoridad. En el gráfico, esto parece reemplazar una curva suave con una secuencia de "pasos".


Muestreo de audio temporal

Se utiliza un micrófono conectado a la tarjeta de sonido para grabar audio analógico y convertirlo a formato digital.

Cuanto más densas estén ubicadas las franjas discretas en el gráfico, mejor será eventualmente posible recrear el sonido original.

La calidad del sonido digital recibido depende del número de mediciones del nivel de volumen del sonido por unidad de tiempo, es decir, la tasa de muestreo.

Tasa de muestreo de audio es el número de mediciones de volumen de sonido en un segundo.

Cuantas más mediciones se realicen en un segundo (cuanto mayor sea la frecuencia de muestreo), con mayor precisión la "escalera" de la señal de audio digital repite la curva de la señal analógica.

A cada "paso" en el gráfico se le asigna un cierto valor del nivel de volumen del sonido. Los niveles de volumen del sonido se pueden considerar como un conjunto de posibles estados norte(gradaciones), que requieren una cierta cantidad de información para codificar I, que se denomina profundidad de codificación de audio.

Profundidad de codificación de audio es la cantidad de información necesaria para codificar niveles discretos de sonoridad de audio digital.

Si se conoce la profundidad de codificación, el número de niveles de volumen de sonido digital se puede calcular utilizando la fórmula general n = 2 yo.

Por ejemplo, si la profundidad de codificación de audio es de 16 bits, el número de niveles de volumen de audio es:

N = 2 I = 2 16 = 65536.

Durante el proceso de codificación, a cada nivel de volumen de sonido se le asigna su propio código binario de 16 bits, el nivel de sonido más bajo corresponderá al código 0000000000000000 y el más alto - 1111111111111111.

Calidad del audio digitalizado

Por lo tanto, cuanto mayor sea la frecuencia de muestreo y la profundidad de codificación del sonido, mejor será la calidad del sonido digitalizado y mejor se podrá acercar el sonido digitalizado al sonido original.

La máxima calidad de sonido digitalizado, correspondiente a la calidad de un CD de audio, se logra con una frecuencia de muestreo de 48.000 veces por segundo, una profundidad de muestreo de 16 bits y grabación de dos pistas de audio (modo estéreo).

Debe recordarse que cuanto mayor sea la calidad del sonido digital, mayor será el volumen de información del archivo de sonido.

Puede estimar fácilmente el volumen de información de un archivo de sonido estéreo digital de 1 segundo con una calidad de sonido media (16 bits, 24 000 muestras por segundo). Para hacer esto, la profundidad de codificación debe multiplicarse por el número de mediciones por 1 segundo y multiplicarse por 2 canales (sonido estéreo):

16 bits × 24 000 × 2 = 768 000 bits = 96 000 bytes = 93,75 KB.

Editores de sonido

Los editores de sonido le permiten no solo grabar y reproducir sonido, sino también editarlo. Los más destacados se pueden llamar con seguridad, como Forja de sonido de Sony, Audición de adobe, Ola de oro y otros.

El sonido digitalizado se presenta en los editores de sonido en una forma visual clara, por lo que las operaciones de copiar, mover y eliminar partes de una pista de audio se pueden realizar fácilmente con el mouse de una computadora.

Además, puede superponer, superponer pistas de audio una encima de la otra (mezclar sonidos) y aplicar varios efectos acústicos (eco, reproducción inversa, etc.).

Al guardar sonido en formatos comprimidos, se descartan frecuencias de audio de baja intensidad que son inaudibles e imperceptibles ("excesivas") para la percepción humana, coincidiendo en el tiempo con frecuencias de audio de alta intensidad. El uso de este formato le permite comprimir archivos de sonido docenas de veces, sin embargo, conduce a una pérdida irreversible de información (los archivos no se pueden restaurar en su forma original original).

Los principales parámetros que afectan la calidad de la grabación de audio digital son:

§ Profundidad de bits de ADC y DAC.

§ Tasa de muestreo ADC y DAC.

§ Jitter ADC y DAC

§ Remuestreo

También son importantes los parámetros de la ruta analógica de los dispositivos de grabación y reproducción de audio digital:

§ Relación señal-ruido

§ THD

§ Distorsión de intermodulación

§ Respuesta de frecuencia desigual

§ Interpenetración de canales

§ Gama dinámica

Tecnología de audio digital

La grabación de sonido digital se lleva a cabo actualmente en estudios de grabación, bajo el control de computadoras personales y otros equipos costosos y de alta calidad. También está bastante desarrollado el concepto de “home studio”, en el que se utilizan equipos de grabación profesionales y semiprofesionales, que te permiten crear grabaciones de alta calidad en casa.

Las tarjetas de sonido se utilizan como parte de las computadoras que procesan en sus ADC y DAC, la mayoría de las veces en 24 bits y 96 kHz, un aumento adicional en la profundidad de bits y la frecuencia de muestreo prácticamente no aumenta la calidad de la grabación.

Existe toda una clase de programas de computadora: editores de sonido que le permiten trabajar con sonido:

§ grabar flujo de audio entrante

§ crear (generar) sonido

§ modificar una grabación existente (agregar muestras, cambiar el timbre, la velocidad del sonido, cortar partes, etc.)

§ sobrescribir de un formato a otro

§ convertir convertir diferentes códecs de audio

Algunos programas simples solo le permiten convertir formatos y códecs.

Variedades de formatos de audio digital.

Existen diferentes conceptos de formato de audio.

El formato para representar datos de audio en forma digital depende del método de cuantificación mediante un convertidor de digital a analógico (DAC). En la ingeniería de audio, actualmente son más comunes dos tipos de cuantificación:

§ modulación de código de pulso

§ modulación sigma-delta

A menudo, la profundidad de bits de cuantificación y la frecuencia de muestreo se indican para varios dispositivos de grabación y reproducción de audio como un formato para representar audio digital (24 bits/192 kHz; 16 bits/48 kHz).

El formato de archivo determina la estructura y las características de la presentación de los datos de audio cuando se almacenan en un dispositivo de almacenamiento de PC. Para eliminar la redundancia en los datos de audio, se utilizan códecs de audio para comprimir los datos de audio. Hay tres grupos de formatos de archivo de audio:

§ formatos de audio sin comprimir como WAV, AIFF

§ formatos de audio sin pérdidas (APE, FLAC)

§ formatos de audio con compresión con pérdida (mp3, ogg)

Los formatos de archivos de música modulares se destacan. Creados sintéticamente o a partir de muestras de instrumentos en vivo pregrabados, sirven principalmente para crear música electrónica moderna (MOD). Esto también incluye el formato MIDI, que no es una grabación de sonido, pero al mismo tiempo, con la ayuda de un secuenciador, te permite grabar y reproducir música usando un determinado conjunto de comandos en forma de texto.

Los formatos de medios de audio digital se utilizan tanto para la distribución masiva de grabaciones de audio (CD, SACD) como en la grabación de audio profesional (DAT, minidisk).

Para los sistemas de sonido envolvente, también es posible distinguir formatos de sonido, que son principalmente acompañamiento multicanal de sonido para películas. Dichos sistemas tienen familias completas de formatos de dos importantes empresas competidoras, Digital Theatre Systems Inc. -DTS y Dolby Laboratories Inc. - Dolby Digital.

El formato también se denomina número de canales en sistemas de sonido multicanal (5.1; 7.1). Inicialmente, este sistema se desarrolló para cines, pero luego se amplió.

Códec de audio a nivel de software

§ G.723.1 - uno de los códecs básicos para aplicaciones de telefonía IP

§ G.729: un códec de banda estrecha patentado que se utiliza para la representación digital del habla

§ Internet Low Bitrate Codec (iLBC): un popular códec gratuito para telefonía IP (en particular, para Skype y Google Talk)

Códec de audio(Inglés) códec de audio; codificador/descodificador de audio): un programa informático o hardware diseñado para codificar o decodificar datos de audio.

Códec de software

Códec de audio a nivel de software es un programa informático especializado, un códec que comprime (comprime) o descomprime (descomprime) datos de audio digital según un formato de archivo de audio o un formato de flujo de audio. La tarea de un códec de audio como compresor es proporcionar una señal de audio con una calidad/fidelidad determinada y el tamaño más pequeño posible. La compresión reduce la cantidad de espacio necesario para almacenar datos de audio y también es posible reducir el ancho de banda del canal a través del cual se transmiten los datos de audio. La mayoría de los códecs de audio se implementan como bibliotecas de software que interactúan con uno o más reproductores de audio, como QuickTime Player, XMMS, Winamp, VLC media player, MPlayer o Windows Media Player.

Códecs de audio de software populares por aplicación:

§ MPEG-1 Layer III (MP3): códec patentado para grabaciones de audio (música, audiolibros, etc.) para computadoras y reproductores digitales

§ Ogg Vorbis (OGG): el segundo formato más popular, ampliamente utilizado en juegos de computadora y redes de intercambio de archivos para transferir música.

§ GSM-FR: el primer estándar de codificación de voz digital utilizado en teléfonos GSM

§ Velocidad múltiple adaptativa (AMR): grabación de voz humana en teléfonos móviles y otros dispositivos móviles