SPAV_01

01 - Básico sonido

El sonido es una onda que se desplaza a una velocidad 343 m/s en el aire a 20ºC, al nivel del mar, con una humedad del 50% (1235 km/h). La velocidad del sonido aumenta con la temperatura. (más info).

Esta velocidad es mayor en sólidos y líquidos:

En el agua (a 35 °C) es de 1493 m/s (a 22 °C) es de 1505 m/s.
En la madera es de 3990 m/s.
En el hormigón es de 4000 m/s.
En el aluminio es de 5090 m/s.
En el vidrio es de 5190 m/s.
En el acero es de 6099 m/s.

Dado que la velocidad del sonido varía según el medio, se utiliza el número Mach 1 para indicarla. La velocidad de un cuerpo depende del espacio que recorre por unidad de tiempo, o, aplicándolo al sonido en el aire, si suponemos constante temperatura, humedad, altura, depende su longitud e onda entre su período:

$$v=\frac{e}{t}$$

$v_{sonido\ aire}=\frac{\lambda}{T}$ como $T=\frac{1}{f}$, $v_{sonido\ aire}=\lambda · f$

Recuerda que el margen de frecuencias audibles por el ser humano va de 20 Hz a 20 kHz. Por debajo de 20 Hz tenemos infrasonidos, por encima de 20 kHz, ultrasonidos. Importante:

<20 Hz: infrasonidos. No se oyen pero se pueden sentir, como cuando pasa un tren a lo lejos.
20 Hz a 250 Hz: graves.
250 Hz a 2000 Hz: medios.
2000 Hz a 20000 Hz: agudos.
>20000 Hz: ultrasonidos.

Algunas curiosidades (ordenadas de menor a mayor frecuencia):

Leyenda urbana: la nota marrón (South Park | Mythbusters)
Un tapón de cera puede afectar más a frecuencias bajas y medias.
Nicholas Cage haciendo trampa en una audiometría tras perder audición YouTube “Windtalkers”.
Los perros perciben ultrasonidos. El silbato para perros suena a partir de 23 kHz (Wikipedia)
El envejecimiento natural de los humanos hace que nuestra respuesta en frecuencia sea tipo paso bajo con una frecuencia que disminuye paulatinamente con la edad y los excesos. Es decir: que tendemos a perder los agudos. probablemente nadie escuche por encima de 18 kHz, y yo no pueda escuchar “tonos mosquito” de 16 kHz mientras que vosotros sí.
- Ruido contra el botellón en la zona de agudos, El País
- Frase de viejos: “La música de hoy en día sólo es ruido”. Tiene su lógica si pensamos que la percusión tiene muchos graves (bajos) y que los matices de la música realmente los aportan los agudos.

La cadena del sonido

Definiciones:

Sistema de sonido: Agrupación de componentes y equipos electrónicos con el objetivo de amplificar, almacenar o reproducir sonido.
Cadena de conversión electroacústica en un sistema de sonido (cadena del sonido): Ruta que sigue el sonido desde la fuente hasta su destino, incluyendo la conversión de onda acústica en señal eléctrica (señal de audio), su procesamiento, y su posterior conversión en onda acústica.

Un sistema de sonido consta de una cadena de sonido con estas tres partes:

Fuente de sonido (un micrófono, un reproductor de mp3, un móvil, una radio, una central de avisos (supermercado)…).
- Un micrófono convierte señales acústicas en señales eléctricas.

Dispositivo de tratamiento de señal (donde se conecta una o varias fuentes y se amplifican). Tenemos:
- Amplificador. Permite aumentar el voltaje de una señal eléctrica.
- Mezclador. Permiten unir señales de distintas fuentes.
- Selector.
- Filtro.
Altavoz. Convierte señales eléctricas en señales acústicas.

¿Qué es el sonido? Una vibración del aire. El sonido se puede transmitir en uno o varios canales:

Monofónico: un sólo canal.
Estereofónico: dos canales independientes (derecha e izquierda). Piensa en estéreo como dos señales mono.
- El balance es un control que ajusta la ganancia de un canal en relación a otro. En el extremo se oye sólo el contenido de un canal en uno de los altavoces.
- El paneomueve ambos canales. En el extremo se oye el contenido de los dos canales en uno de los altavoces. Se usa cuando tenemos fuente mono en salida estéreo.

Sonido envolvente (surround): tres, cuatro, cinco, seis, siete o más canales más subwoofer.

Amplificadores

Tipos de amplificadores de audiofrecuencia según su situación dentro de la cadena de audio:

Preamplificadores (suelen elevar nivel de voltaje).
Amplificadores de mezcla, distribución y aislamiento.
Filtros activos.
Amplificadores de potencia (suelen elevar nivel de intensidad).

En función del tipo de conexión en los terminales de entrada y salida:

Entrada/salida no balanceada.
Entrada/salida balanceada (amplificadores diferenciales).
Cualquier combinación de las dos anteriores.

Ejemplo de chip amplificador: el LM386, muy popular para sistemas de amplificación caseros.

Principios básicos del sonido

El sonido es un fenómeno que se produce cuando un cuerpo vibra. Este movimiento se transmite a través de medios elásticos hasta el oído humano.

Siempre tenemos una fuente sonora, que emite el sonido. Desde ahí, las partículas de aire contiguas transmiten la vibración. Las partículas no se mueven en una sola dirección, sino que oscilan como las cuerdas de una guitarra.

Las vibraciones del aire excitan los mecanismos del oído y estos llegan al cerebro mediante las células nerviosas.

Propiedades físicas

Las ondas sonoras se caracterizan por la variación en el tiempo de la presión/intensidad sonora. En la figura se puede ver como varía en el caso de una señal periódica (un tono puro):

Amplitud (Ap): indica el valor máximo o de pico de la presión/intensidad sonora. Es directamente proporcional a la sensación auditiva. También tenemos:
- Valor de pico a pico (App).
- Valor eficaz (Aef): Valor que tendría un sonido continuo de igual sensación auditiva.
Periodo (T): Duración de un ciclo de señal (s).
Frecuencia (f): Número de ciclos de onda sonora que ocurren en un segundo (Hz). f=1/T.
Fase: punto de inicio de un ciclo respecto al origen.

La amplitud se puede medir en distintas unidades dependiendo de si se trata de una señal eléctrica (voltios, watios, amperios) o sonido físico (watios, watios/metro cuadrado, newton/metro cuadrado, pascales)

Frecuencias empleadas en audio

Bandas de frecuencia

La frecuencia se divide en bandas cuyo ancho de banda cree potencialmente:

Bandas de octava: La frecuencia de fin es el doble de la de inicio. Exclusivas de audio.
- La frecuencia central de una banda es la media geométrica de las dos frecuencias laterales: $f_c=\sqrt(f_1 f_2)$
- El ancho de banda de una señal es el rango de frecuencias en el que trabaja, desde la inferior hasta la superior: $BW=f_s - f_i$
Bandas de década: La frecuencia de fin es diez veces de la de inicio. Típicas en el resto de aplicaciones.

Bandas de tercio de octava: Cada octava se divide en tonos y semitonos. Las 7 notas (do-re-mi-fa-sol-la-si) tienen algunas separación de tono y otras de semitono. Si contamos todas las teclas (negras incluidas, esto es, bemoles o sostenidos), tenemos que una octava se compone de 12 semitonos. Una división habitual consiste en partir cada octava en tres bandas de tercio de octava. Más información en Doctorproaudio.

Un tercio de octava son cuatro semitonos.

La frecuencia final de un tercio de octava se calcula multiplicando la frecuencia inicial por $2^{1/3}$

$$f_f=2^{1/3}·f_i$$

Ejercicios

Calcula la frecuencia de una onda sonora de T =
- a) 1ms
- b) 10ms
- c) 1s
- d) 50ms
- e) 0,01s
- f) 0,055ms
Calcula el periodo de una onda sonora de f =
- a) 500Hz
- b) 50Hz
- c) 5Hz
- d) 5kHz
- e) 18kHz
- f) 10,5kHz
Ejercicio: Calcula las frecuencias superior, inferior y central de las octavas en las que se divide el espectro audible. Comienza en la mínima frecuencia audible.
Ejercicio: Representa en el dominio de la frecuencia dos sonidos. ¿Cuál es el múltiplo por el que se da el armónico? ¿Cómo se llama la propiedad que los diferencia?:
- a. Un sonido con frecuencia fundamental a 220Hz un armónico a 440Hz.
- b. Otro sonido con frecuencia fundamental a 220Hz un armónico a 880Hz.
Calcula el ancho de banda de la primera, la quinta y la décima octava.
Hazte una audiometría casera con el Online Tone Generator de Tomasz P. Szynalski. Ten en cuenta que nadie te garantiza que el altavoz tenga una respuesta fiel, así que no te apresures a ir al médico si no da como esperas. En Android tienes: Simple Tone Generator

Información extra: Frecuencias de afinación del piano en Wikipedia

Virtual Piano Online
Combina Online Tone Generator con uno de estos analizadores de espectro: sndpeek, SFS/RTSPECT. Android: Sound Oscilloscope
- Dominio del tiempo: ¿Qué pasa cuando aumentas el volumen del ordenador?
- Dominio del tiempo: ¿Qué pasa cuando aumentas la frecuencia del tono?
- Dominio de la frecuencia: ¿Qué pasa cuando aumentas el volumen del ordenador?
- Dominio de la frecuencia: ¿Qué pasa cuando aumentas la frecuencia del tono?
- Dominio del tiempo y de la frecuencia. Sin Tone Generator, ¿qué pasa cuando hablas?

No te fíes de altavoces malos, no te fíes de micrófonos malos, no te fíes de oídos malos, no te fíes de nada.

Propiedades del sonido en el espectro de frecuencias

Es la representación de una señal en el dominio de la frecuencia en vez de en el tiempo. En función de cómo es la distribución de frecuencias del sonido tenemos:

Tono puro: Es un sonido cuya presión sonora varía de forma perfectamente senoidal.
Tono armónico: Es un sonido formado por la suma de un tono puro y un conjunto de tonos con frecuencias que son múltiplos de la frecuencia del tono puro. Por ejemplo, un tono puro de 66Hz tiene un armónico en 132Hz (f2). A la más baja se la llama frecuencia fundamental (f0).

El tono de un sonido se refiere a su frecuencia fundamental.
Sonido complejo: Es un sonido formado por superposición de infinitos tonos puros con frecuencias infinitamente próximas y de amplitudes diferentes. Normalmente no periódicas, así que la representación frecuencial no es como en la figura.

Un armónico $f_n$ es un múltiplo de la frecuencia fundamental $f_0$

$$f_n=n \cdot f_0$$

$n_0=1$, $n_2=2$, $n_3=3$…

El timbre es una propiedad que permite distinguir dos sonidos con misma frecuencia fundamental pero distintos armónicos. Por ejemplo: la nota “do” de un piano y la misma nota en una trompeta.

Del mismo modo que el "ladrillo" es el elemento fundamental de la ciudad de Lego, la señal senoidal pura es el elemento fundamental del sonido

Básico de audio digital

En el audio analógico (radio AM/FM, casettes, vinilo), se trabaja en todo momento con una señal analógica que corresponde con el sonido real. El audio analógico es susceptible de sufrir los efectos del ruido, atenuación, etc.

El audio digital se puede almacenar y transmitir de manera codificada y habitualmente comprimida. Esto implica que en un sólo hilo se pueden transmitir múltiples canales (5.1, 7.1…). Típico conector RCA naranja o TOSLINK.

El hecho de trabajar con audio digital no hace que se elimine el analógico. Al principio y al final de la cadena de sonido (micrófono y altavoz) tenemos señales analógicas.

Convertidor A/D (analógico a digital) (ADC) al principio de la cadena de sonido

Convertidor D/A (digital a analógico) (DAC) al principio de la cadena de sonido

Cadena de sonido digital. Imagen de https://quecamarareflex.com/entender-los-niveles-de-audio-de-una-forma-sencilla/

Parámetros del audio digital son frecuencia de muestreo, bitrate, resolución, y algoritmo de compresión o codec:

Frecuencia de muestreo (no confundir con frecuencia de un sonido): El periodo de muestreo es la cantidad de tiempo que pasa entre datos guardados.
Según el teorema de Nyquist, la frecuencia de muestreo de una señal analógica debe ser el doble de su ancho de banda para que no se produzca pérdida de calidad.

$$f_{scan}≥2 \cdot BW$$

El ancho de banda del audio es de aproximadamente 20 kHz (19980 Hz), así que se debería muestrear a una frecuencia mínima de 40 kHz. El valor típico es 44 kHz, pero mucha gente ya usa 48 kHz, y hay casos de uso de 192 kHz.

Muestreo y cuantificación

44 kHz implica una muestra cada 22,7 µs. Es suficiente para que el cerebro rellene los huecos.
Una vez tomadas las muestras, se procede a su cuantificación. Lo típico es usar 16 bits por muestra. Esto es, que cada valor analógico puede tomar $2^16=65536 valores posibles. Pongamos por caso los viejos CDs de audio. En ellos se graba audio sin compresión de 16 bits con frecuencia de muestreo de 44 kHz (lo que se llama “calidad CD”). Se puede mejorar, pero es más que suficiente para el oyente medio.
El bitrate o tasa de bits (kbps, kb/s) es la cantidad de información que ocupa un medio digital (audio o vídeo) por unidad de tiempo. Nos importa a efecto de almacenaje y de streaming. El audio sin compresión del CD ocupa:
- Un CD de 650 MB tiene capacidad para 74 minutos de CDA (44 kHz, 16 bits).
- Haciendo regla de tres, nos salen 8,78 MB / min.
- Convirtiendo a megabits por minuto: 70,24 Mb/min.
- Megabits por segundo: 1,17 Mbps.
- 1170 kbps
Esto hoy en día no parece mucho, pero en su momento era muchísimo tamaño.
A finales de los años 90 se popularizaron los algoritmos de compresión: El MP3 prometía calidad equivalente a CD ocupando sólo 128 kbps. Algunos ejemplos son MP3, WMA (prometía calidad CD a 64 kbps), OGG vorbis, AAC, AC3, , FLAC, y muchos más… también llamados CODECs (enCOders-DECoders). A finales de los años 90 irrumpen los algoritmos de compresión de audio. El MP3 promete calidad equivalente a CD ocupando sólo 128 kbps. WMA (Windows Media Audio) prometía la misma calidad con sólo 64 kbps.

Valores típicos de audio comprimido son 64 kbps, 96 kbps, 128 kbps, 160 kbps, 192 kbps, 320 kbps… muy lejos de los 1170 kbps del CDA. En cualquier caso, cuanto mayor sea el bitrate, más calidad, pero más ocupa el archivo resultante. Bitrate del stream en Spotify | Tidal | Apple Music, Amazon Music, YouTube Music.

Más información sobre audio de alta resolución: https://www.xataka.com/musica/alta-resolucion-audio-mitos-realidades

Volver al curso