Síntesis por modulación Emilia Gómez Gutiérrez Síntesi i Processament del So I Departament de Sonologia Escola Superior de Musica de Catalunya Curso 2009-2010 emilia.gomez@esmuc.cat 9 de octubre de 2009 Índice 1. Introducción 1.1. Ventajas de la síntesis por modulación . . . . . . . . 1.2. Señales unipolares y bipolares . . . . . . . . . . . . . 1.3. La modulación . . . . . . . . . . . . . . . . . . . . . 1.4. Recordatorio de algunos conceptos de trigonometría . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 2 3 4 2. La modulación en anillo: Ring Modulation (RM) 4 3. La modulación de amplitud: Amplitude Modulation (AM) 6 4. La modulación de frecuencia:Frequency Modulation (FM) 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Ejemplos de síntesis FM . . . . . . . . . . . . . . . . . . . . . 4.3. ¿Modulación de frecuencia o de fase? . . . . . . . . . . . . . . 4.4. Bandas laterales y funciones de Bessel . . . . . . . . . . . . . 4.5. Índice de modulación, anchura de banda y espectro dinámico 4.6. Variantes de la modulación de frecuencia . . . . . . . . . . . . 5. Referencias . . . . . . . . . . . . 8 8 10 11 12 13 15 15 1 1. 1.1. Introducción Ventajas de la síntesis por modulación La síntesis sonora por modulación permite evitar unos de los problemas más graves de la síntesis aditiva, que es la necesidad de producir una gran cantidad de datos para generar timbres que sean suficientemente ricos y complejos. La síntesis sonora por modulación ofrece una alternativa interesante, ya que permite generar espectros ricos de forma económica, tanto por la especificación de los datos de control como por el tiempo de cálculo necesario para generar el sonido sintético. 1.2. Señales unipolares y bipolares Veremos más adelante que las características de una modulación pueden depender de la naturaleza de las señales que se utilizan. En particular, vamos a hacer una distinción entre las señales unipolares y las señales bipolares. Una señal unipolar (que podemos ver en la figura 1 en la gráfica inferior) se sitúa siempre en los valores positivos de amplitud, es decir, nunca tiene un valor negativo. En cambio, una señal bipolar (que podemos ver en la figura 1 en la gráfica superior) se articula en los valores positivos y negativos de la amplitud, en torno o alrededor del valor cero. Figura 1: Señal bipolar (arriba) y unipolar (abajo) Esta diferencia es importante para todas las aplicaciones de la modulación, ya que el contenido espectral de la señal resultante de la modulación será di2 ferente dependiendo del tipo de señal que utilicemos. Podemos considerar las señales unipolares como señales bipolares a las cuales les sumamos una constante de amplitud, es decir, las trasladamos en amplitud un nivel de continua (DC offset) que es equivalente al valor máximo negativo de la señal. Típicamente, una tabla de envolvente contiene una señal unipolar (por ejemplo, una envolvente del tipo ADSR que hemos visto en temas anteriores) y una tabla de forma de onda contiene una señal bipolar (por ejemplo, un período de una señal sinusoidal). 1.3. La modulación Para explicar el concepto de modulación, consideremos primero un oscilador, como ilustra la figura 2, que genera una onda sinusoidal pura si todos los parámetros de entrada (amplitud, frecuencia y fase) son constantes. Figura 2: Esquema de un oscilador La ecuación de la amplitud instantánea de una señal sinusoidal se expresa como sigue: y = A · sin(2 · π · f · t + φ) (1) donde A es la amplitud, f la frecuencia y φ la fase inicial. Recordemos que podemos también utilizar la notación ω (omega) para la velocidad angular, relacionada con la frecuencia mediante la relación ω = 2·π·f . Podemos, entonces, escribir la fórmula de la forma siguiente: y = A · sin(ω · t + φ) (2) Para obtener una señal modulada, hace falta disponer al menos de dos osciladores de este tipo. La idea de la síntesis por modulación es la de utilizar una de las dos señales (u osciladores) para hacer variar (es decir, para modular) uno de los parámetros de la otra señal (o del otro oscilador): la salida del primer oscilador se convertiría en una de las entradas del segundo oscilador. En función de la naturaleza del parámetro que se está variando, diremos que efectuamos una modulación de amplitud, de frecuencia o de fase. 3 Musicalmente, una modulación lenta de amplitud corresponde a un tremolo, mientras que una modulación lenta de la frecuencia corresponde a un vibrato. La terminología que se utiliza en síntesis por modulación es la que fue introducida con la primera utilización de la modulación de señales, que se realizó en la transmisión radio (AM y luego FM). Por ello siempre hablamos de señal portadora (carrier) y de señal moduladora (modulator), la cual contiene la información que se quiere transmitir. Nosotros utilizaremos la letra M para hacer referencia a la señal que modula (moduladora) y la letra C (del inglés carrier) para hacer referencia a la señal portadora. Por ejemplo, la frecuencia moduladora será fM o simplemente M para mayor simplicidad de la notación. Con el mismo fin, no escribiremos el término de la fase cuando no sea necesario. 1.4. Recordatorio de algunos conceptos de trigonometría Para entender y justificar matemáticamente los fenómenos de modulación que podemos observar, es necesario conocer las fórmulas relativas a las funciones seno y coseno. Sólo recordaremos las fórmulas de Simpson de las cuales se pueden deducir muchas fórmulas de las que se utilizan en este contexto: sin(α + β) = sinα · cosβ + sinβ · cosα sin(α − β) = sinα · cosβ − sinβ · cosα cos(α + β) = cosα · cosβ − sinα · sinβ cos(α − β) = cosα · cosβ + sinα · sinβ 2. (3) La modulación en anillo: Ring Modulation (RM) Este tipo de modulación es clásica en la música electrónica desde sus inicios. La modulación en anillo (en inglés Ring Modulation o RM) se denomina así de la misma forma que su tecnología analógica, y corresponde a la multiplicación de dos señales bipolares. Se multiplica una señal portadora yC por una señal moduladora yM de la siguiente forma: yRM = yC × yM (4) La figura 3 ilustra una implementación simple de la modulación en anillo. El primer oscilador (OSC MOD) genera la señal moduladora, la cuál se envía a la entrada “amplitud” del segundo oscilador (OSC CAR). Es decir, multiplicar dos señales es igual que decir que una señal se convierte en la amplitud de la otra señal. Es importante ver que los dos osciladores leen funciones bipolares, en el caso de la modulación en anillo. Como veremos más adelante, la modulación de amplitud es muy similar a la modulación en anillo, con la diferencia que la señal moduladora es unipolar. Para saber cuál es el contenido espectral de una señal que resulta de la multiplicación de dos señales sinusoidales, tenemos que recurrir a las fórmulas trigonométricas vistas anteriormente. Si sumamos la cuarta y quinta fórmulas de Simpson que dimos anteriormente, podemos deducir que: cosα · cosβ = [cos(α + β) + cos(α − β)] 2 4 (5) Figura 3: Modulación en anillo Por decirlo de otra manera, si multiplicamos una señal portadora de frecuencia C por una señal moduladora de frecuencia M, la señal resultante no contiene ninguna de las dos frecuencias, sino que por el contrario, contiene dos componentes, una en la suma de las frecuencias de partida (C+M) y otra en la diferencia de las frecuencias (C-M). En cuanto a la amplitud de las componentes, cada una valdrá la mitad de la amplitud de las señales multiplicadas. Ejemplo de modulación en anillo: fC = 1000 Hz y fM = 400 Hz. Después de la multiplicación obtendremos componentes a 600 Hz y 1400 Hz, como podemos ver en la figura 4. Figura 4: Ejemplo de modulación en anillo Si la señal portadora es compleja (es decir, está compuesta por una suma de 5 sinusoides) y la señal moduladora es sinusoidal, la modulación en anillo tiene por efecto el reemplazar cada parcial de la señal portadora por un par de componentes en la suma y la diferencia de frecuencias con la de la señal moduladora. Si las señales multiplicadas son las dos complejas, entonces el espectro resultante es todavía más rico, ya que contiene las sumas y diferencias de todas las frecuencias que aparecen en las dos señales. El sonido resultante de la modulación en anillo es generalmente inarmónico y de carácter ruidoso, sobre todo si las dos fuentes son complejas. Finalmente, en el caso de la multiplicación de cosenos, hay que añadir que si la diferencia entre dos frecuencias nos da una frecuencia negativa, ésta se convierte en positiva, gracias a la propiedad siguiente: cos(−α) = cos(α) (6) Según las respectivas fases de las señales multiplicadas, puede ser que la componente en frecuencia negativa se convierta en positiva con una inversión de fase, o un cambio de fase. Ejercicio: determinar el resultado de la multiplicación de un seno y un coseno a partir de las fórmulas de Simpson. Como todo tipo de modulación, la modulación en anillo se acompaña de un ensanchamiento del espectro. Por lo tanto tenemos que ser conscientes de los riesgos de que aparezcan bajas frecuencias (al tener frecuencias negativas) y altas frecuencias (mayores que la frecuencia de Nyquist o frecuencia límite para el muestreo). Esto puede afectar al espectro (y al timbre percibido) si las componentes que aparecen tienen una amplitud significativa, introduciendo por ejemplo nuevas frecuencias inarmónicas en un espectro armónico o interfiriendo con componentes ya presentes en el espectro aumentando o disminuyendo la energía en esas frecuencias. Un ejemplo de utilización musical de la modulación en anillo es la modificación de señales portadoras tales como voces o piano con moduladoras sinusoidales. Otra estrategia es la de crear sonidos puros sintéticos con relaciones armónicas o inarmónicas. Un ejemplo es la pieza Sequence Symbols del compositor James Dashow. Stockhausen utilizó la modulación en anillo en muchas piezas de los años 60 (Kontakte, Mikrophonie I-II, Telemusik, Hymnen, Prozession, Kurzwellen). 3. La modulación de amplitud: Amplitude Modulation (AM) La modulación de amplitud es idéntica que la modulación en anillo, excepto que la señal moduladora es una señal unipolar. La aplicación más evidente de la modulación de amplitud es la multiplicación de la señal portadora por una envolvente de amplitud (ejemplo: envolvente ADSR, que se muestra en la figura 5). Musicalmente, una modulación lenta (con frecuencia moduladora menor que 20 Hz) corresponde a un tremolo. En el caso de las señales sinusoidales, podemos expresar matemáticamente la modulación de amplitud de la forma siguiente: yAM = AC · sin(2 · π · fC · t) 6 (7) Figura 5: Modulación de amplitud ADSR donde: AC = [1 + AM · cos(2π · fM · t)] (8) Por lo tanto, obtenemos: [1 + AM · cos(ωM · t)] · sin(ωC · t) = sin(ωC · t) + AM [sin(ωC · t) · cos(ωM · t)] = sin(ωC · t) + A2M · [sin((ωC + ωM ) · t) + sin((ωC − ωM ) · t)] (9) Como indica la ecuación final, el espectro resultante de una modulación AM contiene la frecuencia portadora fC , así como las dos otras componentes fC +fM y fC − fM . Ejemplo de modulación AM: si la frecuencia portadora vale 1000 Hz y la moduladora 400 Hz, el espectro resultante contiene la portadora 1000 Hz, así como las componentes laterales respectivamente en 600 y 1400 Hz (como podemos ver en la figura 6). En la ecuación anterior, el factor AM (amplitud de la señal moduladora) es el factor de modulación (I) que permite ajustar la amplitud de las componentes 7 Figura 6: Espectro de una señal AM laterales respecto a la componente central. El factor vale 1 en el caso que se ilustra en la figura 6, es decir, si la portadora y la moduladora tienen la misma amplitud. En este caso, la amplitud de las componentes laterales vale la mitad de la amplitud de la componente central. 4. 4.1. La modulación de frecuencia:Frequency Modulation (FM) Introducción La modulación de frecuencia supuso una etapa importante en el desarrollo de los métodos modernos de síntesis de sonidos. Este método de síntesis sonora explota los mismos principios que se utilizan en las transmisiones radiofónicas FM, y fue inventado por John Chowning en 1967, en el departamento de música de Stanford. Una variante de este tipo de síntesis (por modulación de fase) es la que se implementa en los famosos sintetizadores DX7 de Yamaha. En la transmisión por radio, el proceso implica la modulación de la frecuencia de una onda portadora por la señal que contiene la información a transmitir. La frecuencia portadora de una señal de radio FM es del orden de la centena de Megahercios (108 Hz). Cuando este método se aplica a la síntesis sonora, la frecuencia portadora se eleva a la gama de las frecuencias audio (20 Hz a 20.000 Hz), y la moduladora a las frecuencias audio o, más corrientemente, sub-audio. Si la frecuencia moduladora es inferior a 8 Hz, el resultado de la modulación es un vibrato. Pensemos en el violinista que genera un vibrato con su instrumento haciendo variar rápidamente la longitud de la cuerda (y por tanto la altura resultante del sonido) por un movimiento de la muñeca y del dedo que toca la cuerda. Pero si esta frecuencia se sitúa alrededor de los 20 Hz, obtenemos una modificación del timbre del sonido modulado. Entre estas dos frecuencias (8 y 20 Hz), se produce una transición progresiva de un efecto al otro. Podemos experimentar con frecuencias modulantes mayores, incluso superiores a la portadora. 8 La figura 7 describe un esquema de una implementación simple de modulación de frecuencia. Figura 7: Diagrama de síntesis FM Podemos expresar la señal modulada de la forma siguiente: yF M = AC · sin((ωC + AM · sin(ωM · t)) · t) (10) El espectro resultante contiene la frecuencia de la portadora, así como toda una serie de frecuencias distribuidas de forma simétrica alrededor de la frecuencia portadora, a distancias iguales a todos los múltiplos enteros de la frecuencia moduladora (el espectro de una señal FM se representa en la figura 8). Los grupos de componentes de un lado y del otro de la portadora se denominan bandas laterales. Ejemplo de síntesis por modulación de frecuencia: si la frecuencia portadora C es igual a 800 Hz, y la frecuencia moduladora M es 200 Hz, las bandas laterales contienen las componentes a las frecuencias siguientes: C − M = 600 Hz C + M = 1000 Hz C − (2 × M ) = 400 Hz C + (2 × M ) = 1200 Hz C − (3 × M ) = 200 Hz C + (3 × M ) = 1400 Hz etc.. 9 (11) Figura 8: Espectro de una señal FM En este ejemplo, la relación de las frecuencias C:M es un número entero. Por lo tanto, obtenemos un espectro armónico. La altura percibida corresponde a la frecuencia moduladora misma (aquí sería 200 Hz). Si la relación C:M no es entera, el espectro resultante es inarmónico. Por ejemplo, consideremos la relación 8:2.1, con C=800 Hz y M=210 Hz. Las frecuencias presentes en el espectro serán: M = 210 Hz; C = 800 Hz C − M = 590 Hz C + M = 1010 Hz C − (2 × M ) = 380 Hz C + (2 × M ) = 1220 Hz C − (3 × M ) = 170 Hz C + (3 × M ) = 1430 Hz etc.. (12) Si la señal que sufre la modulación contiene varios parciales, las bandas laterales aparecerán alrededor de cada uno de los parciales. Por lo tanto, se enriquecerá considerablemente el espectro. 4.2. Ejemplos de síntesis FM La figura 9 presenta 3 ejemplos de señales moduladas en frecuencia. La onda portadora y la onda moduladora son las dos sinusoidales, indicadas en la figura con sc y sm respectivamente. Estos tres ejemplos se distinguen por la relacio de frecuencia c:m diferentes: A: la frecuencia portadora es superior a la moduladora (C:M = 10), es decir, la portadora (rápida) está modulada por una señal que oscila lentamente. B: la frecuencia portadora y moduladora son iguales (C:M = 1) 10 Figura 9: Ejemplos de señales moduladas en frecuencia C: la frecuencia portadora es inferior a la moduladora (C:M = 0.1), es decir, la portadora (lenta) se modula muy rápidamente. Podemos observar la forma de onda resultante de la modulación, así como la frecuencia instantánea en función del tiempo. El índice de modulación I determina la desviación máxima D de la frecuencia portadora, en función de la frecuencia moduladora M: D =I ×M (13) Para ilustrar esto, consideremos el caso del ejemplo A: La frecuencia portadora vale 500 Hz. La relación C:M es 10:1, por tanto la frecuencia moduladora vale 50 Hz. El índice de modulación I = 6, por lo tanto la desviación máxima D (o △f ) de la frecuencia portadora vale 6 × 50 = 300 Hz. Deducimos que la frecuencia instantánea oscila entre 200 (500-300) et 800 (500+300) Hz. 4.3. ¿Modulación de frecuencia o de fase? En su artículo, ahora célebre, John Chowning proporciona la fórmula siguiente para describir matemáticamente la síntesis FM: y = A · sin[ωC · t + I · sin(ωM · t)] donde: 11 (14) A es la amplitud de la portadora ωC es la frecuencia angular de la portadora (en radianes por segundo) ωM es la frecuencia angular moduladora I es el índice o tasa de modulación Hay que remarcar que esta fórmula es en realidad la expresión matemática de una modulación de fase. Pero hay que saber que modulación de frecuencia y de fase son equivalentes. De hecho, modular la fase con la función m(t) equivale a modular la frecuencia con m’(t), la derivada de m(t). Por lo tanto si una función seno modula la fase, una función coseno (derivada del seno) modula la frecuencia. La modulación de fase es precisamente el método que se implementa en los sintetizadores Yamaha DX7. Este método ofrece ciertas ventajas respecto a la modulación de frecuencia, permitiendo generar el mismo tipo de sonidos. La primera ventaja de la modulación de fase es que permite la automodulación de un oscilador sin cambiar la frecuencia portadora de la forma de onda resultante. La segunda ventaja es que la frecuencia portadora no se ve afectada si la onda moduladora contiene una componente contínua (valor medio no nulo). Contrariamente, hay que notar que la modulación de fase sólo funciona correctamente sobre los sintetizadores digitales, ya que requiere osciladores estables. El acrónimo FM es tan corriente que lo encontramos en la mayoría de los documentos que tratan de este tema, aunque la modulación de fase es la técnica que se utiliza en la práctica. 4.4. Bandas laterales y funciones de Bessel En las líneas siguientes escribiremos M en vez de ωM y C en vez de ωC para simplificar las fórmulas. Matemáticamente podemos descomponer la fórmula dada por Chowning: y = A · sin[ωC · t + I · sin(ωM · t)] (15) en una suma de términos correspondientes a sinusoides a las frecuencias C, C + M , C − M , C + 2 × M , C − 2 × M , C + 3 × M , C − 3 × M , etc... La amplitud de las componentes a las frecuencias C + n × M y C − n × M viene dada por Jn(I), donde Jn es una función de Bessel de primera especie y de orden n, función del índice de modulación I. Las figuras siguientes ilustran las funciones de Bessel de orden 0 (figura 10) (la amplitud de la portadora para diferentes tasas de modulación) y de orden 1 (figura 11) (amplitud de las componentes a C+M y C-M para diferentes índices de modulación). Por tanto, podemos deducir que una variación del índice de modulación I induce a una variación importante del contenido espectral. Cuando I=0, la amplitud de la portadora es máxima y no hay bandas laterales (el efecto de la modulación se anula). Si aumentamos el valor de I, la amplitud de la portadora disminuye, mientras que las bandas laterales aparecen. Este hecho se ilustra en la figura 12 y 13 en representaciones tridimensionales de una señal en la que hemos hecho variar la tasa de modulación de 0 a 4 de forma lineal en el tiempo. En la figura 12, 12 Figura 10: Función de Bessel de orden 0 I aumenta linealmente de 0 a 2.4. En la figura 13, el aumento de la tasa de modulación se realiza hasta el valor 4. En las figuras, las curvas de envolvente temporal que aparecen para la frecuencia central y las bandas laterales son las funciones de Bessel mismas (o su valor absoluto, ya que se trata de un espectro de amplitud). 4.5. Índice de modulación, anchura de banda y espectro dinámico Chowning estimó que el número de componentes de amplitud significativas en las bandas laterales es función del índice de modulación y vale (I+1). Este hecho se ilustra en la figura 14, que muestra el espectro resultante de una modulación de frecuencia para los valores del índice de modulación 0,1,2,3 y 4. Cuando I=0, no hay modulación. Cuando I crece, las bandas laterales aparecen a un lado y otro de la frecuencia portadora, de la cual toman la energía. Para I=4, cada banda lateral contiene (4+1)=5 componentes significativas en amplitud. Las otras componentes son tan débiles en amplitud, que las podemos considerar inexistentes. Podemos también deducir una fórmula para la anchura de banda del espectro obtenido, en función del índice de modulación. Sabiendo que una banda lateral contiene (I+1) componentes y que la distancia entre dos componentes vale M: D + 1) = 2 × (D + M ) (16) M La anchura del espectro obtenido vale entonces aproximadamente 2 veces la suma de la desviación máxima de la portadora (D) y de la frecuencia moduladora (M). Podemos por tanto concluir que la longitud de banda crece con el índice de modulación, y podemos aprovechar esta particularidad para utilizar el índice de modulación como parámetro de control para la síntesis de un espectro dinámico (cuyo contenido evoluciona con el tiempo). BW = 2 × (I + 1) × M = 2 × M × ( 13 Figura 11: Función de Bessel de orden 1 De todas maneras, tenemos que considerar que, al igual que para la modulación AM, algunas relaciones C:M o índices de modulación muy elevados generarán frecuencias que se sumarán al espectro resultante, a veces con inversión de fase. Este resultado no es necesariamente indeseable, ya que el espectro en las frecuencias graves se enriquecerá. La inversión de fase es debida a la propiedad de la función seno: sin(−α) = −sin(α) (17) En la figura 15 ilustra la implementación de la modulación de frecuencia con índice de modulación variable. Esta implementación permite controlar la síntesis FM a través de tres parámetros pertinentes: La frecuencia portadora (Carrier frequency en la figura) La relación C:M, relación de frecuencias portadora y moduladora El índice de modulación I Estos tres parámetros son eficaces para el control de la síntesis FM, ya que están directamente ligados a características tímbricas: Variando la frecuencia portadora, desplazamos el espectro hacia los agudos o los graves. Variando la relación C:M, podemos decidir el carácter armónico (relación de enteros) o inarmónico del timbre, y podemos hacer variar el ancho de las bandas laterales alargándolo (con una relación C:M pequeña) o comprimiéndolo (con una relación C:M alta). Variando el índice de modulación, tenemos un control directo sobre el número de componentes en las bandas laterales (ya que este número está directamente relacionado a I y vale aproximadamente (I+1)). 14 Figura 12: Variación del índice de modulación I de 0 a 2.4 En la figura, el índice de modulación varía siguiendo una envolvente de tipo ADSR. El espectro obtenido es dinámico: al principio del sonido, las bandas laterales contienen 6 componentes importantes, que desaparecen poco a poco a medida que la portadora aumenta su amplitud. Al final de sonido, sólo la portadora está presente. El módulo calcularía la amplitud del oscilador modulador multiplicando el índice de modulación I por la frecuencia moduladora M, lo que nos daría D, la desviación máxima de la frecuencia portadora. Parámetros de control serían el momento de inicio, la duración, la amplitud de la portadora, la frecuencia portadora y la relación C:M. 4.6. Variantes de la modulación de frecuencia Aunque la modulación de frecuencia sea una forma económica y elegante de generar espectros dinámicos ricos, el sonido generado está muy tipificado, es decir, la modulación de frecuencia nos genera un timbre que se puede reconocer rápidamente. Por tanto, se han estudiado diversas variaciones posibles a la implantación de base que permiten ampliar esta técnica. Por ejemplo, podremos utilizar diversas señales portadoras con una sola señal moduladora para generar bandas laterales en regiones concretas del espectro (similar a formantes vocales). Podremos utilizar diversas señales moduladoras con una sola señal portadora que podremos conectar en paralelo o en serie. Algoritmos de este tipo son los que encontramos en los sintetizadores DX7. 5. Referencias 1. Road, C., The Computer Music Tutorial, Chapter 6. pp. 213-236. 15 Figura 13: Variación del índice de modulación I de 0 a 4 2. Tutorial for Frequency Modulation Synthesis http://www.sfu.ca/t̃ruax/fmtut.html 3. Yamaha DX7 Users’ Manual http://membres.lycos.fr/chipple/dx7/ 4. La synthèse sonore par modulation http://cours.musique.umontreal.ca:16080/MUS2312/cours04_modulation.html 16 Figura 14: Espectro FM para indices de modulación I=0,1,2,3 y 4 17 Figura 15: Modulación FM con índice de modulación variable 18