Hidrología (CIV332-1) Análisis de frecuencia Paréntesis: DISTRIBUCIÓN NORMAL ESTÁNDAR La distribución normal estándar está dada por la ecuación: 1 f (z ) = 2 e − z2 2 El área bajo esta curva hasta determinado valor de z estaría dada entonces por: F (z ) = z − 1 2 e −t 2 2 dt y representa la probabilidad de que t, una variable auxiliar, se encuentre entre - y z, es decir, F(z) viene a ser la probabilidad de que z no sea excedido, de modo que: 𝑷 𝒏𝒐 𝒆𝒙𝒄 = 𝑭(𝒛) La relación z versus F(z) suele encontrarse en tablas y como una función en hojas de cálculo computacionales y algunas calculadoras. Análisis de frecuencia en hidrología La información hidrométrica y pluviométrica disponible es histórica, con eventos cuyo patrón de ocurrencia debe ser analizado a fin de establecer la probabilidad de que se presente un evento superior al que se consideraría en el diseño o, a partir de una probabilidad de excedencia adoptada, establecer cuál sería el evento de diseño. La probabilidad de excedencia viene a ser la frecuencia, la cual es equivalente a la inversa del periodo de retorno (tiempo promedio en años transcurrido entre los eventos que igualan o exceden determinada magnitud en determinado lugar). Modelos utilizados El análisis de frecuencia permite pronosticar magnitudes de eventos extraordinarios asociados a determinadas probabilidades de excedencia (o periodos de retorno) haciendo uso de distribuciones de probabilidad que describan los eventos históricos registrados. Se tienen varios modelos de análisis de frecuencia, los más utilizados para el tratamiento de información hidrométrica y pluviométrica —a nivel de valores máximos— son: Log Normal, Log Pearson Tipo III y Gumbel. Modelo general En general, los modelos estiman el valor que tomaría una variable X para un periodo de retorno T, esto es XT, mediante la siguiente expresión: XT = + KT KT: factor de frecuencia : media poblacional de X : desviación estándar poblacional de X Si y no se conocen, entonces se calculan utilizando los datos muestrales. KT depende del periodo de retorno y del tipo de distribución que describe a la población. Algunos modelos analizan la variable log X en lugar de la variable X; adecuando la ecuación anterior la estimación se efectuaría entonces según: log X T = log X + K T log X logX: media poblacional de log X logX: desviación estándar poblacional de log X Distribución Log Normal Este es un modelo que analiza la variable log X y considera que esta sigue una distribución normal (distribución simétrica con media y desviación estándar ). La variable de distribución normal estándar está dada por: X− z= En el caso de distribución log normal: z= log X − log X log X Se trata de una variable normalmente distribuida con media cero y desviación estándar uno, y cada valor de z tiene asociada una probabilidad de excedencia. Entonces, el factor de frecuencia toma el valor de la variable de distribución normal estándar correspondiente a la probabilidad de excedencia deseada. KT = zT p exc 1 = = 1 − F (z T ) T Ejemplo ¿Cuál sería el factor de frecuencia de probabilidad normal a utilizar para pronosticar un valor extremo con periodo de retorno 100 años? El periodo de retorno de 100 años corresponde a una probabilidad de excedencia 0,01, es decir, una probabilidad de no excedencia 0,99. Entonces buscamos el valor de z para el cual F(z) toma el valor 0,99, que viene a ser 2,326. El factor de frecuencia de probabilidad normal para un periodo de retorno de 100 años es 2,326. Distribución Log Pearson Tipo III Este modelo también analiza la variable log X y considera que esta sigue una distribución Pearson Tipo III. La distribución Pearson Tipo III es una distribución asimétrica de tres parámetros que también tiene ecuaciones que la describen —las cuales no serán escritas aquí— pero mediante una tabla preparada puede hallarse directamente el factor de frecuencia en función del coeficiente de asimetría poblacional (o muestral) y la probabilidad de excedencia (o el periodo de retorno). Ejemplo ¿Cuál sería el factor de frecuencia de probabilidad Pearson Tipo III a utilizar para pronosticar un valor extremo con periodo de retorno 100 años a partir de una muestra con coeficiente de asimetría 1,0? Directamente, a partir del cuadro se halla el valor 3,022. Observemos que para un coeficiente de asimetría cero hallamos en la tabla el valor 2,326, exactamente el mismo valor que se había determinado suponiendo una distribución normal para el mismo periodo de retorno. Valores de KT versus T, pexc y Cs (distribución Pearson Tipo III) Distribución Gumbel El modelo Gumbel analiza la variable X y considera que esta sigue una distribución de Valor Extremo Tipo I. En la distribución Gumbel se cumple la siguiente relación: pexc = 1− e − e− y T Donde: yT − y y XT − = = KT yT: variable reducida de Gumbel con periodo de retorno T y: media de la variable reducida y: desviación estándar de la variable reducida Valores de y y y versus n (distribución Gumbel) Ejemplo: ¿Cuál sería el factor de frecuencia de Gumbel a utilizar para pronosticar un valor extremo con periodo de retorno 100 años a partir de una muestra de 50 datos? La probabilidad de excedencia correspondiente es 0,01, a partir de la cual se obtiene el valor de y100 como 4,600. Para una longitud de muestra 50 hallamos que y toma el valor 0,5485 y y el valor 1,1607. Calculamos entonces el factor de frecuencia K100 que resulta 3,491. Selección de la muestra para análisis Si se dispone de información hidrométrica se analizará una muestra de caudales máximos, mientras que en el caso de información pluviométrica se analizará una muestra de precipitaciones máximas en 24 horas. En ambos casos se dispondrá inicialmente de un registro histórico con un dato por mes y por año a partir del cual se obtendrá una muestra de longitud igual al número de años en los que se cuenta con información (longitud del registro en años). Lo usual es tomar un valor por año hidrológico: el máximo valor anual de la variable hidrológica analizada. El año hidrológico se inicia con el inicio del periodo de avenidas y finaliza con el término del periodo de sequías, periodos que se suceden año a año. Selección de la distribución de probabilidad que mejor modela la muestra Se ha presentado los modelos Log Normal, Log Pearson Tipo III y Gumbel como los más utilizados para el análisis de una muestra de datos hidrológicos máximos y, como es obvio, cada modelo hará un pronóstico distinto; debe entonces seleccionarse el modelo que mejor se ajusta a la muestra de información histórica y cuyo pronóstico está más en concordancia con la serie de valores analizados. Utilizando las relaciones anteriormente presentadas para cada distribución de probabilidad, puede hacerse el procedimiento inverso, es decir, en lugar de hallar el valor que toma la variable X para cierto periodo de retorno (o probabilidad de excedencia), puede hallarse la probabilidad de excedencia asociada a cada valor de X observado. Tal probabilidad de excedencia será teórica (del modelo) y puede ser comparada con la probabilidad de excedencia observada para establecer cuánto se aparta el modelo de los valores observados. La probabilidad de excedencia observada es determinada utilizando fórmulas de posición de ploteo dadas por diferentes autores, sin embargo, la de mayor aplicación es la ecuación de Weibull. Los valores de la muestra histórica serán ordenados de mayor a menor y se asignará un número de orden a cada uno: el máximo tendrá número de orden 1 y el mínimo tendrá número de orden igual a la longitud de la muestra. Entonces puede hallarse la probabilidad de excedencia observada con la cual se comparará la probabilidad de excedencia teórica para cada valor de X en la muestra. El valor absoluto de la diferencia entre los valores de probabilidad teórica y observada —desviación estimada para cada dato— muestra el ajuste del modelo a los valores observados; para seleccionar el modelo con mejor ajuste puede evaluarse la máxima desviación obtenida con cada modelo y optar por aquél que muestre menor desviación máxima. Opcionalmente, los valores observados y el modelo teórico pueden ser graficados en papeles de probabilidad correspondientes; sin embargo, debe indicarse que el ajuste del modelo a los valores observados no se aprecia en su verdadera magnitud debido a la escala utilizada en estos papeles: de probabilidad. Ejemplo Se tiene una muestra de 50 valores de precipitación máxima en 24 horas registrados en la estación Tarapoto, el mayor de los cuales es 111,0 mm y el menor 42,0 mm. La media y desviación estándar de los datos son 70,3 mm y 19,1 mm, respectivamente. Determine la desviación del modelo Gumbel respecto al valor de 111,0 mm. Usando las expresiones correspondientes, hallamos que el factor de frecuencia del valor 111,0 mm es (111,0 - 70,3)/19,1 = 2,1277 Entonces podemos hallar el valor de la variable reducida de Gumbel que resulta (0,5485 + 1,1607*2,1277) = 3,0181 La probabilidad de excedencia teórica sería 1 - exp(-exp(-3,0181) = 0,0477 De otro lado, la probabilidad de excedencia observada resultaría 1/51 = 0,0196 de modo que la diferencia entre ambas probabilidades para el mismo dato es abs(0,0196 - 0,0477) = 0,0281 Para el valor 42,0 mm esta diferencia resulta 0,0210. Siguiendo el mismo procedimiento se puede hallar la desviación para cada valor de la muestra.