Uploaded by Jordani Santana

8 Octava clase

advertisement
Hidrología (CIV332-1)
Análisis de frecuencia
Paréntesis: DISTRIBUCIÓN NORMAL ESTÁNDAR
La distribución normal estándar está dada por la ecuación:
1
f (z ) =
2
e
− z2
2
El área bajo esta curva hasta determinado valor de z estaría dada entonces por:
F (z ) =

z
−
1
2
e
−t 2
2 dt
y representa la probabilidad de que t, una variable auxiliar, se encuentre entre - y z,
es decir, F(z) viene a ser la probabilidad de que z no sea excedido, de modo que:
𝑷 𝒏𝒐 𝒆𝒙𝒄 = 𝑭(𝒛)
La relación z versus F(z) suele encontrarse en tablas y como una función en hojas de
cálculo computacionales y algunas calculadoras.
Análisis de frecuencia en hidrología
La información hidrométrica y pluviométrica disponible es histórica, con eventos cuyo
patrón de ocurrencia debe ser analizado a fin de establecer la probabilidad de que se
presente un evento superior al que se consideraría en el diseño o, a partir de una
probabilidad de excedencia adoptada, establecer cuál sería el evento de diseño.
La probabilidad de excedencia viene a ser la frecuencia, la cual es equivalente a la
inversa del periodo de retorno (tiempo promedio en años transcurrido entre los eventos
que igualan o exceden determinada magnitud en determinado lugar).
Modelos utilizados
El análisis de frecuencia permite pronosticar magnitudes de eventos extraordinarios
asociados a determinadas probabilidades de excedencia (o periodos de retorno)
haciendo uso de distribuciones de probabilidad que describan los eventos históricos
registrados.
Se tienen varios modelos de análisis de frecuencia, los más utilizados para el
tratamiento de información hidrométrica y pluviométrica —a nivel de valores máximos—
son: Log Normal, Log Pearson Tipo III y Gumbel.
Modelo general
En general, los modelos estiman el valor que tomaría una variable X para un periodo de
retorno T, esto es XT, mediante la siguiente expresión:
XT =  + KT 
KT: factor de frecuencia
: media poblacional de X
: desviación estándar poblacional de X
Si  y  no se conocen, entonces se calculan utilizando los datos muestrales.
KT depende del periodo de retorno y del tipo de distribución que describe a la población.
Algunos modelos analizan la variable log X en lugar de la variable X; adecuando la
ecuación anterior la estimación se efectuaría entonces según:
log X T =  log X + K T  log X
logX: media poblacional de log X
logX: desviación estándar poblacional de log X
Distribución Log Normal
Este es un modelo que analiza la variable log X y considera que esta sigue una
distribución normal (distribución simétrica con media  y desviación estándar ).
La variable de distribución normal estándar está dada por:
X−
z=

En el caso de distribución log normal:
z=
log X −  log X
 log X
Se trata de una variable normalmente distribuida con media cero y desviación estándar
uno, y cada valor de z tiene asociada una probabilidad de excedencia.
Entonces, el factor de frecuencia toma el valor de la variable de distribución normal
estándar correspondiente a la probabilidad de excedencia deseada.
KT = zT
p exc
1
= = 1 − F (z T )
T
Ejemplo
¿Cuál sería el factor de frecuencia de probabilidad normal a utilizar para pronosticar un
valor extremo con periodo de retorno 100 años?
El periodo de retorno de 100 años corresponde a una probabilidad de excedencia 0,01,
es decir, una probabilidad de no excedencia 0,99. Entonces buscamos el valor de z
para el cual F(z) toma el valor 0,99, que viene a ser 2,326. El factor de frecuencia de
probabilidad normal para un periodo de retorno de 100 años es 2,326.
Distribución Log Pearson Tipo III
Este modelo también analiza la variable log X y considera que esta sigue una
distribución Pearson Tipo III.
La distribución Pearson Tipo III es una distribución asimétrica de tres parámetros que
también tiene ecuaciones que la describen —las cuales no serán escritas aquí— pero
mediante una tabla preparada puede hallarse directamente el factor de frecuencia en
función del coeficiente de asimetría poblacional (o muestral) y la probabilidad de
excedencia (o el periodo de retorno).
Ejemplo
¿Cuál sería el factor de frecuencia de probabilidad Pearson Tipo III a utilizar para
pronosticar un valor extremo con periodo de retorno 100 años a partir de una muestra
con coeficiente de asimetría 1,0?
Directamente, a partir del cuadro se halla el valor 3,022. Observemos que para un
coeficiente de asimetría cero hallamos en la tabla el valor 2,326, exactamente el mismo
valor que se había determinado suponiendo una distribución normal para el mismo
periodo de retorno.
Valores de KT versus T, pexc y Cs (distribución Pearson Tipo III)
Distribución Gumbel
El modelo Gumbel analiza la variable X y considera que esta sigue una distribución de
Valor Extremo Tipo I. En la distribución Gumbel se cumple la siguiente relación:
pexc = 1− e
− e− y T
Donde:
yT − y
y
XT − 
=
= KT

yT: variable reducida de Gumbel con periodo de retorno T
y: media de la variable reducida
y: desviación estándar de la variable reducida
Valores de y y y versus n (distribución Gumbel)
Ejemplo:
¿Cuál sería el factor de frecuencia de Gumbel a utilizar para pronosticar un valor
extremo con periodo de retorno 100 años a partir de una muestra de 50 datos?
La probabilidad de excedencia correspondiente es 0,01, a partir de la cual se obtiene el
valor de y100 como 4,600. Para una longitud de muestra 50 hallamos que y toma el
valor 0,5485 y y el valor 1,1607. Calculamos entonces el factor de frecuencia K100 que
resulta 3,491.
Selección de la muestra para análisis
Si se dispone de información hidrométrica se analizará una muestra de caudales
máximos, mientras que en el caso de información pluviométrica se analizará una
muestra de precipitaciones máximas en 24 horas.
En ambos casos se dispondrá inicialmente de un registro histórico con un dato por mes
y por año a partir del cual se obtendrá una muestra de longitud igual al número de años
en los que se cuenta con información (longitud del registro en años).
Lo usual es tomar un valor por año hidrológico: el máximo valor anual de la variable
hidrológica analizada. El año hidrológico se inicia con el inicio del periodo de avenidas
y finaliza con el término del periodo de sequías, periodos que se suceden año a año.
Selección de la distribución de probabilidad que mejor modela la muestra
Se ha presentado los modelos Log Normal, Log Pearson Tipo III y Gumbel como los
más utilizados para el análisis de una muestra de datos hidrológicos máximos y, como
es obvio, cada modelo hará un pronóstico distinto; debe entonces seleccionarse el
modelo que mejor se ajusta a la muestra de información histórica y cuyo pronóstico está
más en concordancia con la serie de valores analizados.
Utilizando las relaciones anteriormente presentadas para cada distribución de
probabilidad, puede hacerse el procedimiento inverso, es decir, en lugar de hallar el
valor que toma la variable X para cierto periodo de retorno (o probabilidad de
excedencia), puede hallarse la probabilidad de excedencia asociada a cada valor de X
observado. Tal probabilidad de excedencia será teórica (del modelo) y puede ser
comparada con la probabilidad de excedencia observada para establecer cuánto se
aparta el modelo de los valores observados.
La probabilidad de excedencia observada es determinada utilizando fórmulas de
posición de ploteo dadas por diferentes autores, sin embargo, la de mayor aplicación es
la ecuación de Weibull.
Los valores de la muestra histórica serán ordenados de mayor a menor y se asignará
un número de orden a cada uno: el máximo tendrá número de orden 1 y el mínimo tendrá
número de orden igual a la longitud de la muestra.
Entonces puede hallarse la
probabilidad de excedencia observada con la cual se comparará la probabilidad de
excedencia teórica para cada valor de X en la muestra.
El valor absoluto de la diferencia entre los valores de probabilidad teórica y observada
—desviación estimada para cada dato— muestra el ajuste del modelo a los valores
observados; para seleccionar el modelo con mejor ajuste puede evaluarse la máxima
desviación obtenida con cada modelo y optar por aquél que muestre menor desviación
máxima.
Opcionalmente, los valores observados y el modelo teórico pueden ser graficados en
papeles de probabilidad correspondientes; sin embargo, debe indicarse que el ajuste
del modelo a los valores observados no se aprecia en su verdadera magnitud debido a
la escala utilizada en estos papeles: de probabilidad.
Ejemplo
Se tiene una muestra de 50 valores de precipitación máxima en 24 horas registrados en
la estación Tarapoto, el mayor de los cuales es 111,0 mm y el menor 42,0 mm. La media
y desviación estándar de los datos son 70,3 mm y 19,1 mm, respectivamente.
Determine la desviación del modelo Gumbel respecto al valor de 111,0 mm.
Usando las expresiones correspondientes, hallamos que el factor de frecuencia del valor
111,0 mm es
(111,0 - 70,3)/19,1 = 2,1277
Entonces podemos hallar el valor de la variable reducida de Gumbel que resulta
(0,5485 + 1,1607*2,1277) = 3,0181
La probabilidad de excedencia teórica sería
1 - exp(-exp(-3,0181) = 0,0477
De otro lado, la probabilidad de excedencia observada resultaría
1/51 = 0,0196
de modo que la diferencia entre ambas probabilidades para el mismo dato es
abs(0,0196 - 0,0477) = 0,0281
Para el valor 42,0 mm esta diferencia resulta 0,0210. Siguiendo el mismo procedimiento
se puede hallar la desviación para cada valor de la muestra.
Download