ISBN: 978-612-47379-0-9 9 786124 737909 Estadı́stica Estudios Generales Letras José Flores Delgado ESTADÍSTICA Copyright © 2017 Estudios Generales Letras Pontificia Universidad Católica del Perú Estudios Generales Letras Av. Universitaria 1801, San Miguel Teléfono: 626-2000 Correo electrónico: consultas-eeggll@pucp.pe http://www.pucp.edu.pe Derechos reservados. Prohibida la reproducción de este libro por cualquier medio, total o parcialmente, sin permiso expreso de los editores. Primera edición: setiembre de 2017 1000 ejemplares Impreso en Perú - Printed in Peru Hecho el Depósito Legal en la Biblioteca Nacional del Perú N˚2016-10898 ISBN 978-612-47379-0-9 ISBN: 978-612-47379-0-9 9 786124 737909 Impresión: Tarea Asociación Gráfica Educativa Pasaje María Auxiliadora 156, Breña Setiembre 2017 Prólogo Este trabajo corresponde a la séptima edición de las notas de clases del curso de Estadı́stica impartidas por el autor durante varios semestres a los alumnos de la especialidad de Economı́a en la Facultad de Estudios Generales Letras de la Pontificia Universidad Católica del Perú. Aunque el texto ha sido usado para la especialidad de economı́a, gran parte también puede ser de utilidad para los alumnos de otras áreas de los Estudios Generales Letras y otras facultades. Agradezco a la Facultad de Estudios Generales Letras por promover este tipo de trabajos y por el apoyo recibido para la elaboración de este texto; a la Oficina de Publicaciones para la docencia de nuestra Universidad por las publicaciones previas; a la doctora Kathia Hanza, ex-directora de estudios de la Facultad de Estudios Generales Letras, por el apoyo brindado en la primera edición; al profesor Luis Vargas por la revisión de la primera versión del texto; y a Luis Naters por la revisión de esta versión. También agradezco a la sección de Matemáticas por las facilidades brindadas para la elaboración de este libro. Me permito también felicitar a ustedes, alumnos, por la madurez demostrada al optar por esta universidad, sabiendo de su exigencia y prestigio reconocidos; los invito a que contribuyan a mantenerlos, como lo han hecho los que los precedieron. Profesor José Flores Delgado Estadı́stica Finalmente, quiero advertir a los alumnos que este texto no debe sustituir a los principales manuales del tema ni a las clases ni a sus propios apuntes, que espero ahora puedan hacer en mejores condiciones. La lectura de la bibliografı́a sobre el tema es necesaria y valiosa para un mejor aprendizaje. José Flores Delgado. Lima, setiembre de 2017. 6 Índice 1. Estadı́stica descriptiva 11 1.1. ¿Qué es la Estadı́stica? . . . . . . . . . . . . . . . . . . 11 1.2. Nociones básicas . . . . . . . . . . . . . . . . . . . . . 13 1.3. Escalas o niveles de medición . . . . . . . . . . . . . . 17 1.3.1. Escala nominal . . . . . . . . . . . . . . . . . . 17 1.3.2. Escala ordinal . . . . . . . . . . . . . . . . . . . 18 1.3.3. Escala de intervalo . . . . . . . . . . . . . . . . 18 1.3.4. Escala de razón . . . . . . . . . . . . . . . . . . 19 1.4. Organización y tratamiento de datos. Promedios y percentiles . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.4.1. Caso de variables cualitativas . . . . . . . . . . 21 1.4.2. Caso de variables cuantitativas discretas . . . . 23 1.4.3. Caso de variables cuantitativas continuas . . . 25 1.5. Propiedades y uso de los promedios . . . . . . . . . . . 34 1.6. Medidas de dispersión . . . . . . . . . . . . . . . . . . 37 7 Profesor José Flores Delgado Estadı́stica 1.6.1. Propiedades de la desviación estándar . . . . . 40 1.7. Datos tipificados o estandarizados . . . . . . . . . . . 41 1.8. Diagrama de hojas y tallos . . . . . . . . . . . . . . . 44 1.9. Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . 45 1.10. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . 51 2. Correlación y regresión lineal 65 2.1. Correlación . . . . . . . . . . . . . . . . . . . . . . . . 65 2.2. Índice de correlación de Pearson . . . . . . . . . . . . 66 2.3. Regresión lineal simple . . . . . . . . . . . . . . . . . . 70 2.4. Análisis de varianza para la regresión . . . . . . . . . . 73 3. Probabilidad 76 3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . 76 3.2. Definición y propiedades de la probabilidad . . . . . . 79 3.3. Propiedades de la probabilidad . . . . . . . . . . . . . 81 3.4. Probabilidad condicional . . . . . . . . . . . . . . . . . 86 La regla del producto . . . . . . . . . . . . . . . . . . 88 La regla de la probabilidad total . . . . . . . . . . . . 90 8 ÍNDICE Profesor José Flores Delgado La regla de Bayes . . . . . . . . . . . . . . . . . . . . . 90 3.5. Independencia . . . . . . . . . . . . . . . . . . . . . . . 94 3.6. Probabilidad clásica y combinatoria . . . . . . . . . . 100 3.7. Probabilidad geométrica y frecuencial . . . . . . . . . 105 3.8. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . 109 4. Variable aleatoria 130 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . 130 4.2. Modelo probabilı́stico de una variable aleatoria . . . . 135 4.3. El valor esperado . . . . . . . . . . . . . . . . . . . . . 140 4.3.1. Valor esperado de una función de una variable aleatoria . . . . . . . . . . . . . . . . . . . . . . 142 4.3.2. Otras propiedades del valor esperado . . . . . . 144 4.4. Varianza y desviación estándar . . . . . . . . . . . . . 148 4.4.1. Propiedades de la varianza . . . . . . . . . . . 149 4.5. Función de distribución acumulada . . . . . . . . . . . 150 4.6. Propiedades de la distribución acumulada . . . . . . . 152 4.7. Técnica del cambio de variable . . . . . . . . . . . . . 153 4.8. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . 156 9 Profesor José Flores Delgado Estadı́stica 5. Modelos probabilı́sticos importantes 192 5.1. Modelos relacionados con un proceso de Bernoulli . . . 192 5.1.1. El modelo o distribución binomial . . . . . . . 194 5.1.2. El modelo o distribución geométrico . . . . . . 198 5.1.3. El modelo o distribución de Pascal o binomial negativa . . . . . . . . . . . . . . . . . . . . . . 200 5.1.4. El modelo o distribución de Poisson . . . . . . 203 5.1.5. El modelo o distribución exponencial . . . . . . 205 5.1.6. Modelo o distribución gamma . . . . . . . . . . 207 5.2. Modelo gaussiano o distribución normal . . . . . . . . 209 5.3. Modelo o distribución lognormal . . . . . . . . . . . . 219 5.4. Modelo o distribución hipergeométrica . . . . . . . . . 222 5.5. Modelo o distribución uniforme . . . . . . . . . . . . . 223 5.6. Modelo o distribución Beta . . . . . . . . . . . . . . . 228 5.7. La función generadora de momentos . . . . . . . . . . 229 5.8. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . 235 Bibliografı́a 261 10 1. Estadı́stica descriptiva 1.1. ¿Qué es la Estadı́stica? Como es natural, lo primero que debemos precisar es qué es la Estadı́stica; en ese sentido, proponemos las observaciones siguientes. ¿De dónde proviene el término ‘estadı́stica’ ? Desde tiempos muy remotos en la historia de la humanidad, 2300 años antes de Cristo, encontramos evidencias históricas que demuestran que culturas antiguas, como la china, la hebrea, la griega (particularmente la ateniense) y la romana, formaron censos (listas, registros, resúmenes), por razones de estado, por ejemplo, tributarios, alimentarios y militares. Como puede imaginarse, en aquellos tiempos remotos, el habitante común no estaba interesado en llevar a cabo semejante tarea, es decir, esta generación de datos resumidos era una labor o competencia exclusiva del estado; no es ahora difı́cil imaginar que de allı́ derive el término estadı́stica, en cuanto a su acepción de censo, lista o incluso resumen. Para ilustrar más este significado de estadı́stica, recordemos las siguientes frases comunes: “las estadı́sticas no mienten” “las estadı́sticas demuestran que...” “existen las mentiras, las grandes mentiras y las estadı́sticas” Después de tratar del origen de la Estadı́stica, veamos ahora el significado actual de esta. En efecto, hoy en dı́a, la estadı́stica es considerada como una ciencia y su caracterı́stica principal, 11 Profesor José Flores Delgado Estadı́stica ya no es solo obtener resúmenes; sino más bien, realizar inferencias a partir de los resultados obtenidos de una muestra relativamente pequeña de datos. A continuación, damos dos ejemplos de esto último. Ejemplo 1.1. Cuando estamos en épocas de elecciones, queremos saber las preferencias de todo el electorado, pero encuestar a todos resulta imposible, por razones de tiempo y dinero. Entonces, se recurre a tomar adecuadamente una muestra y, a partir de los resultados que se obtienen de ella, inferir lo que ocurrirá en general. Ejemplo 1.2. En el proceso de producción de un artı́culo, interesa comprobar si realmente se ha logrado el nivel de calidad deseado. Evidentemente, usar todas las unidades fabricadas resulta muy costoso y poco factible. Entonces, nuevamente, se opta por efectuar el control de la calidad solo para una muestra de unidades (apropiadamente elegida) para evidenciarse si está o no satisfecho el nivel deseado. Parece claro que las inferencias que resulten de lo observado, en solo una muestra de la población de estudio, no tienen que ser necesariamente verdaderas, sino que, más bien, están acompañadas de cierto margen de error y nivel de confianza; es decir, son solo ‘estimaciones’ o aproximaciones de lo que realmente ocurre. Es precisamente la búsqueda de estas medidas de error y de confianza para las inferencias lo que convierte a la Estadı́stica en una ciencia, pues, para ello, usa las Matemáticas y crea su propia teorı́a. A continuación, empezamos dando algunas definiciones, conceptos o ideas básicas. 12 Profesor José Flores Delgado Estadı́stica descriptiva 1.2. Nociones básicas Definición 1.1. La Estadı́stica es una ciencia que se ocupa de la recolección, presentación y análisis de datos. La caracterı́stica que la distingue es la de hacer generalizaciones o inferencias a partir de solo una muestra. Ejemplo 1.3. Un ejemplo de inferencia estadı́stica muy conocido es la inferencia sobre las preferencias electorales. Por ejemplo, “basándose en los resultados de una muestra de 1822 electores del paı́s, se estima que el porcentaje de electores (en todo el paı́s) a favor del candidato AT es de 41 %, con un margen de error de 2 % y un nivel de confianza en esta inferencia del 95 %”. En este caso, el margen de error significa que, en realidad, el verdadero porcentaje a favor del candidato AT está entre 41 %−2 % y 41 %+2 %, es decir, entre 39 % y 43 %. El nivel de confianza significa que la metodologı́a seguida para estimar dicho porcentaje acierta en el 95 % de las veces que es usada con muestras de este tamaño; por lo tanto, al ser este porcentaje de aciertos tan alto, se confı́a en que esta aplicación de la metodologı́a, con la muestra dada, sea uno de los casos en que se acierta en la inferencia. Clasificación de la Estadı́stica Existen dos grandes ramas en la Estadı́stica: la Estadı́stica descriptiva y la Estadı́stica inferencial. La Estadı́stica descriptiva, como su nombre lo da a entender, no va más allá de los datos disponibles, por ejemplo, la muestra; y lo que interesa es describir qué muestran los datos. Es la parte más conocida por la mayorı́a de las personas. Sus labores la encontramos, por ejemplo, en las tablas y gráficas que se acostumbran presentar con el fin de ilustrar ciertos patrones de tendencia que presenten los datos o, 13 Profesor José Flores Delgado Estadı́stica simplemente, para que los resultados sean mejor entendidos. Se puede decir que se ocupa de la primera etapa en el análisis de los datos: la descripción o análisis exploratorio. La Estadı́stica inferencial, en cambio, hace el trabajo más importante, es decir, lo que respecta a las inferencias: segunda etapa en el análisis de los datos. Observación 1.1. En realidad, en la Estadı́stica inferencial actual, existen dos corrientes cuyas metodologı́as se contraponen: la llamada Estadı́stica clásica, la que se acostumbra a enseñar y la más conocida; y la Estadı́stica bayesiana —en honor a su impulsor Thomas Bayes (1702-1761)—. Esta última estuvo demasiado tiempo olvidada, pues requiere de mucho cálculo computacional. Con respecto a fundamentos, la Estadı́stica bayesiana parece ser más formal. Por ejemplo, la inferencia obtenida con la Estadı́stica clásica, como ya hemos explicado, se basa en la aplicación de una técnica sobre determinada muestra aleatoria disponible; entonces, sucede que, en un alto porcentaje de las veces, la técnica produce un resultado o inferencia acertada. Por tal razón, parece natural que quien la aplica en una muestra en particular confı́e en que esa vez corresponda a uno de los aciertos y no a uno de los desaciertos, salvo, claro está, que la persona en cuestión se considere muy desafortunada; es decir, la inferencia Estadı́stica clásica se sustenta en el llamado “principio de la confianza”. En contraposición, para la Estadı́stica inferencial bayesiana, el grado de credibilidad o de confianza, en una inferencia, se debe basar solo en la oportunidad en la cual se esté aplicando, es decir, en la muestra disponible sin considerar todas las veces en las cuales se aplica. Entender esta exigencia de rigor requiere de un espı́ritu filosófico innato en el hombre desde su origen; pero, más allá de esta discusión, lo importante es que el objetivo básico es hacer inferencias. 14 Profesor José Flores Delgado Estadı́stica descriptiva Definición 1.2. Una variable es cualquier caracterı́stica de interés. Definición 1.3. Población es el conjunto de unidades, personas u objetos sobre los cuales interesa observar una o más caracterı́sticas. Definición 1.4. Una muestra es cualquier conjunto de una población. La muestra se llama aleatoria si sus integrantes han sido escogidos al azar. Definición 1.5. Un dato u observación es cualquier medida, resultado de haber observado una variable en una unidad de alguna población. Ejemplo 1.4. A continuación, veamos algunos ejemplos de variables, todas referidas a la población de electores del Perú: Preferencia electoral (opción del elector por determinado candidato o ninguno) Edad del elector (generalmente en años cumplidos) Estado socioeconómico del elector Número de integrantes en la familia del elector Sexo del elector Grado de instrucción del elector Ingresos mensuales del elector Definición 1.6. Las variables se suelen clasificar como cualitativas, si tienen carácter no numérico, y cuantitativas, si representan cantidades. A su vez, las variables cuantitativas se subclasifican en discretas, si el conjunto de valores posibles de la variable 15 Profesor José Flores Delgado Estadı́stica (denominado rango) puede ser enumerado, y en continuas, si este conjunto de valores constituye un intervalo o reunión de intervalos. Ejemplo 1.5. Veamos cómo se clasifican las variables dadas en el ejemplo 1.4: La preferencia electoral es una variable cualitativa: expresa la intención de votar a favor o en contra de determinado candidato. La edad del elector es una variable cuantitativa y, por la forma de medirla usualmente, se la puede considerar discreta; formalmente, deberı́a ser continua, pero, en la práctica, se mide en años cumplidos. El estado socioeconómico del elector es también una variable cualitativa, expresa el grupo o estrato socioeconómico al que pertenece el elector. El número de integrantes en la familia del elector es una variable cuantitativa discreta, ya que representa una cantidad y, además, los valores posibles que podrı́a asumir se pueden enumerar. El sexo del elector es una variable cualitativa. El grado de instrucción del elector también es una variable cualitativa, pues, si bien representa un grado, esto solo significa más o menos instrucción, pero no cantidad. El ingreso mensual es una variable cuantitativa continua, pues representa una cantidad y sus valores posibles, en teorı́a, constituyen un intervalo. 16 Profesor José Flores Delgado Estadı́stica descriptiva 1.3. Escalas o niveles de medición Por medición, se puede entender al proceso de observación de una caracterı́stica de interés sobre las unidades de la población. Esta medición se debe expresar como un número que informe, lo más precisamente posible, sobre la caracterı́stica en la unidad observada. Claro está que no siempre los números informarán lo mismo, pues depende de la naturaleza de lo observado; según esto, se tienen distintos niveles de medición o escalas. Solemos considerar cuatro niveles que trataremos a continuación. 1.3.1. Escala nominal Aquı́, los números solo sirven para distinguir valores o categorı́as diferentes de la variable. Ejemplo 1.6. El sexo de los electores se mide a través de este nivel de medición o escala. Una escala apropiada puede ser, por ejemplo, la siguiente: 0 = femenino; 1= masculino. En general, cualquier escala de este tipo es de la forma: a = femenino; b = masculino. Para ciertos a y b números reales, fijados previamente y con la única condición de que sean diferentes. 17 Profesor José Flores Delgado 1.3.2. Estadı́stica Escala ordinal Aquı́, los números, además de servir para distinguir, reflejan un orden existente entre los valores de la variable según el menor o mayor grado en el que se encuentre presente la caracterı́stica. Ejemplo 1.7. El grado de instrucción del elector se suele medir con este nivel. Para simplificar, supongamos que solo distinguimos cuatro valores: analfabeto, primaria, secundaria y superior. Entonces, una escala apropiada puede ser: 0 = analfabeto; 1 = primaria; 2 = secundaria; 3 = superior. En general, cualquier escala de este tipo es de la forma: a = analfabeto; b = primaria; c = secundaria; d = superior. Para ciertos a, b, c y d números reales, fijados previamente y con la única condición de que a < b < c < d. 1.3.3. Escala de intervalo Además de las caracterı́sticas anteriores, se tiene que las diferencias entre los números asignados representan propiamente cantidades de la caracterı́stica medida. Esto se logra definiendo una unidad de medida, y un cero u origen. Este último es arbitrario por no existir naturalmente, es decir, no existe un valor que indique ausencia de la caracterı́stica que se mide. Ejemplo 1.8. El tiempo en el calendario actual es medido de esta forma. Para ilustrar este tipo de escala, fijémonos en el acontecimiento de tres eventos A, B y C en el calendario actual, como se muestra a continuación: 18 Profesor José Flores Delgado A.C. 0 Estadı́stica descriptiva A B 100 200 C 300 400 500 Es inexacto afirmar que el tiempo transcurrido hasta B sea el doble del transcurrido hasta A. En efecto, esto puede parecer cierto en esta escala del calendario gregoriano, en la que el origen, al no existir naturalmente, ha sido fijado arbitrariamente; es decir, no significa ausencia de tiempo transcurrido. Sin embargo, sı́ es cierto que la diferencia entre el tiempo transcurrido hasta el acontecimiento A y el transcurrido hasta B es la tercera parte de la correspondiente diferencia existente entre B y C. Observación 1.2. Si dos escalas de intervalo son equivalentes, es decir, son útiles para medir la misma caracterı́stica, la relación existente entre una medición, X, cualquiera, obtenida para un elemento de la población, e Y , la correspondiente medición en el mismo elemento, pero con la otra escala es: Y = a + bX Siendo a y b constantes independientes del objeto que se mide con ambas escalas. Esto es ası́, pues b representa el posible cambio de unidad, por ejemplo de años a siglos, y a representa el posible cambio de origen. 1.3.4. Escala de razón Aquı́, los propios números asignados en la medición ya representan cantidades de la caracterı́stica que se mide. Estas escalas se caracterizan no solo por tener una unidad de medida, sino, también, 19 Profesor José Flores Delgado Estadı́stica por poseer un cero u origen natural, el cual significa ausencia de la caracterı́stica que se mide. Por esta razón, las proporciones entre los propios números ya representan cantidades y de allı́ el nombre de escala de “razón”. Ejemplo 1.9. Los ingresos del elector se miden con este nivel o escala, pues existe una unidad de medida (soles, dólares, etcétera), y existe un cero absoluto u origen natural, es decir, un valor que, sin importar la escala de razón empleada, indica ausencia de ingresos. Por la misma razón, el número de integrantes de la familia del elector también se mide con este nivel; en efecto, hay una unidad de medida (unidades, decenas, etcétera) y el cero es único: indica que no hay integrantes. Observación 1.3. Si dos escalas de razón poseen equivalencia, es decir, son útiles para medir la misma caracterı́stica, existirá una relación entre una medición, X, cualquiera, obtenida para un elemento de la población, e Y , la correspondiente medición en el mismo elemento, pero con la otra escala. La relación existente entre ambas es: Y = bX Siendo b una constante independiente del objeto sobre el que se mide con ambas escalas. Esto es ası́, pues b representa el posible cambio de unidad, por ejemplo de años a siglos, de soles a dólares o de unidades a decenas. 20 Profesor José Flores Delgado Estadı́stica descriptiva 1.4. Organización y tratamiento de datos. Promedios y percentiles A fin de poder detectar patrones de tendencia que puedan mostrar los datos disponibles, es usual organizarlos en una distribución de frecuencias, agrupándolos en clases y determinando las frecuencias, es decir, el número o proporción de datos correspondiente a cada una. Como veremos a continuación, el tratamiento depende del tipo de variable, pero vale la pena señalar que no existe una única manera de hacerlo. En todos los casos, suponemos que X es la variable de la cual se han obtenido los n datos disponibles. 1.4.1. Caso de variables cualitativas Ejemplo 1.10. El tipo de crédito directo otorgado por la banca múltiple es una variable cualitativa de interés en la supervisión de la banca. Supongamos que se desea averiguar cómo se han distribuido los créditos otorgados según el tipo; esta información la podemos obtener de la página web de la Superintendencia de Banca y Seguros. Ası́, la tabla siguiente muestra la distribución de esta variable al 31 de mayo de 2003: Distribución del Tipo de Crédito Concedido por la Banca Múltiple Tipo de crédito Número de deudores Porcentaje de deudores Hipotecario para vivienda 38 761 2,5 Comercial y a microempresa 237 882 15 De consumo 1 303 561 82,5 21 Profesor José Flores Delgado Estadı́stica La distribución de frecuencias se representa mediante barras o mediante sectores circulares; en ambos casos, los tamaños son proporcionales a la frecuencia del valor que representa. Ejemplo 1.11. La distribución del ejemplo anterior puede representarse mediante barras o sectores circulares como se muestra a continuación: Distribución de los deudores según el tipo de crédito adquirido. Panel superior: gráfico de barras. Panel inferior: gráfico de sectores circulares Apreciamos claramente que la mayor parte de los créditos concedidos son de consumo, con un 82,5 % del total de créditos asignados; sigue el tipo de crédito comercial y a microempresas (con el 15 %); y el tipo de crédito menos otorgado es el hipotecario, con solo un 2,5 %. 22 Profesor José Flores Delgado Estadı́stica descriptiva Al valor de la variable que se presenta con mayor frecuencia se de denomina moda; entonces, podemos decir que la moda del tipo de crédito otorgado es el tipo de consumo. 1.4.2. Caso de variables cuantitativas discretas Ejemplo 1.12. A fin de estudiar el número de sucursales que tienen las empresas de cierto ramo de la producción nacional, se tomó una muestra de 80 estas empresas y se contó el número de sucursales que tenı́a cada una. Ası́, se obtuvieron los resultados siguientes: 2 4 3 5 4 4 4 4 5 5 4 5 4 4 4 4 4 5 4 4 4 5 5 5 5 7 4 4 3 6 6 4 4 5 4 5 5 5 4 2 5 2 4 1 3 5 5 3 4 4 7 5 2 6 5 4 6 4 3 4 6 4 6 4 4 5 4 6 4 4 4 4 4 5 4 4 4 6 4 4 Estos datos se organizan en una distribución de frecuencia como sigue: Distribución del número de sucursales Sucursales Empresas Acumulado X f F 1 1 1 2 4 5 3 5 10 4 40 50 5 20 70 6 8 78 7 2 80 Una representación gráfica de esta distribución es la siguiente: 23 Profesor José Flores Delgado Estadı́stica Puede apreciarse que el número de sucursales tiende a concentrarse alrededor de 4; es decir, la tendencia es hacia la centralización, pues existe un valor central que sobresale en frecuencia y, alrededor de este, se distribuyen los demás valores, que van disminuyendo en frecuencia conforme se distancian del valor central. En este caso, es fácil encontrar un valor promedio, es decir, uno que represente a la mayor parte de los datos (el término medio). Una medida de este valor central es, por ejemplo, la moda, 4 sucursales, o la media aritmética: X̄ = n j=1 n xj = 1(1) + 2(4) + ... + 7(2) 346 = = 4,325. 80 80 Las estadı́sticas más usadas para determinar un valor promedio son la media aritmética, la moda y la mediana. La mediana, me , es el valor que ocupa la posición central cuando los datos se ordenan; por lo tanto, este valor tiene la propiedad de que la mitad de los datos son menores o iguales que él. En el último ejemplo, la mediana es 4; es decir, la mitad de las empresas tienen 4 sucursales o menos. El promedio es, entonces, un valor medio, en el sentido de que se parece a muchos de los datos; ası́, puede ser usado para representarlos. 24 Profesor José Flores Delgado Estadı́stica descriptiva Sin duda, el promedio es la estadı́stica más importante, pues da una idea general de los valores de los datos. 1.4.3. Caso de variables cuantitativas continuas En este caso, los datos se agrupan en k intervalos de igual longitud o amplitud, C; luego, se determinan las frecuencias de los intervalos. También se acostumbra definir el representante o marca de clase de cada intervalo, como el punto medio del intervalo. Este servirá para aproximar todos los datos que se encuentren en dicho intervalo. Ejemplo 1.13. En un cajero automático, se midió el tiempo de las transacciones de cada uno de 25 clientes de una muestra aleatoria. Se obtuvo en minutos: 0,19 1,39 2,16 1,23 0,75 2,59 1,40 0,02 0,71 2,41 3,53 1,17 1,16 1,61 3,76 0,96 1,94 1,65 4,75 1,59 0,47 2,01 0,82 0,92 3,07 Obtengamos, primero, las estadı́sticas usadas para determinar un promedio, las cuales se complementarán con los patrones de tendencia que se puedan detectar al organizar los datos en una distribución de frecuencias y, más adelante, veremos otras estadı́sticas que servirán para cuantificar la variabilidad existente entre los datos y, de este modo, verificar la idoneidad de tales promedios. Ası́, la media aritmética resulta: X̄ = (x1 + x2 + . . . +x25 )/25 = 42,26/25 = 1,6904. Entonces, según este resultado, el tiempo promedio para efectuar las transacciones es de 1,6904 min ; sin embargo, esto no es suficiente para garantizar que realmente este valor sea un buen promedio. Estos datos no tienen una moda, pues no existe uno que se repita más. La mediana de estos datos es el número que ocupa la posición central 25 Profesor José Flores Delgado Estadı́stica (en este caso el decimotercero), es decir, 1,4; ası́, tenemos que el 50 % de los clientes demoró 1,4 minutos o menos. Este último valor también puede tomarse como promedio, pero, como ya se mencionó, debe verificarse que realmente cumpla este rol. Ahora pasemos a la detección de los posibles patrones de tendencia. Para este fin, construyamos una distribución de frecuencias con k = 6 intervalos de igual longitud. Los datos extremos son x(1) = 0,02 y x(25) = 4,75. Luego, el rango es R = 4,75 − 0,02 = 4,73. Ası́, la longitud de cada uno de los k = 6 intervalos será C = 4,73/6 = C = 0,78833..., pero, como no sale un valor exacto, es necesario redondear. En este caso, podemos redondear a 2 decimales (pues los datos solo tienen dos decimales, ası́, no vale la pena considerar más). Es claro que el redondeo debe ser por exceso (hacia arriba), pues, de otro modo, el mayor dato quedarı́a fuera. Tomamos C = 0,79. El primer intervalo comenzarı́a en x(1) = 0,02 y terminarı́a en x(1) + C = 0,02 + 0,79 = 0,81; el segundo empezarı́a en 0,81 y terminarı́a en 0,81 + C = 1,60; y ası́ sucesivamente, hasta haber completado los k = 6 intervalos. Con estos intervalos, se obtiene la tabla, todavı́a incompleta, de la forma siguiente: Tiempo [0,02; 0,81] ]0,81; 1,60] ]1,60; 2,39] ]2,39; 3,18] ]3,18; 3,97] ]3,97; 4,76] Marca Frecuencia Ahora, se distribuyen los datos uno por uno. Al final, se habrá completado la tabla de frecuencias siguiente: 26 Profesor José Flores Delgado Tiempo [0,02; 0,81] ]0,81; 1,60] ]1,60; 2,39] ]2,39; 3,18] ]3,18; 3,97] ]3,97; 4,76] Estadı́stica descriptiva Marca 5 9 5 3 2 1 Frecuencia Las otras partes de la tabla son las siguientes: xj = marca de clase del intervalo j (punto medio del intervalo j); Fj = frecuencia acumulada hasta el intervalo j; h = f /n y H = F/n. Con estas completamos la tabla de la distribución de frecuencias Tiempo (minutos) [0,02; 0,81] ]0,81; 1,60] ]1,60; 2,39] ]2,39; 3,18] ]3,18; 3,97] ]3,97; 4,76] Marca X 0,415 1,205 1,995 2,785 3,575 4,365 Distribución de los tiempos necesarios Frecuencia Frecuencia Frecuencia f acumulada relativa 5 5 0,20 9 14 0,36 5 19 0,20 3 22 0,12 2 24 0,08 1 25 0,04 Frecuencia acumulada relativa 0,20 0,56 0,76 0,88 0,96 1,00 Podemos representar la distribución de frecuencias con el histograma o el polı́gono de frecuencias. El histograma es una representación con barras de altura proporcionales a la frecuencia del intervalo que representa. El polı́gono se obtiene uniendo, con lı́neas continuas, cada punto con una abscisa igual a la marca de clase de un intervalo y ordenada igual a la frecuencia de dicho intervalo. Existen otras gráficas, como la gráfica de caja. A continuación, se presentan estos dos gráficos para nuestro ejemplo anterior: 27 Profesor José Flores Delgado Estadı́stica En cualquiera de estas gráficas, apreciamos los patrones de tendencia que muestran los datos. Podemos empezar por mencionar lo evidente: la variación natural de los datos. Es decir, no todos los clientes necesitan el mismo tiempo; los valores correspondientes están entre 0,02 y 4,75 min. También se puede apreciar claramente que los tiempos necesarios para que los clientes efectúen sus transacciones tienden a distribuirse alrededor del intervalo entre 0,81 y 1,6, el cual sobresale en frecuencia y, conforme consideramos tiempos con valores 28 Profesor José Flores Delgado Estadı́stica descriptiva que se alejan de este intervalo, son menos los clientes que necesitan de este tiempo; es decir, se distingue un patrón de centralización, como es razonable. Por lo observado, la media y mediana sı́ cumplen el papel de promedio, y algo mejor la mediana por estar en el intervalo central. Además, existen unos pocos clientes cuyos tiempos necesarios son muy grandes en comparación con los otros; es decir, existe una asimetrı́a o sesgo hacia valores altos. Ahora, representaremos las frecuencias acumuladas mediante la ojiva de frecuencias, usando los datos de nuestro ejemplo anterior: Esta gráfica es de utilidad cuando, por ejemplo, queremos determinar ubicaciones relativas en la distribución, como lo ilustra el ejemplo siguiente. Ejemplo 1.14. Al banco le interesa saber, entre otros detalles, si necesita dar más recomendaciones en cuanto al uso del cajero para bienestar de todos los clientes. Ası́, no solo le interesa que los tiempos necesarios tiendan a centralizarse alrededor de un valor razonable, sino también que no exista un sesgo indicativo de posible malestar en 29 Profesor José Flores Delgado Estadı́stica los clientes que podrı́an estar esperando su turno por mucho tiempo. En ese sentido, el banco considera un grupo de clientes ‘crı́tico’. Este lo integran aquellos que necesitan mayores tiempos y que constituyen la cuarta parte de los clientes. ¿A partir de qué tiempo un cliente de la muestra ya es considerado dentro del grupo referido? Ya hemos hablado sobre el patrón de tendencia a la centralización. Ahora, para obtener el valor del tiempo a partir del cual un cliente estará dentro del grupo ‘crı́tico’, basta observar en la ojiva anterior, el porcentaje acumulado de 75 %, pues, si este grupo de mayores tiempos constituyen una cuarta parte o 25 %, entonces, las otras tres cuartas partes o 75 % (y cuyos tiempos correspondientes son inferiores) están fuera del grupo. Ası́, es claro que el valor buscado, x, debe ser tal que le corresponda un porcentaje acumulado igual a 75 %, es decir, H(x) = 0,75. De aquı́, la solución es simple: basta ordenar los datos para descubrir dicho valor, es decir, 2,16 minutos. Supongamos ahora que se deseara resolver el problema, pero para la población completa de clientes. Evidentemente, la solución es compleja, casi inviable; por ello, podemos recurrir a una solución estadı́stica: hacer una inferencia a partir de los datos de la muestra disponible. Entonces, el valor obtenido en la muestra es solo una estimación; es decir, podemos decir, que 2,16 es el tiempo estimado. Sin embargo, para que esto sea realmente una inferencia estadı́stica, habrı́a que cuantificar el error de estimación y el correspondiente nivel de confianza en esta; ello será visto posteriormente. El problema anterior también puede resolverse desde un punto de vista probabilı́stico. Para ello, basta obtener un modelo que describa las frecuencias relativas de los tiempos necesarios —más adelante nos 30 Profesor José Flores Delgado Estadı́stica descriptiva ocuparemos del estudio de modelos de esta naturaleza—. Podemos considerar uno muy simple a partir de los datos de la muestra, es decir, una función H, cuya gráfica corresponde a la ojiva dada anteriormente. De allı́, observamos (o incluso simplemente de la tabla de la distribución) que el valor buscado, x, está en el tercer intervalo, es decir, x ∈]1,60; 2,39]; luego, concentrando nuestra atención en este intervalo, obtenemos: x = 2,3505. Lo anterior se ilustra a continuación: Determinación de un percentil a partir de la ojiva Con esta función, podemos averiguar, bajo un enfoque probabilı́stico, todo lo relacionado con esta variable (el tiempo necesario para realizar las transacciones en el cajero), como por ejemplo el tiempo promedio necesario. De esto nos ocuparemos en el capı́tulo de probabilidad. El ejemplo anterior también motiva la definición siguiente. 31 Profesor José Flores Delgado Estadı́stica Definición 1.7. Si K es un número entre 0 y 100, el percentil K es el valor de los datos que tiene la propiedad de que el K % de las observaciones es menor o igual que él. Podemos denotarlo por PK . Ası́, H(PK ) = k / 100 o, equivalentemente, F (PK ) = nk / 100, siendo n el número total de observaciones. Observación 1.4. Nótese que el percentil es una medida de posición o ubicación relativa dentro del grupo de observaciones. Un ejemplo muy familiar para todos nosotros lo encontramos en la universidad cuando se habla del “tercio superior” o, a veces, hasta del “quinto superior”; el primer grupo corresponde a los alumnos con un promedio ponderado de notas de, por lo menos, igual al P66,66 ; y el segundo grupo está integrado por los alumnos cuyo promedio ponderado de notas sea, por lo menos, igual al P80 . Estas medidas son de suma utilidad cuando queremos comparar datos medidos en diferentes unidades. Ejemplo 1.15. Cuando usted, como es de esperarse, termine satisfactoriamente sus estudios o haya completado buena parte de ellos, querrá empezar a trabajar o, tal vez, querrá salir al extranjero para realizar un posgrado; entonces, tendrá que preparar su curriculum vitae; además, probablemente tenga que rendir un examen de suficiencia en el idioma inglés y también le tendrán que elaborar algunas cartas de recomendación. Para lo del inglés, lo que importará será su ubicación relativa o percentil dentro de las notas de dicho examen, mientras que, para la carta de recomendación, será de suma importancia su percentil dentro del grupo de notas de los alumnos de la universidad. Definición 1.8. Gráfica de caja: es una gráfica que se obtiene con los percentiles 25, 50 y 75, junto con el menor y mayor valor de los datos. Se obtiene ası́ un buen resumen de los datos. 32 Profesor José Flores Delgado Estadı́stica descriptiva A continuación, hagamos la gráfica de caja que corresponde a los datos del ejemplo 1.13, correspondientes a los tiempos necesarios para realizar una transacción en un cajero automático. Las estadı́sticas necesarias las presentamos en la tabla siguiente: Tiempo necesario (min) Mı́nimo 0,02 Máximo 4,75 Percentil 25 0,92 Percentil 75 2,16 Percentil 50 1,4 En esta gráfica, se puede apreciar que los tiempos necesarios para realizar las transacciones varı́an entre 0,02 min y 4,75 min, mientras que el 50 % de las tiempos centrales está entre 0,92 min y 2,16 min. Esto da un rango medio de 2,48 min. Un promedio para estos tiempos puede ser 1,4 min. Observación 1.5. Una vez más, destacamos que la distribución de los datos tiene por finalidad primordial detectar patrones de tendencia que muestren estos datos y, en particular, proponer, a partir de estos patrones, modelos para describir no solo la muestra de datos disponibles, sino a la población entera de la que provienen estos. Las estadı́sticas (resúmenes) de una muestra de datos disponible (media, moda, mediana, etcétera) se obtienen directamente con los propios datos sin necesidad de la distribución de frecuencias. 33 Profesor José Flores Delgado Estadı́stica 1.5. Propiedades y uso de los promedios La importancia del promedio se debe a que, muchas veces, necesitamos saber cómo son los datos en general y esto resulta más importante que las particularidades de cada uno. A continuación, damos algunas observaciones y propiedades de los promedios ya definidos. Antes, debemos incidir, una vez más, en que la media aritmética no es la única forma de obtener un promedio. Es la más conocida, pues generalmente es la mejor, aunque no siempre es ası́. 1. La moda se puede calcular y tendrá significado en términos de la variable medida, incluso con escalas nominales. Para la mediana esto sucede a partir de escalas ordinales. Para la media con escalas de razón y hasta con las de intervalo. 2. La moda y la mediana presentan dificultades en su cálculo. Puede ocurrir que ninguno de los datos sobresalga en frecuencia; en este caso, no existe la moda o, a veces, se admite la existencia de dos o tres modas. Si el número de datos es par, existirı́an dos de ellos que ocuparı́an las posiciones centrales al ser ordenados. Si estos dos son iguales, no hay ningún problema, pero, si no lo son, dos reglas son muy usadas: la primera consiste en tomar el de menor valor, la cual es muy útil incluso con escalas ordinales simplemente; la segunda, válida para escalas de intervalo o de razón, consiste en tomar la media aritmética de los dos valores centrales. 3. De estos tres promedios, solo la media es proporcional a la suma n total de las observaciones. Y se tiene que: xj = nX̄. Ası́, solo j=1 la media deberá usarse para este fin. 34 Profesor José Flores Delgado Estadı́stica descriptiva 4. En el caso de variables cuantitativas, la media aritmética es el promedio más usado. Esto se debe a que tiene mejores propiedades y es más adecuada para la inferencia estadı́stica, pues produce generalmente mejores estimaciones. Sin embargo, como medida del promedio, la principal desventaja de la media es que se ve afectada por la presencia de asimetrı́a o valores extremos no compensados, desplazándose en esa dirección. A continuación, se ilustra esto gráficamente para el caso de una distribución correspondiente a una variable cuantitativa continua con tendencia a la centralización: El ejemplo 1.13 ilustra la situación de asimetrı́a hacia la derecha, razón por cual la media resulta un poco mayor que la mediana. 5. La media aritmética es el único punto de equilibrio: compensa los valores que se encuentran a su izquierda con los de su derecha. Se cumple que: n j=1 (xj − X̄) = 0 y si n j=1 (xj − x) = 0, entonces, x = X̄. 6. Considerando la distancia euclidiana, la media aritmética es el punto que más cerca está de todos los datos en general; es decir, 35 Profesor José Flores Delgado Estadı́stica para cualquier número real x se cumple que: n n (xj − X̄)2 ≤ (xj − x)2 . j=1 j=1 La propiedad anterior también se enuncia diciendo que la media aritmética es el valor que tiene la propiedad de minimizar la suma de los cuadrados de las desviaciones de los datos respecto a él. 7. Considerando la distancia valor absoluto, la mediana es el punto que más cerca está de todos los datos en general, es decir, para cualquier número real x se cumple que: n n | xj − M e | ≤ | xj − x |. j=1 j=1 La propiedad anterior también se enuncia diciendo que la mediana es el valor que tiene la propiedad de minimizar la suma de los valores absolutos de las desviaciones de los datos respecto a él. 8. Para cualesquiera a y b, que se fijen, si hacemos que cada dato xj , se transforme en: yj = a + bxj , entonces, la media aritmética resultante de estos datos, ası́ transformados, también satisface dicha relación, es decir, Ȳ = a + bX̄. Esta propiedad nos dice cómo varı́a la media aritmética ante cambios en la unidad de medida o del origen de la escala. Ahora veamos las principales medidas de dispersión, la tendencia natural de los datos a diferenciarse entre ellos. 36 Profesor José Flores Delgado Estadı́stica descriptiva 1.6. Medidas de dispersión La tendencia a la dispersión es la tendencia más natural en los datos; sin ella, no existirı́an problemas que resolver y significa la tendencia que tienen los datos a diferenciarse entre ellos, a ser menos homogéneos y más heterogéneos, a estar más dispersos. El Rango es la diferencia entre los dos valores más extremos, es decir, entre el mayor y el menor de los datos. Lo podemos denotar por R. Ası́, si como ya fue indicado antes, x(1) es el menor valor y x(n) es el mayor, se tiene que: R = x(n) − x(1) Claramente, es una medida muy imprecisa, como se ilustra en el ejemplo siguiente. Ejemplo 1.16. Dadas las series de datos siguientes: Serie 1 : Serie 2 : 15 195 20 200 20 200 Datos 20 25 200 200 200 200 200 205 R 10 10 ¿En cuál de las series dirı́a usted que los datos están menos dispersos? La respuesta es en la segunda, pues puede apreciarse en ella que hay mayor cantidad de datos parecidos a su promedio. El rango es una medida muy imprecisa. Solo cuando el rango sea pequeño, tendremos razones para pensar que no haya mucha dispersión. El rango intercuartil Es la diferencia existente entre los percentiles 75 y 25. Lo podemos denotar por RI. Ası́: RI = P75 − P25 . 37 Profesor José Flores Delgado Estadı́stica Esta medida refina al rango, pues ya no considera los dos valores más extremos, sino a los cuartos superior e inferior; es decir, descarta los datos que queden fuera del intervalo formado por estos percentiles y se queda sólo con el 50 % restante, o sea, el 50 % central. La desviación estándar Se define como una ‘distancia’ promedio de los datos respecto a su media. Si la denotamos por S, tenemos que: n (xj − X̄)2 j=1 S= . n En esta fórmula, la raı́z cuadrada permite que esta medida se exprese en las mismas unidades de los datos. Si no se dividiera por n, se tendrı́a exactamente la distancia euclidiana entre los puntos de Rn : (x1 , . . . , xn ) y (X̄, . . . , X̄). Entonces, esta medida es una distancia promedio de los datos a su media. Cuanto más grande sea este valor, más heterogéneos serán los datos y, cuanto más pequeño sea, más homogéneos lo serán. Esta estadı́stica es la medida de dispersión más usada por razones similares a las que hacen de la media la medida de resumen o promedio más usada, y, naturalmente, también presenta dificultades cuando existe asimetrı́a. La varianza es el cuadrado de la desviación estándar; por eso, se le denota por S 2 . El coeficiente de variación Se define como la proporción que representa el valor de la desviación estándar respecto al de la media. S Se denota por CV. Ası́: CV = . X̄ 38 Profesor José Flores Delgado Estadı́stica descriptiva Al carecer de unidades, se le suele usar para comparar la dispersión existente entre dos grupos de datos cuyas unidades no sean comparables o cuyos promedios estén muy distanciados por corresponder a distintas poblaciones. Ejemplo 1.17. Veamos lo que ocurre con los datos del ejemplo 1.12. Aprovechemos para obtener las principales estadı́sticas de estos datos con ayuda del Excel, el cual tiene los procedimientos estadı́sticos en la opción del menú de Herramientas llamada “Análisis de datos”(si esta opción no estuviera activada se puede hacerlo en los Complementos del menú de Herramientas). En la opción Análisis de datos, se pide el procedimiento Estadı́stica descriptiva. Ası́, la secuencia anterior es: Ası́, obtenemos, entre otras, las estadı́sticas siguientes: Número de sucursales Media 4,325 Error tı́pico 0,1204 Mediana 4 Moda 4 Desviación estándar 1,077 Varianza de la muestra 1,1589 Curtosis 1,1995 Coeficiente de asimetrı́a -0,1874 Rango 6 Mı́nimo 1 Máximo 7 Suma 346 Cuenta 80 Mayor (20) 5 Menor (20) 4 Nivel de confianza (95 %) 0,2396 39 Profesor José Flores Delgado Estadı́stica En este caso al procedimiento Estadı́stica Descriptiva se le solicitó el resumen de estadı́sticas y, para que este incluya los percentiles 75 y 25, se indicó el k-ésimo mayor y el k-ésimo menor correspondientes. En este caso, como son 80 datos, estos corresponden al vigésimo mayor y vigésimo menor, respectivamente (la cuarta parte de 80 es 20). Como ya hemos visto, los datos están alrededor de 4. Vemos que el rango es 6, mientras que el rango intercuartil es P75 − P25 = 5 − 4 = 1. Este último indica que no es muy grande la dispersión en el número de sucursales, al igual que la desviación estándar que es 1,077. Si queremos precisar mejor cuán grandes son estas medidas de dispersión, hay que compararlas con la magnitud promedio de los datos; ası́, apreciamos que la dispersión es relativamente baja. Entonces, por lo visto hasta ahora sobre estos datos, concluimos que el número promedio de sucursales es 4 y es relativamente pequeña la variabilidad. Ejemplo 1.18. En el ejemplo 1.13 la media, mediana, desviación estándar y rango intercuartil son respectivamente 1,6904; 1,4; 1,1289 y 1,24. Ası́, con los patrones de tendencia observados y las estadı́sticas anteriores, concluimos que, en promedio, los clientes tardan 1,4 minutos y la variabilidad promedio es de 1,2 minutos. 1.6.1. Propiedades de la desviación estándar 1. Se verifica la fórmula siguiente, llamada fórmula de cálculo para la varianza: S2 = n j=1 x2j − nX̄ 2 n 40 = n j=1 x2j n − X̄ 2 . Profesor José Flores Delgado Estadı́stica descriptiva 2. Para cualesquiera a y b que se fijen, si hacemos que cada dato xj se transforme en: yj = a + bxj , entonces, la varianza resultante de estos datos ası́ transformados satisface: 2 SY2 = b2 SX Y, si b es positivo: SY = bSX . 3. Desigualdad de Chebychev Para cualquier número K > 0, la proporción de datos que caen dentro del intervalo de extremos X̄ − KS y X̄ + KS, es, por lo menos, igual a 1 − 1 / K 2 . Esta propiedad permite establecer que, entre X̄ − 3S y X̄ + 3S, se encuentran por lo menos 8/9 de los datos, es decir, el 88,89 % (aproximadamente). De aquı́ que, mientras más disten los datos respecto a su media, menos frecuentes serán. Lo discutido al final también motiva, en parte, la definición siguiente, relacionada con la ubicación relativa de un dato respecto a la media de su grupo. 1.7. Datos tipificados o estandarizados Si, en un grupo de datos, la media es X̄ y la desviación estándar es SX , entonces, el valor tipificado de xj se denota por zj y se define como: xj − X̄ zj = . SX Ası́, el dato tipificado no es más que su distancia respecto de la media del grupo, pero expresada en términos de la desviación estándar. Especı́ficamente, el signo del dato, ası́ tipificado, indica si el dato 41 Profesor José Flores Delgado Estadı́stica está por debajo o por encima de la media del grupo. La magnitud, en valor absoluto, indica cuán alejado está en términos del alejamiento promedio de los datos (la desviación estándar). También es claro que, al pasar los datos a esta escala, es decir aplicando tal fórmula de transformación, los datos ası́ obtenidos preservan el orden original. Además de lo mencionado antes, lo más importante es que al transformar ası́ los datos, sin que importe cuál sea la media y desviación estándar de los datos originales, los valores resultantes tienen una media igual a cero y una desviación estándar igual a 1, de allı́ el nombre de estandarizados. Esto último y el hecho de que el orden se preserve al transformar ası́ los datos hacen que esta transformación sea de utilidad, por ejemplo, cuando se quiere comparar dos datos provenientes de grupos con medias muy diferentes, o si corresponden a mediciones efectuadas en distintas escalas. Observación 1.6. La forma anterior no es la única utilizada para estandarizar. Existen otras, como la puntuación T , para la cual la media es 50 y la desviación estándar 10. No es difı́cil verificar que la fórmula para este caso es la siguiente: xj − X̄ T = 50 + 10. SX Esta es la fórmula que se utiliza para estandarizar las notas en nuestra universidad, antes de obtener el coeficiente de rendimiento estandarizado (CRAEST). La deducción de esta fórmula es la siguiente: Si X es la variable original, deseamos efectuar una transformación simple de ella: Y = a + bX, con b > 0 (para conservar el orden 42 Profesor José Flores Delgado Estadı́stica descriptiva original de los valores de X), de modo que la media y desviación estándar resultantes sean 50 y 10, respectivamente. Entonces, por la propiedad 8 de la media y la propiedad 2 de la desviación estándar, a y b deben satisfacer las ecuaciones siguientes: a + b X̄ = 50 b SX = 10. entonces, b = 10 10 y a = 50 − X̄. SX SX 10 10 Ası́, Y = 50 − X = 50 + X̄ + SX SX xj − X̄ SX 10. Resulta claro que, al efectuar esta transformación, el orden de mérito de los alumnos en un determinado curso, establecido por la nota final (x), se mantiene al hacerlo con las notas estandarizadas (T ), pero con la diferencia de que ahora la media es 50 y la desviación estándar 10, lo que facilita la comparación del rendimiento de dos alumnos de diferentes facultades. También se puede notar que, si el promedio ponderado de un alumno está por debajo de la media de su facultad (esto es x < X̄), entonces su CRAEST será menor que 50, pero, si su promedio está por arriba de la media de su facultad (esto es x > X̄), entonces, su CRAEST será mayor que 50. Observación 1.7. En general, si se quiere una media Ȳ = ȳ y una desviación estándar SY = sY , la fórmula de transformación es: Y = ȳ + xj − X̄ SX 43 sy Profesor José Flores Delgado Estadı́stica 1.8. Diagrama de hojas y tallos Este diagrama es una alternativa a la distribución de frecuencias para la tarea de analizar los datos. En esta gráfica, cada dato se divide en dos partes: su tallo y sus hojas. Por ejemplo, a continuación, tenemos 21 datos: 72 71 65 54 78 85 63 61 51 77 85 83 63 55 57 73 73 68 73 75 77 Primero ordenamos los datos de menor a mayor: 51 54 55 57 61 63 63 65 68 71 72 73 73 73 75 77 77 78 83 85 85 Observamos que el menor dato es 51 y el mayor 85. Para cada dato, podemos tomar la cifra de las decenas como tallo; entonces, la otra será la hoja. Ası́, por ejemplo, para el dato 51: su tallo es 5, su hoja 1. Entonces, colocamos los tallos en una columna, como sigue: 5 6 7 8 Luego, escribimos cada hoja junto a su tallo: 5 6 7 8 1 1 1 3 4 3 2 5 5 7 3 5 8 3 3 5 7 7 8 5 44 Profesor José Flores Delgado Estadı́stica descriptiva 1.9. Ejercicios resueltos Ejercicio 1.1. Muestre dos grupos de datos para verificar que el rango es una medida de dispersión muy imprecisa. Solución: Dadas las series de datos siguientes: Serie 1: 195 200 200 200 205 Serie 2: 15 20 20 20 20 20 20 20 20 20 25 En ambas series, el rango es 10, pero, en la segunda, hay mayor cantidad de datos parecidos entre sı́. Ejercicio 1.2. Muestre una serie de datos para los que no exista un promedio o término medio. Solución: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23. No existe una estadı́stica que sirva de término medio; es decir, los datos no se parecen a un valor en particular. Ejercicio 1.3. En una compañı́a, la media aritmética de los sueldos es de S/. 2 500. Se proponen dos alternativas de aumento. En la primera, se propone incrementar a todos los empleados S/. 600, mientras que, en la segunda, un aumento del 5 % más una bonificación de S/. 200. ¿Cuál de las dos alternativas le representará más gasto a la compañı́a? 45 Profesor José Flores Delgado Estadı́stica Solución: Para responder la pregunta, basta comparar las medias bajo cada alternativa, pues la media es proporcional a la suma total. Veamos, entonces, cómo cambia la media con cada alternativa: Según la primera alternativa, cada sueldo xj se transforma en yj = 600 + xj . Ası́, por la propiedad 8 de la media, resulta una media Ȳ = 600 + X̄ = 600 + 2500 = S/. 3 100. Para la segunda alternativa, cada sueldo xj se transforma en tj = xj + 0,05 xj + 200 = 200 + 1,05 xj . Nuevamente, por la propiedad anterior, resulta que la media, bajo esta alternativa, es T̄ = 200 + 1,05X̄ = 200 + (1,05)2500 = S/. 2 825. Ası́, la primera alternativa le representará más gasto a la compañı́a. Ejercicio 1.4. A fin de tomar diferentes decisiones sobre el tiempo que permanece inactivo un sistema de información durante un dı́a, se le solicita a usted el valor promedio y el tiempo total de inactividad en un perı́odo de 60 dı́as. Suponga que solo se tiene la información siguiente sobre los tiempos registrados para cada uno de los dı́as de este perı́odo: Mediana = 6 000 s; Media = 8 500 s. Proporcione lo solicitado. Si fuera el caso, mencione la información que se requiera para una mejor respuesta. Solución: Sean x1 . . . x60 los tiempos de inactividad correspondientes a los 60 dı́as de este perı́odo. Entonces, el tiempo total de inactividad 60 es xj = 60 X̄ = 60 × 8 500 = 510 000. j=1 46 Profesor José Flores Delgado Estadı́stica descriptiva Pero, para dar una respuesta apropiada para el tiempo promedio de inactividad, se requiere mayor información. Podrı́amos optar por la mediana, pensando que, si este valor difiere de la media, probablemente se deba a que, en algunos dı́as, el tiempo de inactividad es muy grande; pero, incluso, podrı́a ser que no se pueda encontrar un buen promedio o término medio para los tiempos registrados. Ejercicio 1.5. A fin de mejorar el rendimiento de los alumnos en un curso de Estadı́stica, los alumnos fueron separados en dos grupos. Al primero le fue dado un curso con herramientas computacionales modernas; al segundo, un curso tradicional sin las herramientas computacionales. Al cabo del curso, ambos grupos fueron evaluados con una misma prueba. Las notas correspondientes fueron procesadas con el Excel y se obtuvieron las distribuciones de frecuencias siguientes: Con herramientas comp. Notas Alumnos 9 1 10 4 11 2 12 3 13 10 14 10 15 7 16 8 17 4 18 1 Sin herramientas comp. Notas Alumnos 9 4 10 7 11 12 12 9 13 10 14 3 15 3 16 2 a) Obtenga e interprete las estadı́sticas descriptivas que resumen los datos. 47 Profesor José Flores Delgado Estadı́stica b) Represente cada distribución con su respectiva gráfica de caja, de modo que se muestre la conclusión al problema formulado. Comente al respecto. Solución: a) Estadı́sticas importantes: Estadı́stica Cuenta Media Mediana Moda Desviación estándar Mı́nimo Máximo Rango Percentil 75 Percentil 25 Rango medio Con 50 13,92 14 13 y 14 2,1174 9 18 9 16 13 3 Sin 50 11,9 12 11 1,7871 9 16 7 13 11 2 Fueron evaluados 50 alumnos con cada prueba. La nota promedio (media) fue 13,92, cuando se usaron herramientas computacionales, y 11,9 cuando no se usaron dichas herramientas. El 50 % de los alumnos tuvo una nota menor o igual que 14 cuando se usaron herramientas computacionales, y menor o igual que 12 cuando no se usaron. La mayorı́a de los alumnos tuvo una igual a 14 cuando se usaron herramientas computacionales y 11 cuando no se usaron dichas herramientas. 48 Profesor José Flores Delgado Estadı́stica descriptiva La diferencia promedio de las notas fue 2,1173 cuando se usaron herramientas computacionales y 1,7871 cuando no se usaron dichas herramientas. La mı́nima nota fue 9 independientemente del uso de herramientas computacionales, pero, cuando se usaron dichas herramientas, la máxima nota fue 18, dos puntos más que cuando no fueron usadas. Ello determina un rango de variación de las notas de 9 en el primer caso y de 7 en el segundo. El 75 % de los alumnos tuvo una nota menor o igual que 16 cuando se usaron herramientas computacionales, y menor o igual que 13 cuando no se usaron. El 25 % de los alumnos tuvo una nota menor o igual que 13 cuando se usaron herramientas computacionales, y menor o igual que 11 cuando no se usaron. El rango de variación medio de las notas fue 3 puntos cuando se usaron herramientas computacionales y 2 cuando no se usaron dichas herramientas. b) Gráficas de cajas: 49 Profesor José Flores Delgado Estadı́stica Se concluye que, cuando se usaron las herramientas computacionales, el promedio de las notas aumentó (aproximadamente dos puntos); sin embargo, las notas resultaron algo más heterogéneas, pues la variabilidad aumentó (aproximadamente un punto). 50 Profesor José Flores Delgado Estadı́stica descriptiva 1.10. Ejercicios propuestos Ejercicio 1.1. Redacte la conclusión dada en cada una de las partes siguientes, pero según el contexto respectivo: a) En un estudio sobre cambios en la conducta de drogadictos de cierto grupo de personas, fue registrada la edad (en años) en la cual dichas personas iniciaron el consumo de drogas. Se concluyó que el 75 % de los datos registrados era mayor que 15. b) En un estudio sobre cierto sector laboral, se registró el ingreso mensual (en soles) de cada trabajador. Se concluyó que solo el 10 % de los datos registrados era superior a 3 500. c) En un estudio acerca de las caracterı́sticas de ciertas cerámicas precolombinas, fue registrado (en centı́metros) el diámetro central de estas. Se concluyó que el 30 % de los datos registrados estaba entre 20 cm y 25 cm. Ejercicio 1.2. Usando una misma escala, cierta caracterı́stica ha sido medida sobre tres objetos, A, B y C, y se obtuvieron los valores 0; 40 y 20, respectivamente. a) Con esta información, no se puede asegurar que la escala usada sea ordinal. Justifique con un ejemplo. b) Con esta información, no se puede descartar que la escala usada sea ordinal. Justifique con un ejemplo. 51 Profesor José Flores Delgado Estadı́stica c) Con una segunda escala, también del mismo tipo de la primera, se midió la misma caracterı́stica sobre estos objetos y se obtuvieron las mediciones siguientes: 10, 90 y 50, respectivamente. ¿Cuál puede ser el nivel de medición empleado? d) Suponga que esta caracterı́stica sea cuantitativa y que la escala usada sea de razón. Dé usted una variable que pueda servir como ejemplo y brinde la información principal que proporcionarı́an dichos valores acerca de ella. Ejercicio 1.3. Fue registrada la tolerancia de tres personas, A, B y C, empleando una escala nominal, y se obtuvo los resultados siguientes: A B C 3 5 5 ¿Se puede deducir si una de estas personas es más tolerante que las otras dos? Ejercicio 1.4. A continuación, se presentan tres series de datos y tres afirmaciones: Serie 1: 1, 2, 4, 6, 6, 6, 6, 8, 10, 11. Serie 2: 39, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 40, 41, 70. Serie 3: 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9, 9. Afirmación 1: El producto de la mediana y el número de datos no proporciona una buena idea de la suma total de los datos. 52 Profesor José Flores Delgado Estadı́stica descriptiva Afirmación 2: No siempre es fácil determinar un valor promedio. Afirmación 3: El rango es una medida de dispersión muy imprecisa. Identifique cada afirmación con la serie de datos que mejor refleje lo sostenido en ella. Para la elección de cada serie, deberá indicar la razón por la que descarta las otras. Ejercicio 1.5. En una clı́nica, cada una de dos terapias nuevas (A y B) para la rehabilitación de pacientes con depresión se aplicó en uno de dos grupos de igual número de pacientes (con caracterı́sticas similares) que adolecı́an de este problema, y se obtuvieron las estadı́sticas siguientes sobre las horas de terapia aplicadas hasta la recuperación de los pacientes: Horas de aplicación Estadı́stica Media Mediana Moda Desviación estándar Percentil 75 Percentil 25 Terapia A 66,5 66,5 66,5 15,5 86,0 47,0 Terapia B 77,0 63,0 63,0 16,5 83,0 50,0 a) Si los histogramas de cada muestra de datos mostraron una tendencia a la centralización, determine la terapia que, en general, necesitó de un menor tiempo de aplicación por paciente. 53 Profesor José Flores Delgado Estadı́stica b) Si el gasto para la clı́nica, por hora de aplicación, fue el mismo para cada terapia, ¿la aplicación de cuál de las terapias significó un menor gasto total para la clı́nica? c) Si, como criterio para decidir cuál de las terapias se debı́a adoptar, se impuso la condición de que, a lo más, el 25 % de los pacientes requieran más de 85 horas, ¿cuál de estas dos terapias, si existe una, decidirı́a adoptar usted? Ejercicio 1.6. A continuación, se dan cuatro afirmaciones. Estudie la veracidad de cada una de ellas. Además, si una afirmación es verdadera, proporcione una serie de datos que refleje lo que esta sostiene. Si considera que la afirmación es falsa, muestre una serie que exhiba lo contrario. i) Con el ‘promedio’ de una serie de 10 datos, se puede tener cierta idea de la suma total de los datos, pero no necesariamente la suma exacta. ii) Para obtener un percentil de una serie de datos, obtenidos de una variable cuantitativa continua, es necesario construir, previamente, la distribución de frecuencias y usar la ojiva de frecuencias acumuladas. iii) El rango es una medida de dispersión muy imprecisa. iv) Si una serie de datos tiene una media distinta de la mediana, entonces, necesariamente existe un patrón de tendencia a la centralización con sesgo. 54 Profesor José Flores Delgado Estadı́stica descriptiva Ejercicio 1.7. A fin de estudiar la eficiencia de cierto programa usado para la ubicación de archivos, se registró el tiempo que demoró el programa para localizar la posición de memoria de cincuenta archivos de caracterı́sticas similares. Se obtuvo los resultados siguientes: [ ] ] ] ] ] ] ] Tiempo (s) 0,000; 0,125 0,125; 0,250 0,250; 0,375 0,375; 0,500 0,500; 0,625 0,625; 0,750 0,750; 0,875 0,875; 1,000 ] ] ] ] ] ] ] ] Frecuencia relativa 0,04 0,12 0,16 0,18 0,18 0,14 0,12 0,06 a) Una hipótesis sostiene que el tiempo necesario para localizar la posición de memoria está, para la mayorı́a de los archivos, alrededor de medio segundo y, conforme el tiempo se aleje de este valor, se encontrarán menos archivos que requerirán de tal tiempo. ¿Considera que los datos evidencian la validez de esta hipótesis? Comente y justifique con el apoyo de una gráfica conveniente. x2 x3 b) La función G(x) = 6( − ), 0 ≤ x ≤ 1 es una de 2 3 las funciones usadas para modelar (aproximar) la frecuencia relativa acumulada hasta x, cuando 0 ≤ x ≤ 1. Según esta función, ¿cuál serı́a el valor de la frecuencia que corresponde al cuarto intervalo de la distribución de estos datos? 55 Profesor José Flores Delgado Estadı́stica Ejercicio 1.8. Se hizo un muestreo aleatorio de 66 comunidades del paı́s para averiguar el porcentaje de carencias básicas de las comunidades. Los datos se muestran a continuación: 87,4 75,2 82,1 82,3 74,8 77,2 75,5 76,6 78 71,9 74,4 75,4 70,6 86,4 83,6 77,1 74,7 67,5 71 65,4 70,9 77,2 78,3 80,8 70,9 74,8 74,5 71,8 83,7 73 75,4 84,5 77 75,2 76,9 71,7 76 76,8 78,5 75,1 81,7 67,7 66,5 76,4 70,5 70,8 78,6 66,6 72,7 70,4 80,8 79,5 81,8 68,2 75,2 71,7 83,8 71,3 80,9 79,6 71,6 75,9 75,3 79 75,9 72,4 A fin de realizar una descripción estadı́stica de estos datos, primero, se obtuvieron las principales estadı́sticas: Porcentaje de Carencias Media 75,68 Mediana 75,40 Moda 75,20 Desviación estándar 4,97 Rango 22,00 Mı́nimo 65,40 Máximo 87,40 Suma 4994,90 Cuenta 66,00 Mayor (17) 78,60 Menor(17) 71,70 Nivel de confianza (95 %) 1,22 56 Profesor José Flores Delgado Estadı́stica descriptiva A continuación, con el fin de detectar los posibles patrones de tendencia, se construyó una distribución de frecuencias. Para esto, primero, se usó la regla empı́rica “2 a la k,” la cual establece que el número de intervalos es el menor entero, k, con la propiedad de que 2 elevado a la k sea mayor o igual que el número de datos, por lo que se consideraron 7 intervalos de igual longitud. Luego, se obtuvo la tabla siguiente: Porcentaje Frecuencia relativa Frecuencia acumulada 68,55 0,09 0,09 71,70 0,17 0,26 74,85 0,15 0,41 78,00 0,30 0,71 81,15 0,14 0,85 84,30 0,11 0,95 87,45 0,05 1,00 En la primera columna de esta tabla, se encuentran los lı́mites derechos de los intervalos y estos son cerrados. a) Obtenga las conclusiones. Debe incluir: i) Interpretación de las estadı́sticas que arroja el Excel y otras que considere necesarias. ii) Estudio de los posibles patrones de tendencia que muestran estos datos, con ilustración gráfica, identificación e interpretación de estos en el contexto dado. iii) Conclusiones que integren los puntos anteriores. 57 Profesor José Flores Delgado Estadı́stica b) En el estudio, se consideró que una comunidad estaba en extrema pobreza si el porcentaje de carencias era superior al 70 %. i) ¿Qué porcentaje de comunidades en extrema pobreza hay en esta muestra? ii) Como es sabido, la ojiva muestra la tendencia mostrada por las frecuencias acumuladas de esta muestra de datos. Considere la ojiva como la gráfica de una función modelo para describir, bajo un enfoque probabilı́stico, el porcentaje de carencias en las comunidades del paı́s. Según este modelo, ¿cuál serı́a el porcentaje de comunidades en el paı́s que se encuentra en extrema pobreza? c) Determine en cuánto deberı́a disminuir el porcentaje de carencias de cada comunidad para que la media de dicho porcentaje sea solo del 55 %. Si se lograra esto, ¿qué ocurrirı́a con la desviación estándar de dicho porcentaje? Ejercicio 1.9. Si x1 , . . . , xn es una serie de datos con media X̄ y desviación estándar SX , determine la media y desviación estándar de la serie y1 , . . . , yn , en cada uno de los casos siguientes: a) yj = 4 + 5(xj − X̄), j = 1, . . . , n. b) yj = n(xj − X̄), j = 1, . . . , n. c) yj = (xj − X̄) + xn , j = 1, . . . , n. d) yj = 10xj − X̄, j = 1, . . . , n. 58 Profesor José Flores Delgado Estadı́stica descriptiva Ejercicio 1.10. Para comparar la dureza del agua en dos ciudades, A y B, se tomaron muestras de agua y se midió el contenido de calcio. Los resultados, en miligramos por litro de agua, fueron los siguientes: A 250 291 250 291 258 292 270 292 270 270 271 271 272 284 B 222 277 244 277 250 251 255 261 264 264 265 266 a) Haga las gráficas de caja, de manera que facilite la comparación del contenido de calcio entre las muestras de agua de las ciudades. Obtenga las conclusiones. b) El tercer valor de la muestra de agua en la ciudad A fue 258, el correspondiente a la B fue 250. ¿Cuál de estos valores representa mayor contenido de calcio en su grupo? Ejercicio 1.11. En un banco, se quiere estudiar la implementación de una capacitación a fin de mejorar la atención que brindan los empleados. Con este objetivo, se tomaron dos muestras de 50 empleados y se capacitó a los de una de estas. Luego, se esperó a que todos los empleados hayan atendido 10 clientes y se registró, para cada empleado, el número de clientes que mostraron su insatisfacción por la atención recibida. Los datos fueron procesados con el Excel y se obtuvieron, entre otros, los resultados siguientes: 59 Profesor José Flores Delgado Estadı́stica Sin la Capacitación Insatisfechos Empleados 1 1 2 4 3 2 4 3 5 10 6 10 7 7 8 8 9 4 10 1 Con la Capacitación Insatisfechos Empleados 1 4 2 7 3 12 4 9 5 10 6 3 7 3 8 2 Obtenga conclusiones a partir de la descripción de estos datos. Incluya estadı́sticas importantes y represente cada distribución mediante una gráfica de caja y comente según esta. Ejercicio 1.12. A fin de fiscalizar el pago de impuestos de los empleados de cierto sector laboral, se tomó una muestra aleatoria de 25 empleados, entre los 10 000 que integran este sector. Los ingresos mensuales de esta muestra (en miles de soles) se procesaron con las herramientas estadı́sticas que proporciona el Excel y se obtuvo los resultados siguientes: Media Mediana Desviación estándar Cuenta 60 9,69 9,40 1,15 25 Profesor José Flores Delgado Estadı́stica descriptiva a) Complete la información faltante en el gráfico. b) Obtenga las conclusiones importantes que se derivan de esta información. c) Los ingresos mensuales de este sector superiores a 10 mil soles serán gravados con un impuesto extraordinario de 100 soles. Se presenta el problema de estimar la recaudación total mensual que se obtendrá al aplicar el impuesto sobre este sector. i) Resuelva el problema bajo un enfoque estadı́stico descriptivo; es decir, considere los resultados de la muestra para obtener una estimación. ii) Resuelva el problema bajo un enfoque probabilı́stico, empleando como modelo a la función H, cuya gráfica corresponde a la ojiva de frecuencias relativas acumuladas de esta muestra. 61 Profesor José Flores Delgado Estadı́stica Ejercicio 1.13. En un centro de trabajo al que llega una gran cantidad de clientes por dı́a, los operarios fueron capacitados siguiendo un entrenamiento patrón para realizar funciones del mismo tipo y con gran rapidez. Los tiempos correspondientes hasta que se requiere un descanso durante el dı́a de trabajo se distribuyen siguiendo una patrón de tendencia a la centralización, cuya media y percentiles 25, 50 y 75 son 4,6; 2,75; 5,1 y 5,1 horas, respectivamente. Con el fin de mejorar los tiempos anteriormente descritos, fue elaborado un nuevo tipo de entrenamiento para realizar las mismas funciones diarias y, al adiestrar a los operarios, los tiempos correspondientes dieron una media y percentiles 25, 50 y 75 de 4,5; 4,1; 5,4 y 5,5 horas, respectivamente. Además, la distribución de frecuencias con este entrenamiento nuevo es como se representa a continuación: Figura 1.1: a) ¿Existe también un patrón de tendencia a la centralización en la distribución de los tiempos correspondientes al nuevo entrenamiento? Explique por qué podrı́a esperarse la existencia de este patrón de tendencia en este contexto. 62 Profesor José Flores Delgado Estadı́stica descriptiva b) Respecto al entrenamiento patrón, se sostenı́a que un grupo de operarios requerı́a una capacitación complementaria. ¿Está usted de acuerdo? ¿Qué puede decir al respecto si se trata de la capacitación nueva? c) El entrenamiento nuevo será implantado definitivamente, en lugar del antiguo, si tanto el tiempo promedio, como la variabilidad, resultaran mejores. Usted es encargado para decidirlo, ¿cuál, según los datos, serı́a su decisión? d) ¿Cuál es el tiempo mı́nimo para ser considerado en el “cuarto mejor calificado” según cada entrenamiento? e) ¿Cuál es el tiempo máximo para ser considerado en el “cuarto menos calificado” según cada entrenamiento? Ejercicio 1.14. Un alumno obtuvo una nota de 14 en el curso A y esta corresponde al percentil 40 de las notas en el curso. La nota de este alumno en el curso B fue de 13 y esta corresponde al percentil 60 de las notas en este curso. Determine en cuál de los dos cursos el alumno obtuvo un mejor desempeño con respecto a los demás alumnos. Suponga que el desempeño está dado por la nota y justifique su respuesta. Ejercicio 1.15. Durante el último perı́odo de doce meses, la rentabilidad mensual de cierta operación financiera tuvo una media de 20 % y una desviación estándar de 5 %. Si un agente invirtió cada mes un capital de 500 unidades monetarias, determı́nese la media y la desviación estándar de los capitales finales mensuales en este perı́odo. 63 Profesor José Flores Delgado Estadı́stica Nota: si x1 , . . . , x12 son las rentabilidades (en porcentaje) de cada uno de estos meses, observe que el capital final al cabo del j-ésimo xj mes es de 500 + 500 100 = 500 + 5xj . 64 2. Correlación y regresión lineal 2.1. Correlación Básicamente, el análisis de correlación lineal consiste en averiguar si dos variables X e Y están asociadas o correlacionadas de manera lineal. El objetivo principal del análisis de regresión lineal es predecir el valor de una de las variables (la que se denomina dependiente y, usualmente, se denota por Y ) a partir de un determinado valor de la otra (variable independiente), para lo cual se determina la ecuación del modelo lineal que relaciona a las dos variables. Para estos fines, se dispone de una muestra de n observaciones conjuntas de ambas variables, digamos (x1 , y1 ), . . . , (xn , yn ), donde cada par corresponde a la medición de X e Y, respectivamente, sobre una misma unidad (sujeto u objeto) de observación. La correlación se puede detectar fácilmente mediante la gráfica de los pares dados en un sistema de coordenadas cartesianas, la que se conoce como “Diagrama de dispersión” o de “esparcimiento”. A continuación, se muestran los diagramas de dispersión correspondientes a cuatro tipos de asociación. Estos diagramas sugieren que el promedio de los valores (xi − X̄)(yi − Ȳ ) es un indicador de correlación lineal; a este se le llama covarianza y se denota por SX,Y . SX,Y = n i=1 (xi − X̄)(yi − Ȳ ) n 65 Profesor José Flores Delgado Estadı́stica Como se aprecia en los gráficos anteriores, si los datos tienden a seguir un patrón de tendencia lineal y directa (si una variable aumenta, la otra también aumenta), entonces, la covarianza es positiva; si, en cambio, la tendencia lineal es inversa (si una variable aumenta la otra disminuye), la covarianza es negativa. Sin embargo, este indicador no es tan preciso como el siguiente. 2.2. Índice de correlación de Pearson A partir de la covarianza, se puede definir un mejor indicador de correlación lineal llamado “ı́ndice de correlación de Pearson” y denotado por r como se muestra a continuación: r= SX,Y SX SY 66 Profesor José Flores Delgado Correlación y regresión lineal 67 Una fórmula útil para el cálculo de r es la siguiente: r= n j=1 ( n j=1 xj yj − nX̄ Ȳ x2j − nX̄ 2 )( n j=1 yj2 − nȲ 2 ) Las propiedades que tiene este indicador son las que se presentan a continuación: 1. Está limitado entre −1 y 1; es decir: −1 ≤ r ≤ 1. 2. Solo en el caso de que entre los datos exista una relación lineal exacta es r, en valor absoluto, igual a 1. Si dicha relación es directa, r es igual a 1; y, si es inversa, r es igual a −1. Es decir, se cumple que: r = 1 ⇔ existen a y b, positivo, tales que: yj = a + bxj , j = 1, . . . , n. r = −1 ⇔ existen a y b, negativo, tales que: yj = a + bxj , j = 1, . . . , n. 3. Este indicador es invariante ante transformaciones de los datos que sean lineales y del mismo tipo (ambas directas o bien ambas inversas). Se tiene que si uj = c + dxj y vj = e + f yj , j = 1, . . . , n, con d y f con el mismo signo, entonces, el coeficiente de correlación de los datos, ası́ transformados, no varı́a; es decir, rU,V = rX,Y . Ejemplo 2.1. En un centro de procesamiento de datos, se está interesado en estudiar Y, el tiempo que se necesita en el computador central para procesar una cantidad, X, de ciertos trabajos especiales. Para este fin, determinados números de trabajos de este tipo fueron 67 Profesor José Flores Delgado Estadı́stica procesados en diferentes oportunidades. Los resultados se presentan a continuación: X 2 Y 5,5 5 8 7 9 9 11 11 13 15 20 9 2 7 10 11 5,5 9,2 12 X 5 9 11 2 5 7 10 Y 8,4 11 12 5,9 8,2 9,4 12 9 11 15 20 15 20 7 11 8,4 13 10 2 7 12 5,5 8,6 Con estos datos, haremos un breve análisis de correlación lineal, gráfica y cuantitativamente. Gráficamente, construimos el diagrama de dispersión: Se observa una fuerte tendencia lineal entre ambas variables, de modo que a mayor número de trabajos le corresponde un mayor tiempo. Cuantitativamente, usamos el coeficiente de correlación entre ambas variables: r= n j=1 ( n j=1 x2j xj yj − nX̄ Ȳ − nX̄ 2 )( n j=1 68 yj2 = 0,96453 − nȲ 2 ) Profesor José Flores Delgado Correlación y regresión lineal 69 Se ratifica lo apreciado en el gráfico; es decir, existe una fuerte relación lineal (r ≈ 1) y directa (r > 0) entre el número de trabajos para procesar y el tiempo correspondiente. Ejemplo 2.2. En determinada empresa, se piensa que Y, el precio de venta (en soles) de un producto, decrece conforme aumenta X, el tiempo (en años) que tiene de uso este, y según el modelo Y = αβ X , para ciertos parámetros positivos α y β, con este último menor que 1 y expresados en unidades convenientes. Para corroborarlo, se dispuso de la muestra conjunta de ambas variables siguiente: X 1 3 6 8 9 10 12 Y 4500 1200 155 42 22 11 5 En este caso, el diagrama de dispersión es: Claramente, se aprecia que las variables tienden a relacionarse, pero no de forma lineal, sino, más bien, parece una forma exponencial decreciente como la del tipo señalado. Para analizar la validez de este modelo, no podemos usar el coeficiente de correlación, pues no es lineal. Sin embargo, veamos cómo, en este 69 Profesor José Flores Delgado Estadı́stica caso, es posible transformar el modelo formulado en uno equivalente y que sı́ sea lineal. De este modo, podremos resolver el problema aplicando la teorı́a al modelo lineal. Para esto, basta usar logaritmos; en efecto: Y = αβ X ⇔ LnY = Lnα + (Lnβ)X Es decir, LnY y X están relacionados linealmente. Para estudiar el modelo transformado en lineal, con variables LnY y X, usamos el coeficiente de correlación. Al hacerlo, obtenemos: rLnY ; X = −0,9977. Ası́, como este coeficiente grande, en valor absoluto, se concluye que existe una fuerte relación lineal e inversa entre LnY y X. Por lo tanto, también es fuertemente apreciable la formulada: Y = αβ X . A continuación, se muestra la gráfica de LnY y X. 2.3. Regresión lineal simple Si ya sabemos que los datos presentan una correlación lineal, entonces, interesa ahora determinar cuál es la ecuación de la relación que los aproxima, es decir, cuáles son los valores de a y b tales que, para la mayorı́a de los datos xj e yj , se tenga que yj sea aproximadamente igual a a + bxj . El método más conocido es el de 70 Profesor José Flores Delgado Correlación y regresión lineal 71 los “cuadrados mı́nimos”. Bajo este método, los valores de a y b son aquellos que minimizan la suma de los cuadrados: Q(a,b) = n j=1 (yj − a − bxj )2 Se demuestra que estos valores son: a = Ȳ − bX̄ y b = r SY SX Geométricamente, la recta buscada es la que ‘mejor’ se ajusta a los datos (como muestra la figura anterior). Ejemplo 2.3. En el problema formulado en el ejemplo 2.1, ya sabemos que, entre el tiempo de procesamiento, Y, y el correspondiente número de trabajos X, existe una fuerte relación lineal; es decir, esperamos que el modelo entre las dos variables sea: Y = a + bX Entonces, el paso siguiente serı́a averiguar los valores a y b que definen dicha relación. Estos parámetros a y b los podemos estimar usando los Y datos dados y el método de los cuadrados mı́nimos. Ası́: b = r SSX = 4,1706 0,96453 × 3,90427 = 1,03033; a = Ȳ − bX̄ = 10,832 − 1,03033(8,08) = 2,50693. Luego, el modelo estimado es: Ŷ = 2,50693 + 1,03033X. 71 Profesor José Flores Delgado Estadı́stica En particular, podemos hacer el pronóstico de la variable dependiente asociada a un valor cualquiera dentro del rango de valores registrados de la variable independiente. Por ejemplo, la estimación del pronóstico para una cantidad de 8 trabajos es Ŷ = 2,50693 + 1,03033(8) = 10,75 minutos. Ejemplo 2.4. En el contexto del ejemplo2.2, ya sabemos que, entre el precio del producto, Y, y la correspondiente edad, predomina una fuerte relación del tipo: Y = αβ X ⇔ LnY = Lnα + (Lnβ)X Para efectuar un pronóstico, estimamos los parámetros del modelo transformado a lineal. Para esto, usamos las fórmulas dadas para el modelo lineal Y = a+bX, con ‘Y ’ = LnY ; y ‘X’ = X; a = Lnα y b = Lnβ. Ası́, usando los datos dados del ejemplo obtenemos: b = Lnβ = rLnY ; X SLnY / SX = −0,638197, por lo tanto, β = 0,52824. a = Ln α = Ȳ −bX̄ = LnY −(Lnβ)X̄ = 4,483054−(−0,638197)(7) = 8,95043, por lo tanto, α = 7711,20697. Entonces, estimamos la ecuación del modelo esperado Ŷ 7711,20697(0,52824)X . = Ası́, por ejemplo, el pronóstico del precio del producto que tiene cinco años de uso es Ŷ = 7711,20697(0,52824)5 = 317,16 soles. Observación 2.1. Todo esto ha sido basado exclusivamente en una muestra. Por lo tanto, serı́a válido sólo para los datos dados; es decir, hemos trabajado simplemente a nivel descriptivo y no de inferencia. Además, incluso para los propios datos, estarı́a faltando una medida de la bondad de las estimaciones y del pronóstico. Lo último 72 Profesor José Flores Delgado Correlación y regresión lineal 73 será completado a continuación, pero la inferencia correspondiente no es materia del curso. 2.4. Análisis de varianza para la regresión Veamos cómo se puede medir el poder explicativo de la variable dependiente (X) sobre la independiente (Y ) a través de la regresión planteada. Analizaremos la varianza de Y, llamada ”de la regresión”, identificando dos fuentes que dan origen a ella. El valor ajustado por la regresión de X sobre Y , para cada valor yj de Y es: ŷj = a + bxj = Ȳ + b(xj − X̄) Y el correspondiente error es: ej = yj − ŷj = yj − Ȳ − b(xj − X̄) Tenemos lo siguiente: La media de los valores ajustados es igual a la de los propios valores: n ŷj /n = Ȳ . Ŷ = j=1 La media de los errores de ajuste es cero: ē = 0. La llamada suma de cuadrados total es: SCT = nSY2 = n j=1 (yj − Ȳ )2 Como sabemos, esta mide la variabilidad de Y . 73 Profesor José Flores Delgado Estadı́stica La llamada suma de cuadrados de la regresión es: SCR = nSŶ2 = = n j=1 n j=1 = b2 (ŷj − Ŷ )2 (ŷj − Ȳ )2 n j=1 (xj − X̄)2 2 = n b2 SX Esta debe medir la variabilidad de la variable Ŷ , es decir, la de los valores que se obtendrı́an para Y si se usara la regresión lineal obtenida con X. Es claro que, si el ajuste es perfecto (lo cual sucede solo si efectivamente la relación lineal entre X e Y es exacta), se tendrá que Ŷ = Y y ası́ SŶ2 = SY2 . La llamada suma de cuadrados de los errores es: SCE = nSe2 = n j=1 = n (ej − ē)2 2 ej = j=1 n j=1 (yj − Ȳ − b(xj − X̄))2 Debe medir la variabilidad de los errores que se cometen al usar la regresión lineal para ajustar los valores de Y. Ası́, también mide el ajuste de los datos a la recta de regresión. De las ecuaciones anteriores, se verifica la identidad siguiente llamada descomposición de la varianza: SCT = SCR + SCE Ası́, las sumas anteriores tienen una nueva interpretación: 74 Profesor José Flores Delgado Correlación y regresión lineal 75 SCR estarı́a midiendo la variabilidad de Y explicada por su relación lineal con X, mientras que SCE estarı́a midiendo la otra parte de la variabilidad. De la descomposición anterior, se tiene la siguiente identidad: 1= SCR SCE + SCT SCT A la proporción R2 = SCR 2 = rX, Y SCT se le llama el coeficiente de determinación. Por lo visto en la descomposición de la varianza, este coeficiente mide la proporción de variabilidad de la variable dependiente que se debe a su relación lineal con la variable independiente. Una manera alternativa de interpretar el coeficiente de determinación, R2 , se obtiene a partir de la relación siguiente: R2 = r 2 Ŷ , Y . Por lo tanto, R2 es un indicador de la bondad del ajuste al considerar la regresión de Y a partir de X. Ejemplo 2.5. Ası́, en el contexto del ejemplo 2.1, no solo estamos, ahora, en la capacidad de afirmar que la relación existente entre el tiempo de procesamiento y la cantidad de trabajos asociada es fuertemente lineal y directa, sino, además, podemos sostener que 2 el 93 % (rX, = 0,93) de la variabilidad en el tiempo se debe a la Y asociación lineal existente con el número de trabajos para procesar. 75 3. Probabilidad 3.1. Introducción El objetivo es cuantificar las posibilidades que tengan ciertos eventos inciertos. Sin duda, el evento incierto de mayor importancia para la estadı́stica ocurre cuando se infiere algo a partir de solo una muestra. En este caso, es importante averiguar la veracidad o el grado de credibilidad que se le puede dar a dicha generalización; por eso, la probabilidad es de suma importancia para la estadı́stica. Es importante señalar que, muchas veces, se debe tomar una decisión en un contexto de incertidumbre. En estos casos, la probabilidad resulta muy útil para evaluar los riesgos. Empezaremos tratando los conceptos básicos, propiedades y uso de la probabilidad; luego, veremos algunos modelos probabilı́sticos. Definición 3.1. Experimento aleatorio. Es cualquier experimento cuyo resultado no se puede predecir con certeza antes de realizarlo. Definición 3.2. Espacio muestral asociado a un experimento aleatorio. Es el conjunto de resultados posibles del experimento. Usualmente, se denota por S u Ω. Ejemplo 3.1. Un lote contiene unidades que pueden tener algún defecto. Se escogerán dos unidades al azar y se determinará si estas tienen algún defecto. Podemos considerar como espacio muestral a 76 Profesor José Flores Delgado Probabilidad Ω = { (0; 0), (0; 1), (1; 0), (1; 1) }, con la convención siguiente: el primer componente de cada par ordenado representa el estado de la primera unidad y el segundo el de la otra, además 0 significa que la unidad no tiene defectos y 1 que tiene alguno. Definición 3.3. Evento. Es cualquier subconjunto del espacio muestral.1 Es decir, salvo el caso del evento φ, un evento es cualquier conjunto de resultados del experimento. Ejemplo 3.2. A continuación, describamos algunos eventos del ejemplo anterior: a) Ambas unidades están en el mismo estado: A1 = {(0; 0),(1; 1)}. Este evento tiene dos resultados, cualquiera de estos lleva a ocurrir este evento. b) La segunda unidad tiene defectos: A2 = {(0; 1),(1; 1)}. Nuevamente, este evento tiene dos resultados y cualquiera de estos lleva a ocurrir este evento. c) Ambas unidades se encuentran con defectos: A3 = {(1; 1)}. Este evento solo tiene un resultado, cuando ocurra dicho resultado ocurrirá este evento. Hemos definido los eventos como conjuntos. A continuación, formalizaremos la caracterı́stica más importante que estos poseen, es decir, que pueden ocurrir. Definición 3.4. Diremos que un evento ocurre cuando, al realizar el experimento, el resultado obtenido es uno del evento. 1 En un curso avanzado de probabilidades, solo los conjuntos que pertenecen a una familia llamada sigma-álgebra son considerados como eventos. 77 Profesor José Flores Delgado Estadı́stica Gracias a la definición anterior, podemos interpretar algunas de las operaciones entre conjuntos en el contexto de eventos. Esto será de suma importancia para hacer la conexión entre la formalidad y la aplicación: 1. El conjunto vacı́o, φ, es denominado el evento imposible, pues nunca ocurre. 2. El espacio muestral, Ω, es denominado el evento seguro, pues siempre ocurre. 3. Si A y B son dos eventos de Ω, entonces: a) A ∪ B es el evento que ocurre si, y solo si, al menos uno de los dos eventos ocurre. b) A ∩ B es el evento que ocurre si, y solo si, ambos eventos ocurren. 4. Si A es un evento de Ω, entonces: Ac = Ω − A es el evento complementario de A y este ocurre si, y solo si, A no ocurre. 5. Si A y B son dos eventos de Ω que son disjuntos, es decir, A ∩ B = φ, se dirá que estos eventos son excluyentes, pues no pueden ocurrir juntos. Para resaltar este hecho, escribiremos A B, en lugar de A ∪ B, cuando tengamos esta situación. Ejemplo 3.3. Un inspector deberá revisar 3 trabajos; cualquiera de estos puede haber satisfecho las especificaciones requeridas. Definamos los eventos Ai : el trabajo i satisfizo las especificaciones, i = 1, 2, 3. 78 Profesor José Flores Delgado Probabilidad A partir de estos eventos, expresemos los que siguen: a) Los tres trabajos hayan satisfecho las especificaciones. El evento de interés es A1 ∩ A2 ∩ A3 , cuyo complemento es Ac1 ∪ Ac2 ∪ Ac3 . b) Por lo menos uno de los trabajos haya satisfecho las especificaciones. En este caso el evento de interés es complemento es Ac1 ∩ Ac2 ∩ Ac3 . A1 ∪ A2 ∪ A3 , cuyo c) Solo dos de los trabajos hayan satisfecho las especificaciones. El evento de interés es (A1 ∩ A2 ∩ Ac3 ) (A1 ∩ Ac2 ∩ A3 ) (Ac1 ∩ A2 ∩ A3 ). d) Ninguno de los trabajos haya satisfecho las especificaciones. El evento de interés es Ac1 ∩ Ac2 ∩ Ac3 . e) Por lo menos uno de los trabajos no haya satisfecho las especificaciones. Este evento puede expresarse como: Ac1 ∪ Ac2 ∪ Ac3 . 3.2. Definición y propiedades de la probabilidad Como ya se ha dicho, la probabilidad debe procurar reflejar las posibilidades que tienen de ocurrir los eventos. Ası́, como los eventos provienen de distintos experimentos, existen muchas formas de asignar una probabilidad. A continuación, veamos cuándo una asignación de probabilidades a los eventos de un espacio muestral se 79 Profesor José Flores Delgado Estadı́stica considera, en efecto, una probabilidad. La definición de Kolmogorov establece cuáles son las condiciones mı́nimas que debe satisfacer toda asignación o regla de probabilidades a fin de lograr todo un conjunto de propiedades. Definición 3.5. Una probabilidad es una transformación, P , que asigna a cada evento, A, de un espacio muestral, Ω, un número real: P (A) y que satisface las tres propiedades siguientes, llamadas axiomas de probabilidad: A1 Para cualquier evento A: P (A) ≥ 0. A2 La probabilidad del espacio muestral es 1 : P (Ω) = 1. A3 Si A1 , A2 , . . . es una colección de eventos mutuamente excluyentes, entonces: P (A1 A2 . . . ) = P (A1 ) + P (A2 ) + . . . o, en notación abreviada: ∞ ∞ P Aj = P (Aj ) j=1 j=1 Ejemplo 3.4. (Probabilidad Clásica) Si el experimento tiene un número finito de resultados y cada uno de ellos se cree que es igualmente posible, entonces la mejor manera de asignar probabilidades a los eventos de su espacio muestral es la siguiente: P (A) = #(A) , para cada evento A de Ω. #(Ω) Observación 3.1. Esta asignación es adecuada, pues, al ser cada resultado igualmente probable de ocurrir, deberı́a tenerse que la 80 Profesor José Flores Delgado Probabilidad probabilidad de un evento sea proporcional al número de resultados que este tenga (a mayores resultados, mayor probabilidad); la división entre el número de resultados posibles se hace para estandarizar, es decir, a fin de que toda probabilidad esté entre 0 y 1. Ejemplo 3.5. En el ejemplo 3.1 tenemos que el espacio muestral es finito, pues #(Ω) = 4. Supongamos que cada resultado sea igualmente posible. Entonces, es adecuado asignar probabilidades de la manera clásica, es decir: #(A) P (A) = , ∀A ⊂ Ω. 4 En particular, considerando los eventos definidos en dicho ejemplo, tenemos que: a) La probabilidad de que ambas unidades estén igual es P (A1 ) = #(A1 ) = 24 = 12 . 4 b) La probabilidad de que la segunda unidad no tenga defectos es 2) P (A2 ) = #(A = 24 = 12 . 4 c) La probabilidad de que las dos unidades no tengan defectos es 3) P (A3 ) = #(A = 14 . 4 A continuación, veamos algunas de las demás propiedades que se derivan de las tres básicas. 3.3. Propiedades de la probabilidad P 1 La probabilidad del evento imposible es nula: P ( φ ) = 0. 81 Profesor José Flores Delgado Estadı́stica P 2 La probabilidad de un evento y la de su complemento suman 1: P (A) + P (Ac ) = 1. P 3 La probabilidad de cualquier evento, A, es menor o igual que 1: P (A) ≤ 1. P 4 Si un evento A está incluido dentro de otro, B, entonces, su probabilidad es a lo sumo igual a la de aquel: P (A) ≤ P (B). P 5 Para cualesquiera A y B, eventos de Ω : P (B) = P (B ∩ A) + P (B ∩ Ac ). P 6 Para cualesquiera A y B, eventos de Ω : P (A ∪ B) = P (A) + P (B) − P (A ∩ B). Observación 3.2. Las dos últimas propiedades se generalizan para tres o más eventos, como se enuncian en la propiedad que se da después del ejemplo siguiente y en el primer ejercicio propuesto, respectivamente. Ejemplo 3.6. Dos personas suelen trabajar en equipo al realizar un proyecto. La probabilidad de que, al realizar el proyecto, la primera termine a tiempo su trabajo es de 0,7; y la de que termine a tiempo la segunda es de 0,8. Además, la probabilidad de que ambas terminen a tiempo su trabajo es de 0,51. A modo de ejemplo, calculemos algunas probabilidades: a) La probabilidad de que al menos una de estas personas termine a destiempo su trabajo. Consideremos los eventos A, que la primera persona termine a tiempo su trabajo, y B, que la segunda termine a tiempo. De los datos, tenemos que P (A) = 0,7, P (B) = 0,8 y P (A∩B) = 0,51. 82 Profesor José Flores Delgado Probabilidad Nos interesa calcular P (Ac ∪ B c ). Esta, por la propiedad 2 de la probabilidad, se puede determinar por medio de la de su evento complementario (que ambas terminen a tiempo): 1 − P (A ∩ B) = 1 − 0,51 = 0,49 A manera de ejercicio, obtenga la probabilidad anterior por medio de la propiedad 6 de la probabilidad: P (Ac ∪ B c ) = P (Ac ) + P (B c ) − P (Ac ∩ B c ). b) La probabilidad de que la primera persona no termine a tiempo su trabajo, pero sı́ la segunda. En este caso, el evento que nos interesa, que la primera persona no termine a tiempo su trabajo, pero sı́ la segunda, corresponde al evento Ac ∩ B. Su probabilidad se puede obtener usando la propiedad 5 de la probabilidad: P (B) = P (B ∩ A) + P (B ∩ Ac ) ⇒ P (Ac ∩ B) = P (B) − P (B ∩ A) = 0,8 − 0,51 = 0,29. c) La probabilidad de que solo una de estas personas no termine a tiempo su trabajo. Aquı́, el evento que interesa es (Ac ∩ B) (A ∩ B c ) (no termine a tiempo la primera pero sı́ la segunda, o bien no termine a tiempo la segunda pero sı́ la primera) y como en esta reunión los eventos son excluyentes, basta sumar sus probabilidades (por el axioma 3 de la probabilidad). Ası́: P (Ac ∩B)(A∩B c ) = P (Ac ∩B)+P (A∩B c ) = 0,29+0,19 = 0,48 Aquı́ se ha obtenido P (A ∩ B c ) de manera análoga a como se procedió en la parte anterior para hallar P (Ac ∩ B), es decir, usando: P (A) = P (A ∩ B) + P (A ∩ B c ). 83 Profesor José Flores Delgado Estadı́stica d) La probabilidad de que al menos una de estas personas termine a tiempo su trabajo. En este caso, nos interesa el evento (A ∪ B) (al menos una de estas personas termine a tiempo su trabajo). Para determinarla, podemos usar la propiedad 6: P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 0,7 + 0,8 − 0,51 = 0,99. Compruebe que P (A ∪ B) = P (Ac ∩ B) + P (A ∩ B c ) + P (A ∩ B). Los datos y eventos dados pueden representarse en la tabla siguiente: Bc B A Ac Totales P (A ∩ B) = 0,01 P (Ac ∩ B) P (A ∩ P (Ac ∩ Totales Bc) P (A) = 0,3 Bc) P (Ac ) = 0,7 P (B c ) = 0,8 P (B) = 0,2 1 Observación 3.3. Tenga siempre presente el uso de las propiedades de la probabilidad. No use la tabla anterior (u otras gráficas) como justificación para el cálculo de probabilidades; solo use propiedades para este fin. Propiedad (Regla de la probabilidad total) Sean A1 , . . . , Ak , eventos mutuamente excluyentes (esto es, Ai ∩ Aj = φ, i = j) y k Ai = Ω), entonces, para todo evento, B, de exhaustivos (es decir, Ω: i=1 P (B) = k i=1 P (B ∩ Ai ) Esta propiedad es una de las más importantes en las aplicaciones. Las propiedades que satisfacen los eventos A1 , . . . , Ak (mutuamente 84 Profesor José Flores Delgado Probabilidad excluyentes y exhaustivos) se resumen diciendo que estos constituyen una partición de Ω y se puede ilustrar como sigue: Ejemplo 3.7. Para producir cierto bien, se usa solo uno de tres procedimientos principales existentes (1, 2 y 3) y, opcionalmente, uno secundario (4). La probabilidad de usar el procedimiento 1 es de 0,6; la probabilidad de usar el procedimiento 1 con el secundario es igual a 0,24. La probabilidad de usar el procedimiento 2 sin el procedimiento secundario es de 0,06. La probabilidad de usar el procedimiento 3 es de 0,25; y la probabilidad de usar el procedimiento secundario con este procedimiento es de 0,16. Obtengamos la probabilidad de usar el procedimiento secundario: Consideremos los eventos: Ai , usar el procedimiento i; para i = 1, . . . , 4. Estos eventos nos permiten expresar los datos dados con las notaciones necesarias para usar las propiedades de la probabilidad: A1 A2 A3 = Ω, es decir, los eventos A1 , A2 y A3 son mutuamente excluyentes y exhaustivos. P (A1 ) = 0,6, P (A1 ∩ A4 ) = 0,24, P (A2 ∩ Ac4 ) = 0,06, P (A3 ) = 0,25 y P (A3 ∩ A4 ) = 0,16. 85 Profesor José Flores Delgado Estadı́stica Para obtener la probabilidad del evento que interesa, es decir, de A4 , la descomposición A1 A2 A3 = Ω nos permite expresar A4 = (A4 ∩ A1 ) (A4 ∩ A2 ) (A4 ∩ A3 ); por lo tanto, la probabilidad pedida es: P (A4 ) = P (A4 ∩ A1 ) (A4 ∩ A2 ) (A4 ∩ A3 ) = P (A4 ∩ A1 ) + P (A4 ∩ A2 ) + P (A4 ∩ A3 ) = 0,24 + P (A4 ∩ A2 ) + 0,16 Luego, basta obtener la probabilidad P (A4 ∩ A2 ). Para esto, puesto que A1 A2 A3 = Ω, podemos deducir inmediatamente que, P (A1 ) + P (A2 ) + P (A3 ) = 1 y ası́ P (A2 ) = 1 − 0,6 − 0,25 = 0,15. Además, ya que P (A2 ) = P (A4 ∩ A2 ) + P (Ac4 ∩ A2 ), tenemos que P (Ac4 ∩ A2 ) = P (A2 ) − 0,06 = 0,15 − 0,06. Ası́, P (A4 ) = 0,24 + 0,09 + 0,16 = 0,49. 3.4. Probabilidad condicional Como ya sabemos, una probabilidad P definida sobre los eventos de Ω cuantifica las posibilidades que tienen de ocurrir dichos eventos. Sucede que, en el transcurrir del tiempo, podemos ir recibiendo información que modifique el estado de incertidumbre que se tenı́a sobre el experimento antes de realizarlo. Por ejemplo, si en una empresa el 70 % de los proyectos que llegan se desarrollan a tiempo, podemos decir que, si un proyecto llega, hay una probabilidad de 0,7 de desarrollarlo a tiempo; sin embargo, resulta que algunos proyectos llegan solo con un mes de anticipación; ¿se podrá decir que estos tienen la misma probabilidad de ser desarrollados a tiempo? El conocimiento de esta información a lo mejor afectará las probabilidades anteriores; por lo tanto, hay la necesidad de actualizar 86 Profesor José Flores Delgado Probabilidad las probabilidades iniciales con base en el conocimiento de la nueva información adquirida. Dicho de otro modo, este conocimiento nos debe llevar a un aprendizaje que se concreta o expresa en una nueva regla de asignación de probabilidades, digamos P . Dicha información nueva es expresada como la ocurrencia de un evento B; y la nueva asignación de probabilidades P es llamada “probabilidad condicional dado que ocurrió B” y se la define para cada evento A, a partir de la probabilidad P, anterior a la información recibida, como: P (A) = P (A ∩ B) P (B) Además, se suele denotar a esta nueva asignación de probabilidades, P , como P ( / B), es decir, para cada evento A de Ω se tiene que: P (A/ B) = P (A ∩ B) P (B) Obsérvese que para la asignación clásica resulta: P (A ∩ B) = P (A/ B) = P (B) #(A∩B) #(Ω) #(B) #(Ω) = #(A ∩ B) #(B) Por ello, se interpreta como la probabilidad de que ocurra A, cuando el espacio Ω se reduce al evento B. Observación 3.4. La probabilidad condicional es, en efecto, una probabilidad, pues satisface: A1. P (A/ B) ≥ 0, para cada A evento de Ω. A2. P (Ω/ B) = 1. A3. Para cualesquiera C y D, eventos excluyentes de Ω: P (C D/ B) = P (C/ B) + P (D/ B). 87 Profesor José Flores Delgado Estadı́stica En particular, satisface también cualquier otra propiedad de la probabilidad: P1. La probabilidad del evento imposible es nula: P (φ/ B) = 0. P2. La probabilidad de cualquier evento A es menor o igual que 1: P (A/ B) ≤ 1. P3. La probabilidad de un evento más la de su complemento da 1: P (A/ B) + P (Ac / B) = 1. P4. Si un evento, C, está incluido dentro de otro, D, entonces, su probabilidad es a lo sumo igual a la de aquel: P (C/ B) ≤ P (D/ B). P5. Para cualesquiera C y D, eventos de Ω : P (C) = P (C ∩D/ B)+ P (C ∩ Dc / B). P6. Para cualesquiera C y D, eventos de Ω: P (C ∪ D/ B) = P (C/ B) + P (D/ B) − P (C ∩ D/ B). Propiedad (Regla del producto): para cualesquiera A y B eventos de Ω, se tiene que: P (A ∩ B) = P (B)P (A/ B) = P (A)P (B/ A). Observación 3.5. Esta regla es sumamente importante, pues permite obtener la probabilidad que tienen de ocurrir conjuntamente dos eventos, a partir de la de uno de ellos y la del otro condicional a la ocurrencia del primero. 88 Profesor José Flores Delgado Probabilidad En general: P (A1 ∩ . . . ∩ Ak ) = P (A1 )P (A2 / A1 )P (A3 / A1 ∩ A2 ) . . . P (Ak / A1 ∩ . . . ∩ Ak−1 ). Ejemplo 3.8. Una empresa del paı́s se encuentra en cierto estado financiero si posee dos caracterı́sticas, c1 y c2 ; la probabilidad de que posea c1 es de 0,9. Además, una de cada cuatro empresas que posee la caracterı́stica c1 también posee la c2 . Usaremos la regla anterior para calcular la probabilidad de que una de estas empresas, escogida arbitrariamente, se encuentre en dicho estado financiero: Ası́, consideremos los eventos A : la empresa presente la caracterı́stica c1 , y B : presente c2 . Por los datos: P (A) = 0,9 y P (B/ A) = 1/4 = 0,25. Luego, por la regla del producto: P (A ∩ B) = P (A)P (B/ A) = 0,225. Propiedad (reglas de la probabilidad total y de Bayes) Sean A1 , . . . , Ak , eventos mutuamente excluyentes (esto es, Ai ∩ Aj = φ, k Ai = Ω), y B para cualesquiera i = j) y exhaustivos (es decir, i=1 otro evento. Esto se puede representar gráficamente como sigue: 89 Profesor José Flores Delgado Estadı́stica Entonces, tenemos las propiedades siguientes: a) La regla de la probabilidad total: La probabilidad de B puede obtenerse mediante una suma, como se muestra a continuación: P (B) = k i=1 P (B ∩ Ai ) = k P (Ai )P (B/ Ai ) i=1 Es común ilustrar esta regla mediante una tabla de probabilidades: O, también, mediante un diagrama de árbol de probabilidades: b) La regla de Bayes: Luego de saber de la ocurrencia del evento B, la probabilidad que se le habı́a asignado a Aj (para j = 1, . . . , k) se actualiza como: P (Aj / B) = P (Aj )P (B/ Aj ) P (Aj ∩ B) = k P (B) P (Ai )P (B/ Ai ) i=1 90 Profesor José Flores Delgado Probabilidad Ejemplo 3.9. En una compañı́a, el 30 % de los proyectos es encargado al administrador 1, el 20 % al administrador 2, y el resto al administrador 3. Cuando el proyecto está a cargo del administrador 1, solo en el 1 % de estos se comete un error grave; en el 3 % si es el administrador 2 quien está a cargo; y en el 4 % si es el administrador 3 el que está a cargo. ¿Cuál es la probabilidad de cometer un error grave al realizarse un proyecto? En este caso, los porcentajes se refieren a las probabilidades frecuenciales, y la pregunta puede ser resuelta con porcentajes y un poco de razonamiento con aritmética, pero se trata de usar las propiedades de probabilidad que ya hemos visto, como lo haremos a continuación: Podemos considerar los eventos Ai : el proyecto es realizado por el administrador i, i = 1,2,3; y B : cometer un error grave al realizar el proyecto. Los datos son: P (A1 ) = 0,3; P (A2 ) = 0,2; P (A3 ) = 0,5; P (B/A1 ) = 0,01; P (B/A2 ) = 0,03 y P (B/A3 ) = 0,04. Podemos ilustrar estos datos mediante la tabla siguiente: B A1 A2 A3 Total P (B ∩ A1 ) P (B ∩ A2 ) P (B ∩ A3 ) P (B) Bc P (B c Totales P (A1 ) = 0,3 ∩ A1 ) P (B c ∩ A2 ) P (A2 ) = 0,2 91 P (B c ∩ A3 ) P (A3 ) = 0,5 P (B c ) 1 Profesor José Flores Delgado Estadı́stica O mediante el diagrama de árbol siguiente: Ası́, la probabilidad de cometer un error grave al realizar el proyecto es: P (B) = = = = P (B ∩ A1 ) P (A1 ) P (B/ A1 ) (0,3)(0,01) 0,029. + + + P (B ∩ A2 ) P (A2 ) P (B/ A2 ) (0,2)(0,03) 92 + + + P (B ∩ A3 ) P (A3 ) P (B/ A3 ) (0,5)(0,04) Profesor José Flores Delgado Probabilidad Las probabilidades de la primera fila del cuadro o la de cada rama del árbol pueden ser completadas usando la regla del producto, P (B ∩ Ai ) = P (Ai )P (B/Ai ); ası́, obtenemos: B Bc Totales A1 P (B ∩ A1 ) = 0,003 P (B c ∩ A1 ) A2 P (B ∩ A2 ) = 0,006 P (B c ∩ A2 ) A3 P (B ∩ A3 ) = 0,02 P (B c ∩ A3 ) Total P (B) = 0,029 P (B c ) P (A1 ) = 0,3 P (A2 ) = 0,2 P (A3 ) = 0,5 1 y Ejercicio: Al realizar un proyecto se cometió un error grave, ¿cuál administrador tiene mayor probabilidad de haberlo realizado? 93 Profesor José Flores Delgado Estadı́stica Sugerencia: examine las probabilidades: P (Ai /B) = P (Ai )P (B/Ai ) P (Ai ∩ B) = , para i = 1, 2 y 3; P (B) P (B) y, luego, determine a cuál administrador corresponde la mayor probabilidad. 3.5. Independencia Definición 3.6. Dado un espacio muestral Ω, sobre cuyos eventos se tiene definida una regla de asignación de probabilidades P, se dice que dos eventos, A y B, son independientes si: P (A/ B) = P (A). O, equivalentemente, si: P (B/ A) = P (B). Ası́, esto significa que el conocimiento de la ocurrencia de uno de los eventos no altera la probabilidad de que ocurra el otro. Ejemplo 3.10. En el análisis costo-beneficio de la compra de cierta fábrica, se considera, para simplificar, que solo dos eventos pueden determinar el cierre de la fábrica al cabo del primer año: una demanda muy baja del producto que se fabricará o que la fábrica se vuelva anticuada, debido a nuevas normas de control ambiental (ver Benjamin 1970: 56). En este caso, es razonable suponer que los eventos anteriores sean independientes, pues la ocurrencia de uno de ellos no altera la probabilidad de ocurrir el otro. Es decir, si denotamos por A al primer evento y por B al segundo, es claro que: P (A/ B) = P (A) y P (B/ A) = P (B). 94 Profesor José Flores Delgado Probabilidad Supongamos que la probabilidad de que ocurra el primer evento antes mencionado sea 0,1, y 0,05 la del segundo. Entonces, la probabilidad de que, durante el primer año, ocurra una demanda muy baja y que la fábrica se vuelva anticuada puede obtenerse a partir de la regla del producto y el concepto de independencia. Ası́, obtenemos que: P (A ∩ B) = P (A)P (B/A) = P (A)P (B) = 0,1 × 0,05 = 0,005. Lo visto en el ejemplo anterior motiva la definición equivalente siguiente. Propiedad 1: A y B son eventos independientes si y solo si: P (A ∩ B) = P (A)P (B). Propiedad 2: Si A y B son eventos independientes, también lo son: a) Ac y B; b) A y B c ; y c) Ac y B c . Observación 3.6. Ası́, podemos decir que dos eventos son independientes si la probabilidad de que ocurra uno de ellos no se altera aun sabiendo si ocurrió o si no ocurrió el otro. La definición y propiedad anteriores se generalizan para una colección de eventos: Definición 3.7. Una colección de eventos, {A1 , A2 , . . . }, son independientes, si la probabilidad de que ocurran simultáneamente cualquier número finito de estos eventos es igual al producto de las probabilidades correspondientes. Ası́, por ejemplo, si se consideran n de tales eventos, digamos, Ai1 , Ai2 , . . . Ain , entonces: P (Ai1 ∩ Ai2 ∩ . . . ∩ Ain ) = P (Ai1 )P (Ai2 ) . . . P (Ain ) 95 Profesor José Flores Delgado Estadı́stica Propiedad 3: Si en una colección de eventos independientes, {A1 , A2 , . . . }, se sustituye cualquiera de los eventos Aij por su complemento Acij , entonces, los eventos que resultan ası́ seguirán siendo independientes. Observación 3.7. Por ello, cuando se tiene independencia, ocurre la simplificación siguiente de la regla del producto general: P (Ai1 ∩ Ai2 . . . ∩ Ain ) = P (Ai1 )P (Ai2 / Ai1 )P (Ai3 / Ai1 ∩ Ai2 ) . . . P (Ain / Ai1 ∩ . . . ∩ Ain−1 ) Ejemplo 3.11. Los eventos A, B y C son independientes si se cumplen las igualdades siguientes: P (A ∩ B) = P (A)P (B), P (A ∩ C) = P (A)P (C), P (B ∩ C) = P (B)P (C) y P (A ∩ B ∩ C) = P (A)P (B)P (C). Ejemplo 3.12. Sea Ω = {1, 2, 3, 4} y los eventos A = {1, 4}, B = {2, 4} y C = {3, 4}. Si consideremos la probabilidad clásica tenemos, como en Parzen (1960: 90, ejemplo 1D), que: P (A) = P (B) = P (C) = 2/4 = 1/2, P (A ∩ B) = P (A ∩ C) = P (B ∩ C) = 1/4 (pues A ∩ B = A ∩ C = B ∩ C = {4}). Ası́: P (A ∩ B) = P (A)P (B), P (A ∩ C) = P (A)P (C) y P (B ∩ C) = P (B)P (C). Sin embargo, P (A ∩ B ∩ C) = P (A)P (B)P (C). Es decir, estos tres eventos no son conjuntamente independientes, pero dos cualesquiera de estos sı́ lo son. 96 Profesor José Flores Delgado Probabilidad Ejemplo 3.13. En el contexto del ejemplo 3.10, consideremos un perı́odo de 3 años. Supongamos que, en cada uno de estos años, la probabilidad de que la demanda sea muy baja se mantenga constante, es decir, igual a 0,1, e independiente de los demás años. Interesa obtener la probabilidad de los eventos siguientes: a) En cada uno de estos años, la demanda sea muy baja. b) Por lo menos en uno de los años de este perı́odo, la demanda sea muy baja. c) Solo en un año de este perı́odo la demanda sea muy baja. d) Solo en dos años de este perı́odo la demanda sea muy baja. e) Por lo menos en dos años la demanda sea muy baja. Para obtenerlas, definamos los tres eventos siguientes: Ai : Durante el año i, la demanda sea muy baja, i = 1, 2, 3. a) Aquı́ estamos interesados en el evento A1 ∩ A2 ∩ A3 . Por la independencia, tenemos que: P (A1 ∩ A2 ∩ A3 ) = P (A1 )P (A2 )P (A3 ) = (0,1)3 . b) En este caso, el evento de interés es A1 ∪ A2 ∪ A3 , cuyo complemento es Ac1 ∩Ac2 ∩Ac3 . Por la independencia, resulta más simple obtener la probabilidad del complemento, en efecto: P (Ac1 ∩ Ac2 ∩ Ac3 ) = = = = 97 P (Ac1 )P (Ac2 )P (Ac3 ) (1 − 0,1)(1 − 0,1)(1 − 0,1) (1 − 0,1)3 (0,9)3 Profesor José Flores Delgado Estadı́stica Ası́, P (A1 ∪ A2 ∪ A3 ) = 1 − P (Ac1 ∩ Ac2 ∩ Ac3 ) = 1 − (1 − 0,1)3 = 1 − (0,9)3 . c) Aquı́, el evento que interesa es (A1 ∩ Ac2 ∩ Ac3 ) (Ac1 ∩ A2 ∩ Ac3 ) (Ac1 ∩ Ac2 ∩ A3 ). Su probabilidad se puede obtener sumando las probabilidades de cada uno de los eventos excluyentes anteriores, es decir: P (A1 ∩ Ac2 ∩ Ac3 ) + P (Ac1 ∩ A2 ∩ Ac3 ) + P (Ac1 ∩ Ac2 ∩ A3 ) Nuevamente, por la independencia, tenemos que: P (A1 ∩ Ac2 ∩ Ac3 ) = P (A1 )P (Ac2 )P (Ac3 ) = (0,1)(1 − 0,1)2 P (Ac1 ∩ A2 ∩ Ac3 ) = P (Ac1 )P (A2 )P (Ac3 ) = (0,1)(1 − 0,1)2 P (Ac1 ∩ Ac2 ∩ A3 ) = P (Ac1 )P (Ac2 )P (A3 ) = (0,1)(1 − 0,1)2 Por lo tanto, la probabilidad que interesa es 3(0,1)(1 − 0,1)2 = 3(0,1)(0,9)2 . d) Aquı́, el evento que interesa es: (A1 ∩ A2 ∩ Ac3 ) (A1 ∩ Ac2 ∩ A3 ) (Ac1 ∩ A2 ∩ A3 ). Su probabilidad se puede obtener sumando las probabilidades de cada uno de los eventos excluyentes anteriores, es decir: P (A1 ∩ A2 ∩ Ac3 ) + P (A1 ∩ Ac2 ∩ A3 ) + P (Ac1 ∩ A2 ∩ A3 ) Nuevamente, por la independencia, tenemos que: P (A1 ∩ A2 ∩ Ac3 ) = P (A1 )P (A2 )P (Ac3 ) = (0,1)2 (1 − 0,1) P (A1 ∩ Ac2 ∩ A3 ) = P (A1 )P (Ac2 )P (A3 ) = (0,1)2 (1 − 0,1) P (Ac1 ∩ A2 ∩ A3 ) = P (Ac1 )P (A2 )P (A3 ) = (0,1)2 (1 − 0,1) Por lo tanto, la probabilidad que interesa es 3(0,1)2 (1 − 0,1) = 3(0,1)2 (0,9). 98 Profesor José Flores Delgado Probabilidad e) Aquı́ el evento que interesa es la reunión del anterior, D, con el primero, A, es decir: DA = (A1 ∩A2 ∩Ac3 )(A1 ∩Ac2 ∩A3 )(Ac1 ∩A2 ∩A3 )(A1 ∩A2 ∩A3 ). Por tener eventos excluyentes, la probabilidad que interesa es P (D A) = P (D) + P (A) = 3(0,1)2 (0,9) + (0,1)3 . Observación 3.8. Se suele confundir el concepto de eventos independientes con el de eventos excluyentes. Esto sucede porque, en el lenguaje común y corriente, ı̈ndependencia”significa .autonomı́a”; ası́, dos eventos excluyentes, al no tener elementos en común, son autónomos en cuanto a sus elementos se refiere; sin embargo, la independencia de eventos se refiere a la autonomı́a de las probabilidades de ocurrir, de lo que carecen los eventos excluyentes, pues, si ocurre uno de ellos, el otro tendrá una probabilidad nula de ocurrir. Propiedad 4: Si en una colección de eventos independientes se escogen subcolecciones disjuntas (de este modo, ningún evento estará en más de una subcolección) y, en cada subcolección, se efectúan operaciones (de reunión, intersección o complemento) con los eventos que la integran, entonces, los eventos que resultan de estas operaciones también son independientes. 99 Profesor José Flores Delgado Estadı́stica 3.6. Probabilidad clásica y combinatoria Como fue visto en el ejemplo 3.4, para calcular la probabilidad clásica de un evento se requiere contar su número de resultados. Existen técnicas que facilitan el conteo; estas son parte del llamado .análisis combinatorio”. A continuación, describiremos brevemente algunas. Definición 3.8. (Número combinatorio) Si m y n son dos números naturales, con m mayor o igual que n, al número m m! = C nm = n n!(m − n)! se le denomina combinatorio de m en n y nos da el número de subconjuntos (o grupos), de tamaño n, que se pueden obtener a partir de m elementos. Por m! entendemos el producto de los primeros m números naturales, es decir, m! = 1x 2x . . . x m, si m es mayor o igual que 1, y se define 0! como 1. Ejemplo 3.14. Entre 20 empresas, de las cuales 5 son clasificadas del tipo ‘a’ y las otras 15 del tipo ‘b’, se toma una muestra al azar de 4 de estas. Podemos describir el espacio muestral asociado a este experimento, Ω, como el conjunto de subconjuntos de tamaño 4 que se pueden determinar con 20 elementos. De este modo, se deduce que Ω tiene: 20 20! 20! 17 × 18 × 19 × 20 = = = = 4 845 4 4! (20 − 4)! 4! 16! 1×2×3×4 elementos o resultados. 100 Profesor José Flores Delgado Probabilidad Si quisiéramos ser más precisos, podemos identificar a las empresas por los números naturales, por ejemplo, del 1 al 20, donde los primeros 5 identifican a las del tipo a. Ası́: Ω = { A / A ⊂ {1, . . . , 20}, #(A) = 4 }. Note que todo elemento (resultado) A de Ω es un subconjunto (grupo) del conjunto {1, . . . , 20}, integrado por 4 elementos. Describamos dos eventos para ilustrar el uso del número combinatorio en el conteo: a) Seleccionar solo empresas del tipo a: A1 = { {1, 2, 3, 4},{1, 2, 3, 5},{1, 2, 4, 5},{1, 3, 4, 5},{2, 3, 4, 5} } En este caso, el subconjunto elegido, además de ser de cuatro elementos, estos deben ser solo del conjunto {1,2,3,4,5}; por lo tanto, A1 tiene: 5! 5 = = 5 resultados o elementos. 4 4! 1! Cualquiera de estos resultados determina la ocurrencia del evento A1 . Es decir, hay 5 posibilidades, entre 4 845, de que ocurra A1 . b) Seleccionar solo empresas del tipo b. Entonces, el grupo de 4 empresas debe estar integrado solo por 4 de las 6 del tipo b que hay en total. Ası́, este evento, digamos A2 , tiene: 15 15! 12 × 13 × 14 × 15 = = = 1 365 resultados o elementos. 4 4! 11! 1×2×3×4 En este caso, hay 1 365 posibilidades entre 4 845 de que ocurra A2 . Ası́, la probabilidad de seleccionar solo empresas del tipo b es de 1 365 en 4 845. 101 Profesor José Flores Delgado Estadı́stica A continuación, mostramos algunos de estos resultados: A2 = { {6, 7, 8, 9},{6, 7, 8, 10}, . . . . , {6, 7, 8, 20}, . . . . , {17, 18, 19, 20} }. Definición 3.9. (Principio de la multiplicación) Si una primera operación se puede llevar a cabo de m formas y, después de esta, una segunda operación se puede realizar de n formas, entonces, la operación de llevar a cabo la primera operación y, luego, la segunda se puede realizar de m × n formas posibles. Ejemplo 3.15. En el mismo ejemplo anterior, veamos dos eventos más para ilustrar las dos técnicas vistas del análisis combinatorio: a) A3 : Seleccionar solo tres empresas del tipo a. Ahora se completa el grupo, de modo que tenga tres empresas del tipo a y solo una del tipo b. Para determinar el número de resultados que tiene este evento, podemos, por ejemplo, describir sus elementos enumerándolos abreviadamente y como una matriz de m filas y n columnas. De este modo, el producto m × n nos dará el número de resultados. Veamos: {1, 2, 3, 6}, {1, 2, 3, 7}, . . . {1, 2, 3, 20}, {1, 2, 4, 6}, {1, 2, 4, 7}, . . . {1, 2, 4, 20}, A3 = ... ... ... ... {3, 4, 5, 6}, {3, 4, 5, 7}, . . . {3, 4, 5, 20} Notemos que se han listado los resultados anteriores siguiendo un orden adecuado para evitar dejar fuera alguno de ellos. También observemos que, en este arreglo, el número de filas y el de columnas lo obtenemos usando el número combinatorio. En efecto, como una fila es determinada por las tres empresas 5! del tipo a que se hayan elegido, hay 53 = 3!2! = 10 filas. De 102 Profesor José Flores Delgado Probabilidad modo similar, cada columna es determinada por la empresa 15! del tipo b que se haya escogido. Ası́, hay 15 = 15 = 1!14! 1 columnas. Entonces, el número de casillas que hay en el arreglo anterior es 10 × 15 = 150 (por el principio de la multiplicación). Luego, el evento A3 tiene 150 resultados. Por lo tanto, hay 150 posibilidades entre 4 845 de que ocurra A3 . b) A4 : Seleccionar dos empresas del tipo a y dos del tipo b. Ahora tenemos que seleccionar dos empresas del tipo a, lo cual 5! se puede hacer de 52 = 2!3! = 10 maneras, y seleccionar dos 15! empresas del tipo b, lo cual se puede hacer de 15 2 = 2!13! = 105 maneras. Ası́, por el principio de la multiplicación, hay 10×105 = 1 050 posibilidades para seleccionar dos empresas del tipo a y dos del tipo b. Como lo hicimos con el evento anterior, podemos escoger un orden apropiado que nos permita listar todas estas posibilidades como un arreglo de filas y columnas: {1, 2, 6, 7}, {1, 2, 6, 8}, . . . {1, 2, 19, 20}, {1, 3, 6, 7}, {1, 3, 6, 8}, . . . {1, 3, 19, 20}, A4 = ... ... ... ... {4, 5, 6, 7}, {4, 5, 6, 8}, . . . {4, 5, 19, 20} 5! En esta lista, hay 52 = 2!3! = 10 filas. Cada una contiene 15 15! 2 = 2!13! = 105 columnas. Ası́, hay 10 × 15 = 150 casillas, cada una representa a uno de los resultados que conducen a la ocurrencia de este evento. Por lo tanto, las posibilidades de que, al tomar al azar un grupo de 4 empresas, resulten dos del tipo a y dos del tipo b son de 1050 en 4 845. Observación 3.9. El principio de la multiplicación se generaliza para tres o más operaciones. Ejemplo 3.16. En el contexto del ejemplo 3.14, supongamos ahora que, en cada una de las próximas semanas, se visitará una 103 Profesor José Flores Delgado Estadı́stica empresa distinta y escogida aleatoriamente, y nos interesa obtener la probabilidad de que, en la primera y cuarta semana, se visite a una empresa del tipo a. Ahora, el espacio muestral no estará integrado por subconjuntos o grupos de tamaño 4, sino por cuartetos (grupo ordenado de tamaño 4), es decir: Ω = {(a1 ,a2 ,a3 ,a4 )/ ai ∈ {1, . . . , 20}, ai = aj , i = j, i, j = 1, . . . , 20} Puesto que la primera empresa que visitar puede ser cualquiera de las 20, la segunda cualquiera de las 19 restantes, la tercera cualquiera de las 18 restantes y, finalmente, la cuarta empresa por visitar puede ser cualquiera de las 17 restantes, entonces, por el principio de la multiplicación, el número de resultados posibles lo podemos obtener mediante el producto siguiente: #(Ω) = 20 x 19 x 18 x 17 = 116 280. Nuestro evento de interés lo podemos denotar por E y describirlo como: E = {(a1 ,a2 ,a3 ,a4 ) ∈ Ω / a1 , a4 ∈ {1,...,5}} La primera empresa que visitar puede ser cualquiera de las 5 del tipo a; la cuarta, cualquiera de las 4 del tipo a restantes; la segunda empresa por visitar, cualquiera de las 18 empresas restantes (entre las del tipo a y b); y la tercera, cualquiera de las 17 restantes. Entonces, tenemos que #(E) = 5x4 × 18 × 17 = 6 120. Luego, 6 120 1 P (E) = #(E) #(Ω) = 116 280 = 19 . Observación 3.10. Si m y n son dos números naturales, con m mayor o igual que n, al número: Pnm = m! = m(m − 1) . . . (m − (n − 1)) (m − n)! 104 Profesor José Flores Delgado Probabilidad se le denomina número de permutaciones de m en n y nos da el número de n-tuplas (grupos ordenados de tamaño n) que se pueden obtener a partir de m elementos. 3.7. Probabilidad geométrica y frecuencial Existe una infinidad de formas de asignar probabilidades a los eventos de un espacio muestral. La más conocida de todas es la llamada ”probabilidad clásica”, pero el uso de una de estas dependerá de la situación en particular. A continuación, veamos dos formas más. Definición 3.10. (Probabilidad geométrica) Esta asignación es análoga a la probabilidad clásica, pero, en este caso, el experimento tiene un número infinito e innumerable de resultados, los cuales se encuentran distribuidos aleatoria e indistintamente (uniformemente) sobre toda una región. Esta región puede ser un intervalo (por ejemplo, de tiempo), un área o un volumen. En este caso, una manera natural de asignar probabilidades a los eventos del espacio muestral (la región) es la siguiente: P (A) = medida de A medida de Ω esto para cada evento, A, de Ω. La medida a la que se refiere la definición anterior depende de la dimensión de la región. Ası́, en una dimensión, la medida usual es la longitud; en dos dimensiones, el área; y, en tres, el volumen. Ahora, la probabilidad de un evento es proporcional a su medida. Ejemplo 3.17. El precio del bien A varı́a aleatoria y uniformemente entre 100 y 200 soles, y el precio del bien B varı́a entre 200 y 300 105 Profesor José Flores Delgado Estadı́stica soles de manera aleatoria y uniformemente para cualquiera que sea el precio del bien A. Una persona que desea adquirir una unidad de cada bien dispone de un presupuesto de 450 soles. Se quiere cuantificar el riesgo que corre esta persona de no conseguir su objetivo. En este caso, el espacio muestral puede describirse como: Ω = { (x; y) ∈ R2 / 100 ≤ x ≤ 200, 200 ≤ y ≤ 300} Con la interpretación siguiente: si (x; y) es un resultado de Ω, quiere decir que el precio del bien A es x soles y el del bien B es y soles. La persona desea que su presupuesto de 450 soles alcance, es decir, que ocurra el evento siguiente: E = { (x; y) ∈ Ω/ x + y ≤ 450}. Lo podemos representar gráficamente junto al espacio muestral como sigue: Por la condición del problema, cada resultado se distribuye indistintamente en toda la región Ω. Luego, la asignación de probabilidades 106 Profesor José Flores Delgado Probabilidad adecuada para cada evento, A, de Ω es: P (A) = medida de A área de A área de A = = . medida de Ω área de Ω 1002 En particular, la probabilidad de que el presupuesto de la persona sea insuficiente es P (E c ) = 50x50 2 1002 = 0,125 Esta probabilidad cuantifica el riesgo que corre la persona cuando solo dispone de 450 soles para adquirir una unidad de cada bien. Definición 3.11. Probabilidad frecuencial: Aquı́, la probabilidad de un evento es la frecuencia relativa con la que este ocurre en una gran cantidad de repeticiones del experimento. Por tal motivo, se acostumbra interpretarla como el porcentaje de veces que suele ocurrir el evento en consideración. Ejemplo 3.18. En cierta región, se ha observado la distribución de los ingresos familiares anuales (en ciertas unidades monetarias) siguiente: x F (x) 0,5 0,2 0,75 0,4 1 0,51 1,5 0,64 2 0,75 2,5 0,8 4 0,90 8 0.99 9 1 Entonces, si obtenemos las probabilidades de la manera frecuencial, podemos hacer, entre otras afirmaciones, las siguientes: a) La probabilidad de que una familia tenga un ingreso anual de 1,5 um a lo sumo es 0,64 (puesto que el 64 % de las familias ha tenido un ingreso de 1,5 um como máximo). 107 Profesor José Flores Delgado Estadı́stica b) La probabilidad de que una familia tenga ingresos anuales entre 1 y 1,5 um es 0,13. c) La probabilidad de que una familia tenga ingresos anuales superiores a 2 um es 0,25, pues el 75 % de las familias ha tenido un ingreso de hasta 2 um. 108 Profesor José Flores Delgado Probabilidad 3.8. Ejercicios propuestos Ejercicio 3.1. Demuestre que la propiedad 6 de la probabilidad se generaliza como sigue: P (A1 ∪ . . . ∪ An ) n P (Ai ∩ Aj ∩ Ak ) + . . . + P (Ai ) − P (Ai ∩ Aj ) + = i=1 i<j i<j<k (−1)n+1 P (A1 ∩ . . . ∩ An ). En particular, si n = 3, se tiene que: P (A1 ∪ A2 ∪ A3 ) = P (A1 ) + P (A2 ) + P (A3 ) − P (A1 ∩ A2 ) − P (A1 ∩ A3 ) − P (A2 ∩ A3 ) + P (A1 ∩ A2 ∩ A3 ). Ejercicio 3.2. Cierto agente invierte en dos acciones con la meta de ganar más de lo previsto en, por lo menos, una. La probabilidad de que gane más de lo previsto en la primera es de 0,3 y la de que solo gane más de lo previsto en la segunda es de 0,2. Cuantifique la confianza en lograr la meta. Ejercicio 3.3. En un supermercado, los compradores tienen que elegir una de tres opciones de pago: con dinero en efectivo, con crédito proporcionado por el supermercado y con crédito proporcionado por otra entidad. La probabilidad de que un comprador pague con dinero en efectivo 109 Profesor José Flores Delgado Estadı́stica es de 0,5 y la probabilidad de que un comprador pague con crédito proporcionado por el supermercado es de 0,3. El supermercado propone a los compradores una donación al momento de pagar. La probabilidad de que un comprador pague con dinero en efectivo y acepte donar es de 0,1; la probabilidad de que un comprador pague con crédito proporcionado por el supermercado y no acepte donar es de 0,05; y la probabilidad de que un comprador pague con crédito proporcionado por otra entidad y acepte donar es de 0,15. a) Exprese los datos con eventos previamente definidos e identifique una partición conveniente del espacio muestral. b) Determine la probabilidad de que un comprador pague con crédito proporcionado por otra entidad. c) Determine la probabilidad de que un comprador pague con crédito proporcionado por el supermercado y acepte donar. d) Determine la probabilidad de que un comprador acepte donar. Ejercicio 3.4. Sean P1 y P2 dos probabilidades definidas para los eventos de Ω. Para cada evento A de Ω, se define Q(A) de la manera siguiente: Q(A) = 3 1 P1 (A) + P2 (A) . 4 4 a) Demuestre que Q(A) ≥ 0, para todo evento A de Ω. b) Halle Q(Ω). 110 Profesor José Flores Delgado Probabilidad c) Si A1 , A2 , . . . es una colección de eventos mutuamente excluyentes, demuestre que Q(A1 A2 . . . ) = Q(A1 ) + Q(A2 ) + . . . d) ¿Es Q una probabilidad? Ejercicio 3.5. Sea P una probabilidad definida para los eventos de Ω. Sea C un evento tal que P (C) > 0. Se define, para cada evento A de Ω : Q(A) = P (A ∩ C) . P (C) a) Demuestre que Q(A) ≥ 0, para todo evento A de Ω. b) Halle Q(Ω). c) Si A1 , A2 , . . . es una colección de eventos mutuamente excluyentes, demuestre que Q(A1 A2 . . . ) = Q(A1 ) + Q(A2 ) + . . . d) ¿Es Q una probabilidad? Ejercicio 3.6. Dados los eventos A1 , A2 y A3 , se sabe que P (A1 ∩ A2 ∩ Ac3 ) = P (A1 ∩ Ac2 ∩ A3 ) = P (Ac1 ∩ A2 ∩ A3 ) = P (A1 ∩ A2 ∩ A3 ) = 81 . a) ¿Cuál es la probabilidad de que los tres eventos ocurran? b) Halle la probabilidad de que solo dos de los tres eventos ocurran. 111 Profesor José Flores Delgado Estadı́stica c) Halle la probabilidad de que, por lo menos, dos de los tres eventos ocurran. d) Halle la probabilidad de que, por lo menos, uno de los tres eventos no ocurra. Ejercicio 3.7. Si P (A ∩ B c ∩ C) = 0,8 y P (A ∩ B c ∩ C ∩ Dc ) = 0,5. a) Halle P (A ∩ B c ∩ C ∩ D). b) Halle P (Ac ∪ B ∪ C c ∪ Dc ). Ejercicio 3.8. Se consideran “aguas duras” a aquellas que requieren cantidades considerables de jabón para producir espuma y ocasionan incrustaciones en las tuberı́as de agua caliente, calentadores y otras unidades en las cuales se incrementa la temperatura del agua. Las aguas pueden clasificarse, según su dureza, en cuatro tipos: blanda (cuando contiene máximo 75 mg/L de CaCO3 ), moderadamente dura (cuando contiene entre 75 y 150 mg/L de CaCO3 ), dura (cuando contiene más de 150 y hasta 300 mg/L de CaCO3 ) y muy dura (cuando contiene más de 300 mg/L de CaCO3 ). Un administrador, encargado de la comercialización de cierto jabón que será vendido en todo el paı́s, ha determinado que: i) La probabilidad de que el jabón sea usado con aguas blandas es de 2/9. 112 Profesor José Flores Delgado Probabilidad ii) La probabilidad de que el jabón se use con aguas blandas, pero no alcance los resultados deseados es de 1/36. iii) Dos de cada cinco veces, el jabón se usará con aguas moderadamente duras y alcanzará los resultados deseados. iv) El 15 % de las veces, el jabón se usará con aguas duras y alcanzará los resultados deseados. v) La probabilidad de que el jabón se use con aguas muy duras es de 0,3. vi) La probabilidad de que el jabón se use con aguas muy duras y no alcance los resultados esperados es de 0,2. a) Exprese los datos dados con eventos previamente definidos e identifique una partición conveniente del espacio muestral. b) ¿Cuál es la probabilidad de que el jabón alcance los resultados esperados y sea usado con aguas blandas? c) ¿Cuál es la probabilidad de que el jabón alcance los resultados esperados y sea usado con aguas muy duras? d) ¿Cuál es la probabilidad de que el jabón alcance los resultados esperados? Ejercicio 3.9. Un trastorno se manifiesta si, y solo si, se presentan por lo menos dos de tres sı́ntomas: s1 , s2 y s3 . La probabilidad de que se presenten los sı́ntomas s1 y s2 es de 0,56. La probabilidad de que se presenten estos tres sı́ntomas es de 0,504. La probabilidad de que se presenten los sı́ntomas s1 y s3 , pero no s2 es de 0,105. La probabilidad de que se presenten los sı́ntomas s2 y s3 pero no s1 es de 0,117. 113 Profesor José Flores Delgado Estadı́stica a) Exprese los datos dados con eventos previamente definidos e identifique una partición del espacio muestral. b) La probabilidad de que se presenten los sı́ntomas s1 y s2 pero no s3 c) La probabilidad de que se presenten los sı́ntomas s1 y s3 . d) La probabilidad de que se presenten los sı́ntomas s1 y s2 pero no s3 e) Determine la probabilidad de que se manifieste el trastorno. Ejercicio 3.10. La probabilidad de ganar en las operaciones financieras 1 y 2 son iguales a 0,3 y 0,4, respectivamente; y la probabilidad de ganar en ambas es de 0,2. ¿Cuál es la probabilidad de ganar en, por lo menos, una de estas operaciones? Ejercicio 3.11. En la producción de cierto bien, se puede usar, por lo menos, uno de tres procedimientos secundarios (1, 2 y 3). Cada uno de estos tiene una probabilidad de 0,55 de ser usado. La probabilidad de que se usen el procedimiento 1 y 2 durante la producción es de 0,2. Los procedimientos 1 y 3 son utilizados durante la producción con probabilidad de 0,25; lo mismo ocurre cuando se usan los procedimientos 2 y 3. Además, la probabilidad de usar los tres procedimientos en la producción es de 0,01. Considere los eventos Ai : usar el procedimiento secundario i, para i = 1, 2 y 3. 114 Profesor José Flores Delgado Probabilidad a) Use los eventos Ai , antes definidos, y operaciones de conjuntos para expresar cada uno de los eventos siguientes: i) E1 : usar, al menos, uno de los procedimientos secundarios en la producción. ii) E2 : usar uno o dos de los procedimientos secundarios en la producción. iii) E3 : usar, a lo sumo, dos de los procedimientos secundarios en la producción. iv) E4 : ninguno de los procedimientos secundarios es usado en la producción. b) Determine la probabilidad de los eventos descritos en la parte anterior. Solo use propiedades de la probabilidad y los resultados de la parte anterior. Ejercicio 3.12. Una entidad crediticia califica a las empresas de cierto grupo para otorgarles un crédito si, y solo si, estas poseen al menos una de tres caracterı́sticas (s1 , s2 , s3 ). La probabilidad de que una de estas empresas posea una sola de las caracterı́sticas es de 0,28 y la probabilidad de que posea solo dos, de 0,67. Considere los eventos Ni : la cantidad de estas caracterı́sticas que posee una empresa es igual a i, para i = 0, 1, 2, 3. a) Use los eventos antes definidos para expresar los eventos siguientes: i) Una empresa de este grupo califique para el crédito. ii) Una empresa de este grupo no califique para el crédito o bien califique por tener las tres caracterı́sticas. 115 Profesor José Flores Delgado Estadı́stica b) Determine el valor de la suma P (N0 )+P (N1 )+P (N2 )+P (N3 ). c) Determine la probabilidad de que una empresa de este grupo no califique para el crédito o bien califique por tener las tres caracterı́sticas. d) Suponga que la probabilidad de que una empresa de este grupo califique para el crédito sea de 0,96. ¿Cuál serı́a la probabilidad de que una de las empresas del grupo posea las tres caracterı́sticas? Ejercicio 3.13. La producción de cierto bien tiene tres procedimientos secundarios, (1, 2 y 3) y la probabilidad de usar, al menos uno de estos, es de 0,9. En la producción, se pueden usar, al mismo tiempo, dos procedimientos secundarios, 1 y 2, con probabilidad de 0,2; 1 y 3, con probabilidad de 0,25; y 2 y 3 también con probabilidad de 0,25. Por último, la probabilidad de usar los tres procedimientos secundarios en la producción del bien es de 0,01. Determine la probabilidad de cada uno de los eventos siguientes: a) Solo se usen los procedimientos secundarios 1 y 2. Recuerde la propiedad P (A∩B) = P (A∩B ∩C)+P (A∩B ∩C c ) b) Solo se usen los procedimientos secundarios 1 y 3. c) Solo se usen los procedimientos secundarios 2 y 3. d) Solo se usen dos de los procedimientos secundarios. e) Se use solo uno de los procedimientos secundarios. f) Ninguno de los procedimientos secundarios se use. g) Se usen, como máximo, dos de los procedimientos secundarios. 116 Profesor José Flores Delgado Probabilidad Ejercicio 3.14. Al poner a la venta un producto, el administrador responsable ha determinado que solo puede presentarse una de las cuatro situaciones de la demanda siguientes: muy desfavorable, desfavorable, favorable y óptima. También ha calculado las probabilidades siguientes: i) 1/8 de que la demanda sea muy desfavorable. ii) 1/9 de que la demanda sea muy desfavorable y no se logren los resultados deseados. iii) 1/4 de que la demanda sea desfavorable. iv) 0,15 de que la demanda sea desfavorable y se logren los resultados deseados. v) 1/4 de que la demanda sea favorable. vi) 0,18 de que la demanda sea favorable y se logren los resultados deseados. vii) 0,1 de que la demanda sea óptima y no se logren los resultados deseados. a) Exprese los datos con eventos previamente definidos. b) ¿Cuál es la probabilidad de que la demanda sea muy desfavorable y se logren los resultados deseados? c) ¿Cuál es la probabilidad de que la demanda sea óptima? d) Halle la probabilidad de que la demanda sea óptima y se logren los resultados deseados. e) Halle la probabilidad de que se logren los resultados deseados. Ejercicio 3.15. La probabilidad de fabricar un artı́culo defectuoso es de 0,1 y la probabilidad de que un artı́culo fabricado defectuosamente sea inservible es de 0,8. ¿Cuál es la probabilidad de fabricar un artı́culo defectuoso e inservible? 117 Profesor José Flores Delgado Estadı́stica Ejercicio 3.16. Con el fin de ganar 5 000 soles, un inversionista realizará una de tres opciones. La probabilidad de que se realice la opción 1 es de 0,3. Si se realiza la opción 1, la probabilidad de ganar 5 000 soles es de 0,4. Si se realiza la opción 2, lo cual ocurre con una probabilidad de 0,2, la probabilidad de ganar 5 000 soles es de 0,1. Cuando se realiza la opción 3, la probabilidad de ganar 5 000 soles es de 0,25. Cuantifique la confianza del inversionista en esta situación. Ejercicio 3.17. En el contexto del ejemplo 3.8, suponga ahora que una empresa se encuentra en dicho estado financiero si también posee la caracterı́stica c3 . Si, además de la información ya dada, se sabe que el 75 % de las empresas que poseen las caracterı́sticas c1 y c2 también presenta la c3 ; ¿cuál es la probabilidad de que una empresa se encuentre en este estado financiero? Ejercicio 3.18. En la identificación de una cerámica de cierto lugar arqueológico,2 esta puede ser, o bien preincaica, con probabilidad de 0,3, o bien incaica. Para ayudar a la identificación de esta cerámica, se observa si posee cierta caracterı́stica distintiva. Si la cerámica es preincaica, la probabilidad que posea la caracterı́stica distintiva es de 0,6; pero, si la cerámica es incaica, la probabilidad solo es de 0,1. 2 Este ejercicio es una simplificación de un problema de Reconocimiento de Patrones. Una referencia es el libro Neural Networks for Pattern Recognition de Christopher M. Bishop, Oxford University Press 2000. 118 Profesor José Flores Delgado Probabilidad a) Exprese los datos dados con eventos previamente definidos. b) Determine la probabilidad de que la cerámica posea la caracterı́stica distintiva. c) En la identificación de una cerámica, se observó que poseı́a la caracterı́stica distintiva. Si el arqueólogo encargado quiere maximizar su confianza en la identificación, ¿la debe clasificar como incaica o preincaica? Ejercicio 3.19. Estudios acerca de la calidad han determinado que un producto tiene un problema de calidad cuando presentan los tres defectos siguientes: 1 (mala presentación), 2 (contenido) y 3 (peso). La probabilidad de que el producto posea el defecto 1 es de 0,05. 1 de cada 4 unidades del producto que presentan el defecto 1, también presentan el defecto 2. Además, se sabe que el 75 % de las unidades del producto que presentan los defectos 1 y 2 también presenta el defecto 3. Determine la probabilidad de que uno de los artı́culos del producto presente un problema de calidad. Ejercicio 3.20. Al realizar tres proyectos, c1 , c2 y c3 , un economista estima las probabilidades siguientes: i) 0,3 de que el desarrollo de c3 no sea exitoso. ii) 0,8 para el desarrollo exitoso de c2 si c3 resultara exitoso. iii) 0,1 de que el desarrollo de c1 no sea exitoso si resultaran exitosos c3 y c2 . 119 Profesor José Flores Delgado Estadı́stica El economista obtendrá un beneficio si, y solo si, los tres proyectos resultaran exitosos. Halle la probabilidad de que este economista obtenga un beneficio. Ejercicio 3.21. Sean P, Q y R probabilidades tales que para cada evento A de Ω : Q(A) = P (A/B) y R(A) = Q(A/C). Demuestre que, para cada evento A : R(A) = P (A/B ∩ C). Ejercicio 3.22. Sean P, Q, R y S probabilidades tales que, para cada evento A de Ω: Q(A) = P (A/B), R(A) = Q(A/C) y S(A) = R(A/D). Demuestre que, para cada evento A : S(A) = P (A/B ∩ C ∩ D). Ejercicio 3.23. Si P (A ∩ C/B) = 0,1, P (A ∩ C c /B) = 0,2, halle P (A/B). Ejercicio 3.24. Halle la probabilidad P (A∪B∪C ∪D) si se conocen las probabilidades siguientes: P (A) = 0,1, P (B c /Ac ) = 0,8, P (C/Ac ∩ B c ) = 0,3 y P (D/Ac ∩ B c ∩ C c ) = 0,4. 120 Profesor José Flores Delgado Probabilidad Ejercicio 3.25. Al realizar tres proyectos, c1 , c2 y c3 , un economista estima las probabilidades siguientes: i) 0,7 para el desarrollo exitoso de c1 ; ii) 0,8 para el desarrollo exitoso de c2 si c1 resultara exitoso; iii) 0,6 para el desarrollo exitoso de c2 si c1 no resultara exitoso; iv) 0,9 para el desarrollo exitoso de c3 si resultaran exitosos c1 y c2 ; v) 0,75 para el desarrollo exitoso de c3 si resultara exitoso c1 , pero no c2 ; vi) 0,65 para el desarrollo exitoso de c3 si resultara exitoso c2 , pero no c1 ; vii) 0,5 para el desarrollo exitoso de c3 si no resultaran exitosos c1 ni c2 . El economista obtendrá un beneficio si, y solo si, por lo menos dos de los tres proyectos resultaran exitosos. Cuantifique el riesgo que correrá al realizar los proyectos. Ejercicio 3.26. Se debe realizar una de dos inversiones. La probabilidad de que se realice la inversión I es de 0,3. Si se realiza la inversión I, la probabilidad de ganar 5 000 soles es de 0,4. Si se realiza la inversión II, la probabilidad de ganar 5 000 soles es de 0,1. a) ¿Cuál es la probabilidad de que se realice la inversión I y se gane 5 000 soles? b) ¿Cuál es la probabilidad de que se realice la inversión II y se gane 5 000 soles? c) ¿Cuál es la probabilidad de que se gane 5 000 soles? d) Si se ganó 5 000 soles, ¿cuál inversión se realizó más probablemente? 121 Profesor José Flores Delgado Estadı́stica Ejercicio 3.27. En el contexto del ejemplo 3.10, suponga un perı́odo de 4 años y que la probabilidad de que la demanda sea muy baja se mantenga constante durante este perı́odo; además, considere que la probabilidad de que la fábrica se vuelva anticuada (por las nuevas normas de control ambiental) al cabo del año i, dado que no se hizo antes, sea 1−(0,95)i , para i = 2, 3 y 4. a) Determine la probabilidad de que, al cabo de este perı́odo, la fábrica no tenga que cerrarse. b) Generalice el resultado anterior para un perı́odo de n años. ¿Puede concluir lo que ocurrirá en el largo plazo? Ejercicio 3.28. De los reportes sobre una operación financiera, se tiene la información siguiente: – la probabilidad de ganar menos de 20 mil soles es de 0,35; – el 40 % de las veces se gana entre 20 mil y 40 mil soles; – cuando se gana menos de 20 mil soles, la probabilidad de no lograr la meta es de 0,2; – si se gana entre 20 mil y 40 mil soles, la probabilidad de que se logre la meta es de 0,6; – la probabilidad de ganar más de 40 mil soles, pero no lograr la meta es de 0,01. 122 Profesor José Flores Delgado Probabilidad a) Halle la probabilidad de que se logre la meta. b) Si se logró la meta, ¿en cuál de los tres rangos mencionados es más probable que se encuentre la ganancia en la operación? Recuerde justificar. Ejercicio 3.29. Las inversiones financieras (de resultados inciertos) han sido clasificadas, según el riesgo de perder, en tres tipos: de riesgo bajo, de riesgo normal y de riesgo alto. Según las estadı́sticas, la probabilidad de realizar una inversión de riesgo bajo es de 0,5 y la de realizar una inversión de riesgo normal es de 0,3. Si la inversión es de riesgo bajo, la probabilidad de perder es de 0,1. La probabilidad de perder en una inversión de riesgo normal es de 0,15. Solo en una de cada cinco inversiones de riesgo alto, no se pierde. a) Exprese los datos dados con eventos previamente definidos. b) Determine la probabilidad de perder cuando la inversión es de riesgo alto. c) Determine la probabilidad de perder en una inversión financiera. d) Si se perdió en la inversión, halle la probabilidad de que haya sido de riesgo bajo. 123 Profesor José Flores Delgado Estadı́stica Ejercicio 3.30. En la producción de cierto bien, se usa solo uno de tres procedimientos principales (1, 2 y 3) y, opcionalmente, por lo menos, uno de dos procedimientos secundarios (4 y 5). Si se usa el procedimiento 1, lo cual ocurre con una probabilidad de 0,6, cada uno de los procedimientos secundarios tiene una probabilidad igual a 0,4 de ser usado; en este mismo caso, la probabilidad de que se usen ambos procedimientos es de 0,2. Si se usa el procedimiento 2, pueden usarse los procedimientos secundarios (4 y 5) de manera independiente cada uno y con probabilidades 0,2 y 0,3, respectivamente. El procedimiento 3 puede usarse con una probabilidad de 0,25; en este caso, la probabilidad de usar al menos uno de los procesos secundarios es de 0,85. a) ¿Cuál es la probabilidad de usar, al menos, uno de los procedimientos secundarios en la producción del bien si se sabe que se ha usado el procedimiento 1? b) ¿Cuál es la probabilidad de usar, al menos, uno de los procedimientos secundarios en la producción del bien y el procedimiento 1? c) ¿Cuál es la probabilidad de usar, al menos, uno de los procedimientos secundarios? Ejercicio 3.31. En un supermercado, cada cliente decide, independientemente de los demás, si compra un artı́culo en promoción. Se sabe que el 75 % de los clientes suele comprar un artı́culo en promoción. Suponga que 4 clientes (1, 2, 3 y 4) ingresan en el supermercado. 124 Profesor José Flores Delgado Probabilidad Use los eventos: Ai , el cliente i decida comprar un artı́culo en promoción, para i = 1, 2, 3 y 4, para expresar los eventos que se dan a continuación y calcular sus probabilidades correspondientes: a) Ninguno de los cuatro clientes decide comprar un artı́culo en promoción. b) Solo uno de los cuatro clientes decide comprar un artı́culo en promoción. c) Solo dos de los cuatro clientes decide comprar un artı́culo en promoción. d) Solo tres de los cuatro clientes decide comprar un artı́culo en promoción. e) Por lo menos uno de los cuatro clientes decide comprar un artı́culo en promoción. Ejercicio 3.32. Halle la probabilidad P (A∪B∪C) en cada uno de los casos siguientes: a) Estos eventos son excluyentes y cada uno tiene una probabilidad de 0,1. b) Estos eventos son independientes y cada uno tiene una probabilidad de 0,1. c) P (Ac ) = 0,3, P (B c /Ac ) = 0,4 y P (C/Ac ∩ B c ) = 0,8. 125 Profesor José Flores Delgado Estadı́stica Ejercicio 3.33. Al invertir en las operaciones financieras 1, 2, 3, 4 y 5 se puede ganar independientemente y con probabilidades iguales a 0,1; 0,2; 0,3; 0,4 y 0,5, respectivamente. a) Exprese los datos dados con eventos previamente definidos. b) Halle la probabilidad de ganar solamente en las operaciones 1 y 5. c) Halle la probabilidad de ganar en, por lo menos, una de estas operaciones. d) Para un agente financiero, resulta rentable la inversión en las cinco operaciones si, y solo si, gana en, por lo menos, una de las tres primeras y gana en las dos últimas. Halle la probabilidad de que resulte rentable la inversión en las cinco operaciones. Ejercicio 3.34. En una planta de producción continua de un producto, en cualquier lapso de un minuto, puede producirse una imperfección con probabilidad de 0,3. Si, en perı́odos de observación que no se traslapan, las imperfecciones producidas son independientes, cuán probables serán los eventos siguientes, referidos a cuatro minutos de observación que no se traslapan: a) En los cuatro minutos de observación se produzca una imperfección. b) En al menos uno de los cuatro minutos de observación se produzca una imperfección. 126 Profesor José Flores Delgado Probabilidad c) Solo en los dos primeros minutos de observación se produzca una imperfección. d) Solo en dos de los minutos de observación se produzca una imperfección. Ejercicio 3.35. En el análisis costo-beneficio de la compra de cierta fábrica, se ha determinado que, solo si alguno de los dos eventos siguientes ocurre, se producirı́a una pérdida: el evento E1 , cuya probabilidad de ocurrir es de 0,1 y el evento E2 , cuya probabilidad es de 0,05. También se sabe que la probabilidad de que ocurran ambos eventos es de 0,02. a) ¿Puede deducirse que los eventos E1 y E2 son independientes? b) ¿Cuál es la probabilidad de que ocurra una pérdida a causa únicamente del evento E1 ? c) ¿Cuál es la probabilidad de que ocurra una pérdida a causa únicamente del evento E2 ? d) ¿Cuál es la probabilidad de que la compra ocasione una pérdida? Ejercicio 3.36. { A1 , . . . , A5 } es una colección de eventos independientes. Cada uno tiene una probabilidad de 0,9. Determine la probabilidad de los eventos siguientes: (A1 ∪ Ac2 ) ∩ A3 y A1 ∪ A2 ∩ (A3 ∪ A4 ) ∪ A5 . 127 Profesor José Flores Delgado Estadı́stica Ejercicio 3.37. En una obra, hay seis operarios. Cada uno puede cometer algún error con una probabilidad de 0,05 e independientemente de los demás operarios. Calcular sus respectivas probabilidades: a) Ninguno de los 6 operarios comete un error. b) Por lo menos 1 de los 6 operarios comete un error. c) Solo 1 de los 6 operarios comete un error. d) Solo 2 de los 6 operarios cometen un error. e) Solo 3 de los 6 operarios cometen un error. f) Los 6 operarios cometen un error. g) A lo sumo 2 de los operarios cometen un error. Ejercicio 3.38. Con fines de auditorı́a sobre 18 empresas aseguradoras que funcionan en nuestro medio (entre las cuales tenemos a El Pacı́fico PeruanoSuiza, Genarali Perú y La Positiva) se tomará una muestra aleatoria de 5 de ellas. Determine la probabilidad de los eventos siguientes: a) Que la muestra solo tenga 1 de las 3 empresas antes citadas. b) Que la muestra solo tenga 2 de las 3 empresas antes citadas. c) La muestra incluya a las 3 empresas mencionadas. d) Que la muestra incluya al menos 1 de las 3 empresas antes citadas. 128 Profesor José Flores Delgado Probabilidad Ejercicio 3.39. En el contexto del ejemplo 3.17: a) ¿Cuál es la probabilidad de que un presupuesto de 350 soles garantice la adquisición de una unidad de cada bien? b) Halle el presupuesto mı́nimo necesario para garantizar, con una probabilidad mayor o igual que 0,95, la adquisición de una unidad de cada bien. c) Cuantifique el grado de confianza de aseverar que, con un presupuesto de 450 soles, se puedan adquirir 2 unidades del bien A y una del bien B. 129 4. Variable aleatoria 4.1. Introducción Si tenemos una variable, X, para la cual desconocemos cómo asume sus valores, podemos cuantificar esta incertidumbre asignando probabilidades sobre sus valores; de este modo, se tendrá un mejor conocimiento de su comportamiento. Esta asignación debe ser tal que nos permita obtener la probabilidad de que la variable X asuma valores sobre cualquier subconjunto, A, de valores posibles, es decir, P (X ∈ A). También es posible obtener un modelo o función que nos dé tal asignación de probabilidades que permita una descripción de la variable. A continuación, formalizamos un poco más lo anterior. Definición 4.1. Sea Ω un espacio muestral asociado a un experimento aleatorio. Una variable aleatoria es una función, X, que transforma cada resultado, ω, del espacio muestral, en un número real X(ω). X: Ω→R ω → X(ω) 130 Profesor José Flores Delgado Variable aleatoria Observación 4.1. ¿Qué interpretación podemos dar a esta definición formal? Para averiguarlo, pongámonos en el papel de una persona que recibe u observa los valores de la variable; para ella, estos valores tendrán una naturaleza aleatoria, puesto que se originan al transformar los resultados de un experimento aleatorio en números. El experimento que da la aleatoriedad resulta, para dicha persona, como una “caja negra”, pues esta solo recibe los valores y no observa el experimento mismo. Por lo tanto, para tener una descripción de ella, tendrá que hacerlo de manera indirecta y no a través del experimento aleatorio en sı́. Ejemplo 4.1. En el contexto del ejemplo 3.14 del capı́tulo anterior, en el que se tienen 20 empresas, de las cuales 5 son clasificadas del tipo ‘a’ y las otras 15 del tipo ‘b’, se toma una muestra al azar de 4 de estas. Entonces, el espacio muestral asociado a este experimento es: Ω = { A / A ⊂ {1, . . . , 20}, #(A) = 4 } con la interpretación de que las empresas están identificadas por los números naturales del 1 al 20 y los primeros 5 identifican a las del tipo a. A manera de ejemplo, consideremos la variable X definida como el número de empresas del tipo a que resultarán en la muestra por seleccionar. X es una variable: puede asumir como valores 0 o 1 o 2 o 3 o 4; es decir, el rango de X es RX = {0, 1, 2, 3, 4}. Además, X asume sus valores de manera aleatoria. Veamos cómo se generan los valores de X a partir del experimento aleatorio que la origina; es decir, entremos en la caja negra, pues, en este caso, es muy simple hacerlo. 131 Profesor José Flores Delgado Estadı́stica Describamos, por ejemplo, cómo se genera el valor 4 de X: el evento X = 4 (las cuatro empresas seleccionadas son del tipo a). Dicho de otro modo, cuáles son los resultados de este experimento que generan este valor o cuál es el evento asociado a este valor: {X = 4} = {{1, 2, 3, 4},{1, 2, 3, 5},{1, 2, 4, 5},{1, 3, 4, 5},{2, 3, 4, 5}}. Note que todo resultado, ω, de este evento tiene la propiedad de ser transformado en el número 4, es decir, X(ω) = 4, ya que han sido seleccionadas cuatro de las empresas del tipo a. Son 54 = 5 resultados que se convierten en el valor 4. A continuación, hagamos lo mismo para el resto de los valores posibles de esta variable: {1, 2, 3, 6}, {1, 2, 3, 7}, . . . {1, 2, 3, 20}, {1, 2, 4, 6}, {1, 2, 4, 7}, . . . {1, 2, 4, 20}, {X = 3} = ... ... ... ... {3, 4, 5, 6}, {3, 4, 5, 7}, . . . {3, 4, 5, 20} En este caso, todo resultado, ω, de este evento tiene la propiedad de ser transformado en el número 3, es decir, X(ω) = 3, ya que han sido seleccionadas 3 de las empresas del tipo a. Son 53 × 15 1 = 10x15 = 150 resultados que se convierten en el valor 3. {1, 2, 6, 7}, {1, 2, 6, 8}, . . . {1, 2, 19, 20}, {1, 3, 6, 7}, {1, 3, 6, 8}, . . . {1, 3, 19, 20}, {X = 2} = ... ... ... ... {4, 5, 6, 7}, {4, 5, 6, 8}, . . . {4, 5, 19, 20} Aquı́, todo resultado, ω, de este evento tiene la propiedad de ser transformado en el número 2, es decir, X(ω) = 2, pues solo han sido seleccionadas 2 de las empresas del tipo a. Son 52 × 15 2 = 10 × 15 = 150 resultados que se convierten en el valor 2. 132 Profesor José Flores Delgado Variable aleatoria {1, 2, 3, 6}, {1, 2, 3, 7}, {1, 2, 4, 6}, {1, 2, 4, 7}, {X = 1} = ... ... {3, 4, 5, 6}, {3, 4, 5, 7}, . . . . . . . . . . . . {1, 2, 3, 20}, {1, 2, 4, 20}, ... {3, 4, 5, 20} Note que todo resultado, ω, de este evento tiene la propiedad de ser transformado en el número 1, es decir, X(ω) = 1, pues solo ha sido seleccionada 1 de las empresas del tipo a. Son 51 × 15 3 = 5 × 455 = 2 275 resultados que se convierten en el valor 1. Finalmente: {X = 0} = { {6, 7, 8, 9},{6, 7, 8, 10}, . . . . , {6, 7, 8, 20}, . . . . , {17, 18, 19, 20} }. Todo resultado, ω, de este evento tiene la propiedad de ser transformado en el número 0, es decir, X(ω) = 0, ya que no han sido seleccionadas empresas del tipo a. Son 15 4 = 1 365 resultados que se convierten en el valor 0. Definición 4.2. El rango de una variable aleatoria X es el conjunto de valores posibles que puede asumir la variable. Se denota por RX . Ejemplo 4.2. En el ejemplo anterior, el rango de la variable aleatoria X es RX = {0, 1, 2, 3, 4}. Definición 4.3. Se dice que una variable aleatoria es discreta si su rango es un conjunto discreto y continua, si su rango es un conjunto continuo. Ejemplo 4.3. La variable aleatoria X del ejemplo 1 es discreta. 133 Profesor José Flores Delgado Estadı́stica Ejemplo 4.4. En el ejemplo 3.17 del tema anterior, en el que el precio del bien A varı́a aleatoria y uniformemente entre 100 y 200 soles, y el precio del bien B varı́a entre 200 y 300 soles, el espacio muestral es: Ω = { (x; y) ∈ R2 / 100 ≤ x ≤ 200, 200 ≤ y ≤ 300} Con la interpretación siguiente: si (x; y) es un resultado de Ω, quiere decir que el precio del bien A es x soles y el del bien B, y soles. Consideremos ahora la variable T , definida como el precio total para adquirir una unidad de cada uno de estos productos. Entonces, cada resultado posible, ω = (x,y), es transformado por esta variable, T , en el número T ((x,y)) = x + y. Ası́, esta variable solo puede asumir valores entre 300 y 500, es decir, RT = [300, 500]. Por lo tanto, T es una variable aleatoria continua. Esto último se ilustra en la figura siguiente: Observación 4.2. Los dos ejemplos anteriores ilustran de manera sencilla el concepto de variable aleatoria. En la aplicación práctica, encontramos variables que se generan de modo complejo y, en estas situaciones, usamos un modelo probabilı́stico para describirlas; esta forma de hacerlo se describirá a continuación. 134 Profesor José Flores Delgado Variable aleatoria 4.2. Modelo probabilı́stico de una variable aleatoria Definición 4.4. Sea Ω un espacio muestral y P una asignación de probabilidades definida sobre sus eventos. Entonces, el ‘modelo’1 o distribución de probabilidades de una variable aleatoria, X, definida en Ω, es una función f : RX → R, con la propiedad de que, para cualquier subconjunto A, de valores posibles para la variable, es decir, A ⊂ RX , se tiene que: f (x), si X es discreta; x∈A P (X ∈ A) = f (x)dx, si X es continua. A Ası́, la probabilidad de que X tome valores en A se halla sumando o integrando, según sea X discreta o continua, la función f en A. Observación 4.3. En el contexto de la inferencia estadı́stica clásica, la variable aleatoria y su modelo probabilı́stico modelan a una caracterı́stica que se registra en toda una población. En cambio, en la estadı́stica descriptiva, se dispone tan solo de una muestra de la variable de la población; por lo tanto, la distribución de frecuencias solo describe la frecuencia relativa de los valores en la muestra. Ası́, esta es solo una aproximación o estimación de la distribución de la variable de la población. Más formalmente, si para cada n ∈ + , X , . . . , X es una muestra aleatoria de X, A ⊂ y p̄ = 1 n la proporción de valores de la muestra que están en A; entonces, un resultado conocido como la Ley Fuerte de los Grandes Números garantiza que lı́m p̄ = P (X ∈ A) (con probabilidad 1). n→∞ 1 El término usual en la literatura estadı́stica es el de distribución, pero en este texto, para enfatizar su utilidad, se usará el término de ‘modelo’; ası́ el autor coincide, en este tratamiento, con Del Pino (2000). 135 Profesor José Flores Delgado Estadı́stica Nótese también que, si en la muestra se consideran solamente los valores no repetidos, digamos x1 , . . . xk , y f r(x1 ), . . . ,f r(xk ) sus respectivas frecuencias relativas, entonces, p̄ = f r(x). Ası́, en x∈A la muestra, se usan las frecuencias relativas obtenidas, f r(x), pero, para la población, estas frecuencias relativas son reemplazadas por los valores proporcionados por el modelo probabilı́stico, f (x). A continuación, ilustramos gráficamente el caso continuo: Ejemplo 4.5. Veamos cómo es la distribución de probabilidades en el rango de la variable del ejemplo 4.1. Para esto, consideremos x cualquier valor posible para X y apliquemos la definición dada al conjunto A = {x}. Entonces, resulta que: P (X = x) = P (X ∈ {x}) = es decir, f (x) = P (X = x). 136 y∈{x} f (y) = f (x), Profesor José Flores Delgado Variable aleatoria En la tabla siguiente, se muestran los valores de f (x) = P (X = x), para cada valor posible de X : x 0 1 f (x) 15 515 4 20 4 1 2 3 20 4 3 515 2 4 515 2 3 20 5 1 4 20 20 4 4 4 En este caso, tenemos la fórmula explı́cita general: 5 15 x f (X = x) = P (X = x) = 204−x , 4 para cualquier x ∈ RX = { 0, 1, 2, 3, 4 }. De aquı́, si aplicamos la definición para cualquier subconjunto, A, de valores posibles para la variable, es decir, A ⊂ RX , se tiene que: 15 x5 4−x 20 P (X = x) = P (X ∈ A) = x∈A 4 x∈A Veamos cómo obtener las probabilidades de algunos eventos relacionados con esta variable X, a partir de su modelo probabilı́stico f . i) La probabilidad de que sean seleccionadas más de 2 empresas del tipo a es 5 15 5 15 4 + 4 204−4 . P (X > 2) = f (x) = f (3) + f (4) = 3 204−3 4 x=3 4 ii) La probabilidad de seleccionar a lo más una empresa del tipo a es 5 15 5 15 P (X ≤ 1) = f (0) + f (1) = 137 0 204−0 + 4 1 204−1 4 Profesor José Flores Delgado Estadı́stica iii) La probabilidad de seleccionar tres empresas del tipo a es: (5)( 15 ) P (X = 3) = f (3) = 3 204−3 (4) Observación 4.4. El modelo probabilı́stico, f , de una variable aleatoria, X, puede extenderse hacia todo número real, definiéndola como 0 en los casos fuera del rango. Además, en el caso discreto, a esta función se le llama también “función de probabilidad” y, en el caso continuo, “función de densidad”. Ejemplo 4.6. El ingreso en soles, en un sector, se considera una variable aleatoria continua, X, cuyo modelo probabilı́stico está dado por: si 0 ≤ x < 1500 0,0008x/1500, f (x) = 0,002 − 0,0008x/1000, si 1500 ≤ x ≤ 2500 0, en otro caso A modo de ejemplo, obtengamos la probabilidad de que un trabajador gane a lo sumo 1000 soles, es decir, P (X ≤ 1000). Como X es continua, sigue, de la definición de f, que 1000 1000 0,0008 0,0008 x2 x=1000 P (X ≤ 1000) = x dx = f (x) dx = 1500 1500 2 x=0 0 0 =0,2667. Ası́, el 26,67 % de los trabajadores de este sector gana a lo más 1000 soles. 138 Profesor José Flores Delgado Variable aleatoria También calculemos la probabilidad de que un trabajador gane 2000 soles o menos, es decir, la probabilidad P (X ≤ 2000). En este, conviene usar el siguiente complemento: 2500 P (X ≤ 2000) = 1 − P (X > 2000) = 1 − (0,002 − 2000 0,0008x/1000) dx = 1 − 0,1 = 0,9. Ası́, el 90 % de los trabajadores de este sector gana, como máximo, 2000 soles. Propiedades del modelo probabilı́stico El modelo o distribución de probabilidades, f, de una variable aleatoria X, satisface las propiedades siguientes: 1. Si X es discreta, para cualquier x ∈ RX se cumple que f (x) = P (X = x). 2. Si X es continua, para cualquier valor x se tiene que P (X = x) = 0. 3. Para cualquier x ∈ RX se cumple que f (x) ≥ 0. 4. Si X es discreta, se tiene que x∈RX 139 f (x) = 1. Profesor José Flores Delgado Estadı́stica 5. Si X es continua, se tiene que f (x)dx = 1. RX 6. Si X es continua, se cumple que f es el modelo probabilı́stico de X, si y solo si b para cualesquiera a < b : P (a ≤ X ≤ b) = f (x)dx. a 7. Si X es continua, para cualesquiera a < b, se tiene que P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b) = P (X ≤ b) − P (X ≤ a). Observación 4.5. En las aplicaciones, para determinar el posible modelo probabilı́stico de una variable aleatoria, se debe buscar entre las funciones que satisfagan las propiedades 3 y 4 en el caso discreto, y 3 y 5 en el caso continuo. 4.3. El valor esperado Definición 4.5. La esperanza o media de una variable aleatoria, X, cuyo modelo probabilı́stico es fX , se denota por E(X) o µX , y se define, según sea la variable discreta o continua, mediante: xf (x) si X es discreta. x∈RX X µX = E(X) = xf (x)dx si X es continua. X RX Observación 4.6. Resulta, entonces, que, en el caso discreto, xP (X = x). Ası́, la esperanza o media es el E(X) = x∈RX promedio de los valores posibles de la variable ponderados con sus respectivas probabilidades. Para extender esta definición al caso 140 Profesor José Flores Delgado Variable aleatoria continuo, usamos la integral. En este caso, dicha integral tiene una interpretación fı́sica: representa la abscisa del centro de gravedad de un cuerpo cuya densidad es descrita por f . Por esta razón, cuando la variable es continua a la función f , se le llama “función de densidad”. Ejemplo 4.7. Para nuestro ejemplo 4.1 (con los datos del ejemplo 4.5), como X es discreta: E(X) = xf (x) = 4 xf (x) x=0 x∈RX = 0f (0) + 1f (1) + 2f (2) + 3f (3) + 4f (4) (5)(15) (5)(15) (5)(15) (5)(15) = 0 + 1 1 20 3 + 2 2 20 2 + 3 3 20 1 + 4 4 20 0 (4) (4) (4) (4) =1 Entonces, cuando se extraen muestras de 4 empresas, se encontrará, en promedio, una empresa del tipo a en cada muestra. Observación 4.7. Cuando se registra u observa una gran cantidad de valores de una variable aleatoria, la media de todos estos es aproximadamente igual a la esperanza de la variable. Más formalmente, si para cada n ∈ + , X1 , . . . , Xn es una muestra n aleatoria de X y X̄ = n1 Xj (la media de la muestra); entonces, j=1 un resultado conocido por la Ley Fuerte de los Grandes Números, establece que, con probabilidad 1, lı́m X̄ = E(X). De allı́ el nombre e n→∞ importancia del valor esperado o media, pues, con este valor, podemos anticipar lo que ocurrirá en promedio. 141 Profesor José Flores Delgado Estadı́stica Ejemplo 4.8. En el contexto del Ejemplo 4.6, la media o valor esperado de los ingresos es 1500 2500 xf (x) dx = xf (x) dx + xf (x) dx R X = 0 1500 1500 x(0,0008x/1500)dx+ 0 2500 1500 x(0,002 − 0,0008x/1000)dx = 600 + 733,33 = 1333,33 Es decir, el ingreso esperado o medio, en este sector, es de 1 333,33 soles. 4.3.1. Valor esperado de una función de una variable aleatoria Sea X una variable aleatoria, con modelo probabilı́stico f (x), y g : X RX → R una función, entonces, la esperanza de la variable aleatoria g(X) puede obtenerse usando la distribución de probabilidades de X, según sea esta discreta o continua, como se indica a continuación: g(x)f (x); si X es discreta. X x∈RX E(g(X)) = g(x)f (x)dx; si X es continua. X RX Observación 4.8. Esta propiedad es muy importante por dos razones. Desde el punto de vista práctico, al establecer que, con el modelo probabilı́stico de una variable aleatoria se puede determinar el valor esperado de cualquier función de esta, entonces, no es necesario 142 Profesor José Flores Delgado Variable aleatoria determinar el modelo para la variable que es función de otra cuyo modelo es conocido. Desde el punto de vista teórico, permite deducir otras propiedades del valor esperado relacionadas con funciones de una variable aleatoria, como las que se darán más adelante. Observe también que, en el caso discreto E(g(X)) = g(x)P (X = x). x∈RX Ejemplo 4.9. La demanda diaria de un artı́culo se considera una variable aleatoria discreta, X, con modelo probabilı́stico: f (x) = 2x , x = 1, 2, 3, 4. 6(x!) El fabricante de estos artı́culos decide producir 2 unidades diarias durante un perı́odo de muchos dı́as. Cada unidad vendida del artı́culo genera una utilidad de 5 soles, pero cualquier unidad que no se vende al cabo del dı́a se desecha y genera una pérdida de 3 soles. El fabricante desea saber cuál será la utilidad promedio durante este perı́odo. Como la utilidad diaria es una función g(X), usamos la propiedad anterior para averiguarlo. Los valores de g y f se muestran en la tabla siguiente: x g(x) f (x) 1 2 3 5(1) − 3(1) = 2 5(2) − 3(0) = 10 5(2) − 3(0) = 10 1 1 2 21 22 23 6(1!) = 3 6(2!) = 3 6(3!) = 9 Ası́ la utilidad esperada está dada por: 4 E g(X) = g(x)f (x) = g(x)f (x) x∈RX x=1 143 4 10 24 6(4!) = 1 9 Profesor José Flores Delgado =2× 1 3 + 10 × 1 3 + 10 × Estadı́stica 2 9 + 10 × 1 9 = 22 3 . Es decir, la utilidad diaria promedio, en este perı́odo, será de 7,33 soles. Observación 4.9. Un error frecuente es pensar que E(g(X)) = g(E(X)), es decir, que, para obtener el valor esperado de una función de X, basta evaluar g en E(X). Una excepción ocurre cuando la función g es lineal de la forma a + bX, como se verá más adelante. Ejemplo 4.10. En el contexto del ejemplo anterior, determinemos el valor esperado de X y verifiquemos que E(g(X)) no es igual a g(E(X)). Ası́, E(X) = RX xf (x) = 4 xf (x) = 1× 13 +2× 13 +3× 29 +4× 19 = 19 9 . x=1 Es decir, en promedio, la demanda diaria es de 2,11 unidades. Además, en la tabla del ejemplo anterior, se puede apreciar que E(g(X)) = g(E(X)). 4.3.2. Otras propiedades del valor esperado 1. El valor esperado de una constante es dicha constante. 2. Para cualesquiera que sean las constantes a y b : E(a + bX) = a + bE(X). 3. Sean g1 , . . . , gn funciones y a0 , a1 , . . . , an , constantes, entonces, E a0 + a1 g1 (X) + . . . + an gn (X) = a0 + a1 E(g1 (X)) + . . . + an E(gn (X)). 144 Profesor José Flores Delgado Variable aleatoria Ejemplo 4.11. En el contexto del ejemplo 4.9, suponga que un comerciante compra cada unidad demandada a 3 soles, y vende cada una a 6 soles; además, la venta le produce un costo fijo de 2 soles. Ası́, la utilidad del comerciante es Y = 6X − 3X − 2 = 3X − 2. Por lo tanto, por la propiedad anterior y el resultado del ejemplo anterior, la utilidad esperada del comerciante es E(Y ) = E(3X−2) = 13 3E(X) − 2 = 3( 19 9 )−2= 3 . Ejemplo 4.12. Sea X una variable aleatoria tal que E(X m ) = m! , ∀m ∈ + , entonces, E(1 + 2X − 3X 2 + X 3 ) = 1 + 2E(X) − 3E(X 2 ) + E(X 3 ) = 1 + 2(1!) − 3(2!) + 3! = 3. Ejemplo 4.13. (Teorı́a de decisiones) Un comerciante debe decidir a cuál de tres proveedores comprar cierto producto. La demanda puede ser excelente, con probabilidad de 0,3; adecuada, con probabilidad de 0,5; o mala, con probabilidad de 0,2. Además, las utilidades semanales (en soles) correspondientes dependen del proveedor y del estado de la demanda de los consumidores, como se muestra a continuación: Estado de la demanda Excelente Adecuada Mala Proveedor 1 2 3 4000 2800 3100 1900 2850 2900 1800 1900 1200 La variable aleatoria que nos interesa está asociada a los valores del estado de la demanda. Entonces, definámosla de la manera siguiente: 1 si el estado de la demanda es excelente. X= 2 si el estado de la demanda es adecuado. 3 si el estado de la demanda es malo. 145 Profesor José Flores Delgado Estadı́stica Estos valores son arbitrarios: solo sirven para diferenciar los posibles estados de la demanda. a) Determinemos la mejor decisión y la utilidad correspondiente para cada valor posible de la demanda: Demanda X = x : Decisión: Utilidad= g(x) : P (X = x) = f (x) : 1 = Excelente Proveedor 1 4000 0,3 2 = Adecuada Proveedor 3 2900 0,5 3 = Mala Proveedor 2 1900 0,2 b) Determinemos cuál serı́a la utilidad promedio del comerciante si este pudiera enterarse del estado de la demanda y, obviamente, tomara la mejor decisión: Como la utilidad es una función de X, el estado de la demanda, podemos usar la propiedad anterior con g la función cuyos valores correspondientes están en la tabla anterior. Ası́: E(U ) = g(x)fX (x) = 4000 × 0,3 + 2900 × 0,5 + 1900 × 0,2 x∈RX = S/. 3 030. c) El comerciante enfrentará esta situación durante muchas semanas; por eso, desde un principio, quiere optar por uno de los proveedores. ¿Cuál es la mejor decisión? Por lo observado para el valor esperado, bastará comparar las utilidades esperadas, E(Ui ), que corresponderı́an a cada decisión posible (proveedor i elegido). Ası́, procediendo de manera análoga a lo efectuado en la parte anterior, nuevamente, podemos hacer una tabla que incluya los valores de estas 146 Profesor José Flores Delgado Variable aleatoria utilidades: Demanda X = x : U1 (x) : U2 (x) : U3 (x) : P (X = x) = f (x) : 1 = Excelente 4000 2800 3100 0,3 2 = Adecuada 1900 2850 2900 0,5 3 = Mala 1800 1900 1200 0,2 Resultará: E(U1 ) = x∈RX U1 (x)fX (x) = 4000 × 0,3 + 1900 × 0,5 + 1800 × 0,2 = S/. 2 550 E(U2 ) = U2 (x)fX (x) x∈RX = 2800 × 0,3 + 2850 × 0,5 + 1900 × 0,2 = S/. 2 645 E(U3 ) = U3 (x)fX (x) x∈RX = 3100 × 0,3 + 2900 × 0,5 + 1200 × 0,2 = S/. 2 620. Por lo tanto, la mejor decisión será optar por el segundo proveedor, ya que, con este, el comerciante tendrá una mayor utilidad promedio, en este caso, de S/. 2 645. d) Supongamos que el comerciante podrı́a averiguar el estado de la demanda pagando un precio. En promedio, ¿cuál será el valor máximo que podrı́a pagar? En la teorı́a de decisiones, este valor se llama el “valor esperado de la información perfecta”. Lo obtenemos comparando las utilidades esperadas antes obtenidas, bajo el conocimiento perfecto del estado de la demanda y bajo incertidumbre. Ası́, el comerciante deberá pagar, en promedio, S/. 3 030 − S/. 2 645 = S/. 385 como máximo. 147 Profesor José Flores Delgado Estadı́stica 4.4. Varianza y desviación estándar Definición 4.6. La varianza de una variable aleatoria X cuya media o esperanza es µX , se define como: E(X − µX )2 y se la denota por 2 . Ası́, V (X) o σX 2 σX = V (X) = E(X − µX )2 = E(X − E(X))2 A la raı́z cuadrada de la varianza, σX , se le llama “desviación estándar”. Observación 4.10. La desviación estándar mide la variabilidad promedio respecto a la media. Por medio de la propiedad básica del valor esperado, puede verificarse que: 2 σX = E(X 2 ) − µ2X Ejemplo 4.14. Calculemos la desviación estándar de la variable X del ejemplo 4.1 (con los datos de los ejemplos 4.5 y 4.7). Primero, calculamos E(X 2 ). Para esto, basta usar la propiedad que permite obtener el valor esperado de una función de una variable aleatoria discreta. Ası́, E(X 2 ) = x2 f (x) = 4 x2 f (x) x=0 x∈RX 2 2 = 0 f (0) + 1 f (1) + 22 f (2) + 32 f (3) + 42 f (4) 515 515 515 515 = 0 + 1 1203 + 4 2202 + 9 3201 + 16 4200 4 4 4 4 = 3,1053. 2 = E(X 2 ) − µ2 = 3,1053 − 12 = 2,1053; y σ = 1,4509. Luego, σX X X Entonces, en general, los valores de X no varı́an demasiado entorno de su media. 148 Profesor José Flores Delgado Variable aleatoria Ejemplo 4.15. Calculemos ahora la desviación estándar de la variable X del ejemplo 6. Nuevamente, calculamos primero E(X 2 ), pero ahora usamos la propiedad que permite obtener el valor esperado de una función de una variable aleatoria continua: 1500 2500 2 2 2 E(X ) = x2 f (x) dx x f (x) dx = x f (x) dx + 0 R X = X 1500 1500 X 0,0008x )dx 1500 0 2500 0,0008x + )dx x2 (0,002 − 1000 1500 x2 ( = 675 000 + 1 366 666,7 = 2 041 666,7. 2 = E(X 2 ) − µ2 = 3 408 333,4 − (1333,3333)2 = 26 3889,0201 Ası́, σX X y σX = 513,70. En resumen, el ingreso medio del sector es de 1 333,33 soles y la desviación promedio de los ingresos entorno de esta media es de 513,7 soles. 4.4.1. Propiedades de la varianza La varianza tiene, entre otras, las propiedades siguientes: 1. Si a y b son constantes, entonces V (a + bX) = b2 V (X). 2. Desigualdad de Chebyshev: Si X es una variable aleatoria, entonces, para cualquier k > 0 se cumple que: 1 P (| X − µX | ≤ kσX ) ≥ 1 − 2 k 149 Profesor José Flores Delgado Estadı́stica o, equivalentemente: P (| X − µX | > kσX ) < 1 k2 Observación 4.11. De la desigualdad anterior, se deduce que la proporción de veces con la cual la variable asume valores que disten de la media en más de tres veces la desviación estándar es menor que un noveno. Por tal razón, a los valores que distan de la media en más de tres veces la desviación estándar se les puede llamar valores “poco frecuentes o inusuales”. 4.5. Función de distribución acumulada Definición 4.7. Si X es una variable aleatoria, discreta o continua, se define su función de distribución acumulada, FX , mediante: FX (x) = P (X ≤ x), para cada x ∈ R. Luego, recordando cómo se obtienen las probabilidades a través de la ley o distribución de probabilidades de X, f (x), se tiene que: X FX (x) = f (y); y≤x x f (y) dy; −∞ si X es discreta. X si X es continua. X Ejemplo 4.16. En el contexto del ejemplo 4.6, en el que el ingreso en soles en un sector se considera una variable aleatoria continua, X, con densidad: si 0 ≤ x < 1500. 0,0008x/1500, f (x) = 0,002 − 0,0008x/1000, si 1500 ≤ x ≤ 2500. 0, si x ∈ / [ 0; 2500 ]. 150 Profesor José Flores Delgado Variable aleatoria Obtengamos la distribución acumulada F (x) = P (X ≤ x) = x f (y) dy : −∞ Si 0 < x ≤ 1500 : F (x) = P (X x 0 ≤ x) = 8 (0,0008y/1500)dy = x10−7 x2 . 3 x fX (y) dy = 0 Si 1500 ≤ x ≤ 2500 : 2500 fX (y) dy F (x) = P (X ≤ x) = 1 − P (X > x) = 1 − x =1− 2500 x (0,002 − 0,0008y/1000) dy = 0,002x − 4x10−7 x2 − 1,5. 0, si x < 0. 8 x10−7 x2 , si 0 ≤ x < 1500. 3 ⇒ F (x) = 0,002x − 4x10−7 x2 − 1,5, si 1500 ≤ x ≤ 2500. 1, si x > 2500. Ahora veamos dos casos que ilustran cómo la distribución acumulada facilita el cálculo de las probabilidades: 151 Profesor José Flores Delgado Estadı́stica a) La probabilidad de que un trabajador gane entre 1000 y 2000 es P (1000 ≤ X ≤ 2000) = F (2000) − F (1000) = 0,002(2000) − 4x10−7 (2000)2 − 1,5 − 83 x10−7 (1000)2 = 0,6333 Ası́, el 63,33 % de los trabajadores de este sector gana entre entre 1000 y 2000 soles. b) La probabilidad de que un trabajador gane más que el ingreso promedio (1333,33) es P (X > 1333,33) = 1 − F (1333,33) = 1 − 83 x10−7 x2 = 0,4741. 2500 1500 0,0008x Con la densidad P (X > 1333,33) = f (x)dx = 1500 dx + 1333,33 1333,33 2500 0,002−0,0008x dx; 100 1500 con el complemento y la densidad P (X > 1333,33) = 1 − P (X ≤ 1333,33) = 1 − 1 − 0,5259 = 0,4741. 0 1333,33 0,0008x 1500 dx = 4.6. Propiedades de la distribución acumulada La función de distribución acumulada tiene las propiedades siguientes: 1. La distribución acumulada es siempre creciente, y, si la variable es continua y su rango es un intervalo, entonces es estrictamente creciente sobre este intervalo. 152 Profesor José Flores Delgado Variable aleatoria 2. F es siempre continua por la derecha, es decir, lı́m F (y) = y → x+ F (x). Además, el conjunto de puntos en los que presenta discontinuidad es enumerable y estos solo son aquellos que tienen probabilidad positiva, pues se cumple que para cada x: lı́m F (y) = F (x) − P (X = x) y→x− 3. P (a ≤ X ≤ b) = F (b) − F (a) + P (X = a). En particular, si X es continua, P (a ≤ x ≤ b) = F (b) − F (a). 4. Si X es continua con densidad continua, F (x) = f (x). 5. Si X es discreta y rango, digamos, RX = { a1 , a2 , . . . }, con a1 < a2 < . . . , entonces, para i > 1, f (ai ) = P (X = ai ) = F (ai ) − F (ai−1 ). Observación 4.12. Las dos últimas propiedades establecen que la distribución acumulada identifica al modelo o distribución de probabilidades. 4.7. Técnica del cambio de variable Sean X e Y dos variables aleatorias, con Y una función de X. En algunos casos, se puede deducir el modelo probabilı́stico de Y a partir del modelo de X. Una técnica para hacerlo se detalla a continuación: a) Si Y es discreta f (y) = P (Y = y). Para hallar esta Y probabilidad, se expresa el evento Y = y en términos de X; hecho esto, se obtiene la probabilidad con el modelo de X. 153 Profesor José Flores Delgado Estadı́stica b) Cuando Y es continua f (y) = P (Y = y) = 0; ası́, lo explicado Y en la parte anterior no es útil. En este caso, primero, se determina la función de distribución acumulada de Y, a partir de F (y) = P (Y ≤ y). Es decir, se expresa el evento Y ≤ y en Y términos de X. Una vez hecho esto, se expresa la probabilidad P (Y ≤ y) en términos de la distribución acumulada de X. Obtenida FY , se deriva para obtener f (y) (esto último por una Y propiedad dada para los modelos de las variables continuas). Ejemplo 4.17. Si la función de distribución (o modelo probabilı́stico) de la variable aleatoria positiva X está dada por fX (x) = 2 e−2x , x > 0, determinemos la función de densidad de la variable Y = 4X. Para esto, no basta reemplazar x = y/4 en fX (x), como podrı́amos pensar, pues el modelo probabilı́stico no es solo una función matemática. Además de ello, determina probabilidades y otras cantidades relacionadas con la variable aleatoria (recuerde la definición). Como Y es continua, primero, debemos determinar FY a partir de FX : FY (y) = P (Y ≤ y) = P (4X ≤ y) = P (X ≤ y/4) = FX (y/4). Es decir, FY (y) = FX (y/4), luego se obtiene la derivada respecto de y: fY (y) = Dy FY (y) = [ FX (y/4) ] Dy (y/4) = [ fX (y/4) ] 14 = 2 e−2y/4 41 = 12 e−y/2 , y > 0. 154 Profesor José Flores Delgado Variable aleatoria Ejemplo 4.18. Sea X una variable aleatoria positiva, cuya función de probabilidad (o modelo probabilı́stico) está dada por fX (x) = x/210, para x = 1, . . . , 20. Sigamos la técnica antes descrita para determinar la función de la variable Y = 2X. Como Y es discreta: fY (y) = P (Y = y). Además, P (Y = y) = P (2X = y) = P (X = y/2) = fX (y/2). Ası́, fY (y) = fX (y/2) = y/420, para y = 2, 4, . . . , 40. 155 Profesor José Flores Delgado Estadı́stica 4.8. Ejercicios propuestos Ejercicio 4.1. El precio de una unidad del bien A varı́a en el conjunto { 1; 2; 3; 4 }. Lo mismo ocurre con el precio del bien B, pero, además, el de B nunca es mayor que el de A. a) Interesa observar simultáneamente los precios unitarios de cada bien. Determine, por extensión, un conjunto que describa el espacio muestral asociado. b) Considere el espacio muestral anterior y la variable aleatoria X definida como el gasto total al comprar una unidad de cada bien. b1 ) Determine el evento (del espacio muestral) asociado con X = 4. b2 ) Determine el evento asociado con X = 3. b3 ) Determine el evento asociado con X = 8. b4 ) Halle el rango de X. b5 ) Si se considera la probabilidad clásica, halle P (X = 4). b6 ) Si se considera como modelo probabilı́stico de X a la función definida por f (x) = x2 /203, halle P (X ≥ 3). Ejercicio 4.2. Cierto productor fabrica un bien cuya demanda semanal, en toneladas, es una variable aleatoria X, con rango entre 0 y 10 toneladas, y función de densidad f (x) = x/50, x ∈ RX . Cada tonelada tiene un costo de producción de 10 mil soles y un precio de venta de 25 156 Profesor José Flores Delgado Variable aleatoria mil soles. Suponga que, en cierta semana, el productor decide fabricar cinco toneladas. a) ¿Cuál es la probabilidad de satisfacer la demanda? b) ¿Cuál es la probabilidad de que se satisfaga la demanda y, al mismo tiempo, el productor gane más de 30 mil soles? c) ¿Cuál es la probabilidad de que la demanda no sea satisfecha? d) ¿Cuál es la probabilidad de que la demanda no sea satisfecha y, al mismo tiempo, el productor gane más de 30 mil soles? e) ¿Cuál es la probabilidad de que el productor gane más de 30 mil soles? f) Determine la producción semanal que maximiza la utilidad esperada. Ejercicio 4.3. Sea X una variable aleatoria con rango { 1, . . . , 20 }. Determine el modelo probabilı́stico si este es constante en el rango de la variable. Ejercicio 4.4. El número de automóviles que contaminan el ambiente cada minuto es una variable aleatoria, X, cuyo modelo probabilı́stico está dado −2 x por f (x) = e x!2 , x = 0, 1, . . . a) Determine la probabilidad de que, en un minuto, no circulen automóviles que contaminen el ambiente. b) ¿Cuál es la probabilidad de que, en un minuto, circulen más de un automóvil que contamine el ambiente? 157 Profesor José Flores Delgado Estadı́stica Ejercicio 4.5. Considere los 55 datos siguientes: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 2, 3, 4, 5, 6, 7, 8, 9, 10, 4, 5, 6, 7, 8, 9, 10, 4, 5, 6, 7, 8, 9, 10, 4 5, 6, 7, 8, 9, 10, 7, 8, 9, 10, 7, 8, 9, 10, 7 8, 9, 10, 9, 10, 9 a) Encuentre la proporción de veces que ocurre cada uno de los valores anteriores y la media de estos datos, e indı́quelas en la tabla siguiente: x 1 2 3 4 5 6 7 8 9 10 p̄ b) Asuma que los valores dados correspondan a una muestra aleatoria de la variable aleatoria X cuyo modelo probabilı́stico está dado por f (x) = x/55. Use este modelo para completar la tabla siguiente: x 1 2 3 4 5 6 7 8 9 10 P (X = x) c) Diga si los resultados obtenidos en las partes anteriores están en armonı́a. Emplee la Ley Fuerte de los Grandes Números. 158 Profesor José Flores Delgado Variable aleatoria d) Obtenga X̄ (la media de la muestra de estos 55 datos) y E(X) (el valor esperado de X); luego, diga si los resultados obtenidos están en armonı́a con la Ley Fuerte de los Grandes Números. Ejercicio 4.6. Sea X una variable aleatoria continua que puede tomar cualquier c valor y modelo probabilı́stico dado por f (x) = 1+x 2 . a) Determine el valor de la constante c. b) Halle P (X > 0). c) Demuestre que esta variable aleatoria no tiene valor esperado. Ejercicio 4.7. El ahorro de los habitantes de una ciudad (medido en miles de soles) es considerado una variable aleatoria continua, X, cuyo modelo probabilı́stico está determinado por la regla f (x) = x2 /9, 0 ≤ x ≤ 3. a) Según este modelo probabilı́stico, ¿qué porcentaje de los habitantes de esta ciudad ahorran más de mil soles? b) Según este modelo probabilı́stico, ¿cuál es el ahorro promedio de los habitantes de esta ciudad? c) Según las autoridades, el consumo de los habitantes de la ciudad, en función del ahorro, está dado por 1 + 4 X. Si esto es ası́, halle el consumo promedio. d) Suponga que las autoridades han estimado un impacto en la economı́a igual a 1000X 2 . Si es ası́, halle el valor esperado de este impacto. 159 Profesor José Flores Delgado Estadı́stica Ejercicio 4.8. Cierto productor fabrica un bien cuya demanda semanal, en kilogramos, es una variable aleatoria X con densidad f (x) = 0,002e−0,002x , x > 0. Cada kilogramo producido le cuesta 100 soles y lo vende a 250 soles. Toda cantidad que no logra vender se pierde sin generar un costo adicional al de su fabricación. Suponga que, cierta semana, el productor decide fabricar 500 kilogramos. a) ¿Cuál es la probabilidad de satisfacer la demanda? b) ¿Cuál es la probabilidad de que se satisfaga la demanda y, al mismo tiempo, el productor gane más de 50 mil soles? c) ¿Cuál es la probabilidad de que la demanda no sea satisfecha? d) ¿Cuál es la probabilidad de que la demanda no sea satisfecha y, al mismo tiempo, el productor gane más de 50 mil soles? e) ¿Cuál es la probabilidad de que el productor gane más de 50 mil soles? Ejercicio 4.9. Sea X una variable aleatoria discreta cuyos valores y probabilidades correspondientes se muestran en la tabla siguiente: x -2 0 2 P (X = x) 1/4 1/2 1/4 a) Halle P (X = 0). b) Determine el valor esperado de X. 160 Profesor José Flores Delgado Variable aleatoria c) Determine el valor esperado de X 2 . ¿No deberı́a cumplirse que E(X 2 ) = [ E(X) ]2 ? d) Determine el valor esperado de 5 + 6X. Ejercicio 4.10. Se realizarán cinco inversiones; se sabe que, por lo menos, una resultará exitosa. Sea X la variable aleatoria definida como la cantidad de inversiones que resulten exitosas. El modelo probabilı́stico de esta variable está determinado por f (x) = c 2−x , x ∈ RX , con c una constante. a) Determine el rango de la variable aleatoria X. b) ¿Cuál es el valor de la constante c? c) Halle la probabilidad de que más de 3 inversiones resulten exitosas. d) Halle la probabilidad de que más de 2 inversiones resulten exitosas. e) Halle el valor esperado del número de inversiones que resulten exitosas. f) Cada inversión tiene un costo de 100 soles; si la inversión resulta exitosa, se gana 200 soles, pero, si no resulta exitosa, se pierde 150 soles. Obtenga el valor esperado de de la utilidad que generará realizar estas 5 inversiones. g) Halle el valor esperado de la razón existente entre el número de inversiones que no resulten exitosas y el número de inversiones que resulten exitosas. 161 Profesor José Flores Delgado Estadı́stica Ejercicio 4.11. Sea X una variable aleatoria que puede asumir cualquier valor positivo y función de densidad dada por f (x) = β e−β x , x > 0, con β > 0. a) Verifique que, en efecto, f determina un modelo probabilı́stico. b) Demuestre que P (X > t + h / X > t) = P (X > h), ∀h > 0, ∀t > 0. Ejercicio 4.12. La distribución de los ingresos, X, de los trabajadores en cierto sector laboral está determinada por la función de densidad definida entre 0 y 10 mil soles, y cuya gráfica se muestra en la figura siguiente: Suponga que un impuesto de solidaridad es implantado en este sector: los que ganan menos de 2000 soles quedan exonerados; los que ganen entre 2000 y 3000 soles pagarán 10 soles; los que ganen más de 3000, pero menos de 8000 pagarán 15 soles; y los que ganen más de 8000 soles pagarán 20 soles. a) Halle el porcentaje de los trabajadores cuyos ingresos están entre 2000 y 4000 soles. b) ¿Qué porcentaje de trabajadores tendrá sus ingresos gravados con el impuesto? 162 Profesor José Flores Delgado Variable aleatoria c) ¿Qué porcentaje de trabajadores deberá pagar más de 15 soles? d) Determine el monto promedio que se pagará por este impuesto. Hágalo con el modelo de X. Luego, use el modelo probabilı́stico de la variable aleatoria Y, definida como el monto pagado por trabajador debido al impuesto. Ejercicio 4.13. El tiempo (en años) hasta la ocurrencia de cierto evento catastrófico se considera una variable aleatoria continua, X, con modelo probabilı́stico dado por: f (x) = 2 x/25 , 0 ≤ x ≤ 5. a) Halle P (1 < X < 2). b) ¿Cuál es la probabilidad de que dicho evento ocurra después de 2 años? c) Si ya hace un año que no ocurre tal evento, determine la probabilidad de que pasen más de 2 años más. d) Una persona adquiere una póliza contra este tipo de evento que cuesta 1000 soles. El contrato de la póliza estipula que esta vale solo por un año y cubre solamente la primera vez que ocurra el evento, de modo que, si el evento ocurre en este perı́odo, la compañı́a aseguradora le pagará una suma indemnizatoria de 3 mil soles, pero no lo volverá hacer si ocurriera nuevamente el evento. d1 ) Determine la probabilidad de que la aseguradora gane 2 mil soles. d2 ) Determine la utilidad esperada de la aseguradora. 163 Profesor José Flores Delgado Estadı́stica Ejercicio 4.14. En cierta región, se tomó una muestra aleatoria de 100 habitantes y se registró el ingreso mensual de cada uno (en miles de soles). Los resultados obtenidos se resumen en la tabla siguiente: Ingso. men. Número de habitantes [ 0, 1 [ 6 [ 1, 2 [ 19 [ 2, 3 [ 33 [ 3, 4 [ 31 [ 4, 5 ] 11 Para realizar inferencias sobre los ingresos en la región entera, se decidió considerar al ingreso mensual (en miles de soles) de sus habitantes como una variable aleatoria continua, X, con valores en el intervalo [0, 5] y modelo probabilı́stico dado por 2 15 x, si 0 ≤ x ≤ 3. 1 f (x) = 1 − 5 x, si 3 < x ≤ 5. 0, en otro caso. a) Use el modelo considerado para calcular la proporción de habitantes en la región completa que ganan hasta 3 mil soles. b) Diga si los valores observados (mostrados en la tabla anterior) parecen estar en armonı́a con el modelo probabilı́stico considerado. Haga los cálculos que considere necesarios, de modo que pueda sustentar su respuesta con estos y la Ley Fuerte de los Grandes Números (aplicada a proporciones de muestras). c) Halle E(X). d) Interprete el valor obtenido en la parte anterior según este contexto. 164 Profesor José Flores Delgado Variable aleatoria e) Para tomar en cuenta solo los ingresos de quienes ganan hasta 3 mil soles, se considera la función siguiente: x, si 0 ≤ x ≤ 3. g(x) = 0, si 3 < x. Use esta función y el modelo probabilı́stico de X para hallar el ingreso promedio de quienes ganan hasta tres mil soles. Luego, calcule qué proporción representa este promedio obtenido respecto del ingreso promedio en la región entera (también obtenido con el modelo) f) Un especialista afirma que el ingreso total de esta región se distribuye desigualmente entre sus habitantes. Explique si las proporciones obtenidas en las partes a y e reflejan esta afirmación. g) El gasto en alimentos de los habitantes de esta región está dado por 1 + 21 X. Determine el gasto promedio en alimentos en esta región. Ejercicio 4.15. En el contexto del ejercicio 3.27 del capı́tulo de probabilidad, halle el rango, la función de probabilidad, el valor esperado y la desviación estándar de la variable, X, definida como el número de años (del perı́odo considerado) en los que la demanda es muy baja. Generalizar el ejercicio para un perı́odo de n años. Ejercicio 4.16. Suponga que la proporción diaria de veces que ciertos comerciantes evaden la entrega de una boleta de pago es una variable aleatoria 165 Profesor José Flores Delgado Estadı́stica con función de densidad f (x) = 6x(1 − x), 0 ≤ x ≤ 1. Una muestra aleatoria de 100 comerciantes fue supervisada durante un dı́a y se registró, para cada uno de estos, la proporción diaria de evasiones: Prop. de eva. Comer. [ 0, 0,2 [ 9 [ 0,2, 0,4 [ 26 [ 0,4, 0,6 [ 30 [ 0,6, 0,8 [ 25 [ 0,8, 1 ] 10 a) Determine la probabilidad que corresponde a cada uno de los intervalos de la tabla anterior según el modelo dado; luego, diga si estas probabilidades y los datos de la tabla están en armonı́a con la Ley Fuerte de los Grandes Números (comente). b) Determine e interprete el valor esperado de la proporción diaria de evasión por comerciante. Ejercicio 4.17. El tiempo (en años) hasta la ocurrencia de cierto evento catastrófico puede considerarse como una variable aleatoria continua con función de densidad f (x) = 0,1e−0,1x , x > 0. a) ¿Cuál es la probabilidad de que pasen más de 2 años hasta la ocurrencia de dicho evento? b) Si ya hace un año que no ocurre tal evento, determine la probabilidad de que pasen más de 2 años todavı́a. c) ¿Encuentra extraños los resultados obtenidos en las partes anteriores? Generalice estos considerando t años, en lugar de 2, y h años transcurridos en lugar de uno. 166 Profesor José Flores Delgado Variable aleatoria d) Una persona adquiere una póliza contra este tipo de evento. El contrato estipula que, si el evento ocurre antes del primer año, la compañı́a aseguradora debe pagarle una suma indemnizatoria de 3000 soles por una única vez. La póliza cuesta 5000 soles. Determine la utilidad esperada de la aseguradora. Ejercicio 4.18. Supongamos que X, la demanda diaria de un artı́culo, ha sido considerada como una variable aleatoria discreta con modelo probabilı́stico: 2x f (x) = 16 ( x! ), x = 1, 2, 3, 4. a) Antes de optar por el modelo anterior se tenı́a información de la demanda diaria correspondiente a 60 dı́as, que se resume por la distribución de frecuencias siguiente: ¿Le parece a usted que la elección de la distribución de probabilidades es coherente con esta información que se tenı́a? b) ¿Cuál serı́a la demanda diaria esperada? c) Cada artı́culo se vende por 5 soles. Cualquier artı́culo que no se vende al cabo del dı́a se desecha, lo cual genera una pérdida 167 Profesor José Flores Delgado Estadı́stica de 3 soles. El fabricante de estos artı́culos fijará su producción diaria, N, que regirá a lo largo de muchos dı́as y debe decidirlo entre uno de los valores posibles de la demanda: 1 o 2 o 3 o 4 artı́culos. ¿Cuál es su mejor decisión? Ejercicio 4.19. La cantidad mensual (en toneladas) que suele vender un comerciante se considera una variable aleatoria continua, X, con rango RX = [ 0, 5 ] y modelo probabilı́stico dado por: f (x) = 2 x/25 , 0 ≤ x ≤ 5. a) Determine la cantidad promedio que el comerciante vende mensualmente. b) Determine la desviación estándar de la cantidad mensual que vende el comerciante. c) Adquirir cada tonelada le cuesta al comerciante 1 unidad monetaria. El precio de venta por tonelada es de 3 unidades monetarias. Además, hay un costo fijo mensual de cuatro unidades monetarias. Halle el valor esperado y la varianza de la utilidad del comerciante. Ejercicio 4.20. El ingreso mensual (en miles de soles) de las familias de cierta región es una variable aleatoria continua, X, con rango el intervalo [0; 2], y función de densidad f (x) = 1 − 12 x, 0 ≤ x ≤ 2. Para tomar en cuenta solo los ingresos de las familias que ganan hasta y miles de soles, con 0 ≤ y ≤ 2, se considera la función g cuya regla de correspondencia es la siguiente: x, si 0 ≤ x ≤ y; g(x) = 0, si x > y. 168 Profesor José Flores Delgado Variable aleatoria a) Halle h(y) = E(g(X)) : el ingreso promedio de quienes ganan hasta y miles de soles. h(y) : la proporción del ingreso promedio E(X) de quienes ganan hasta y miles de soles, respecto al ingreso promedio en la región, 0 ≤ y ≤ 2. c) Halle el Coeficiente de Gini: 1 − 2E Φ(X) . b) Halle Φ(y) = d) Bosqueje la Curva de Lorenz, es decir, la formada por los pares (F (x), Φ(x)). Concluya comparándola con la situación de distribución sin desigualdad. Ejercicio 4.21. Para el estudio de la distribución de los ingresos de cierta región, se decidió considerar al ingreso mensual (en miles de soles) de las familias de esta región como una variable aleatoria continua, X, con valores en el intervalo [0, 8] y modelo probabilı́stico determinado por la función de distribución acumulada siguiente: F (x) = 14 x − 1 2 64 x , si 0 ≤ x ≤ 8. a) Use solo F para obtener la probabilidad P (2 < X ≤ 4). b) Halle f : el modelo probabilı́stico de X. c) Halle E(X) e interprételo en este contexto. d) Para tomar en cuenta solo los ingresos de las familias que ganan hasta y miles de soles (0 ≤ y ≤ 8), se considera la función g, con la regla de correspondencia siguiente: x, si 0 ≤ x ≤ y, g(x) = 0, si x > y. 169 Profesor José Flores Delgado Estadı́stica d1 ) Halle h(y) = E(g(X)). h(y) , para 0 ≤ y ≤ 8. ¿Qué representa d2 ) Se define Φ(y) = E(X) Φ(y)? d3 ) Obtenga Φ(y) (para 0 ≤ y ≤ 8). d4 ) Haga un bosquejo de la Curva de Lorenz, es decir, de la curva formada por los pares (F (y), Φ(y)). Concluya. d5 ) Halle el Coeficiente de Gini: 1 − 2E Φ(X) . Ejercicio 4.22. Sea X una variable aleatoria continua tal que P (X > 1) = 0,2. Sea la variable aleatoria Y tal que Y = 1, si X > 1, e Y = 0, si X 1. Determine el valor esperado de la variable Y. Ejercicio 4.23. El número de semanas, X, en las que una inversión es de alto riesgo, durante cierto perı́odo de 8 semanas, tiene como modelo c(5)x probabilı́stico a la función dada por f (x) = , x ∈ RX . También x! se sabe que, por lo menos en una semana (de este perı́odo), la inversión es de alto riesgo, pero no en todas las semanas será ası́. a) Determine el rango de la variable aleatoria X. b) ¿Cuál es el valor de la constante c? c) Determine la probabilidad de que, en más de la mitad de las semanas (de este perı́odo), la inversión sea de alto riesgo. d) Determine la probabilidad de que, en más de dos de las semanas (de este perı́odo), la inversión sea de alto riesgo. 170 Profesor José Flores Delgado Variable aleatoria e) Halle el número promedio de semanas en las que la inversión será de alto riesgo. f) Cuando la inversión es de alto riesgo, la pérdida en la semana es de 400 um, mientras que, cuando no lo es, se obtiene una ganancia semanal de 500 um. Obtenga el valor esperado de la utilidad semanal. g) Determine el valor esperado de la proporción existente entre el número de semanas en las que la inversión es de alto riesgo y el número de semanas en las que no lo es. Ejercicio 4.24. Sea X una variable aleatoria con media 14 y desviación estándar 2. a) Halle la media y la varianza de Y = 1 2 X − 6. b) Halle las constantes a y b para que la transformación de X : Y = a + bX tenga una media de 50 y una desviación estándar de 10. c) Use la desigualdad de Chebychev para tener una idea de cómo es el valor de la probabilidad P (6 ≤ X ≤ 22). d) Use la desigualdad de Chebychev para tener una idea de cómo es el valor de la probabilidad P (6 ≤ X ≤ 20). e) Use la desigualdad de Chebychev para tener una idea de cómo es el valor de la probabilidad P (8 ≤ X ≤ 22). Ejercicio 4.25. Un psicoterapeuta que se especializa en problemas de autoestima ha registrado el tiempo necesario que necesitan sus pacientes para 171 Profesor José Flores Delgado Estadı́stica revertir este problema. Ası́, ha determinado que esta variable puede considerarse continua, con un rango de valores entre 0,5 y 4,5 meses, y función de densidad f (x) = x/10, 0,5 ≤ x ≤ 4,5. a) Un alumno con problemas de autoestima inicia su terapia un mes antes de sus exámenes finales. ¿Cuán probable es que este tiempo sea suficiente para revertir su problema antes de dichos exámenes? b) Determine e interprete el valor esperado del tiempo que necesitan los pacientes para revertir este problema. c) El costo de la terapia (en soles) puede considerarse como una variable, Y, que depende del tiempo necesario para revertir este problema, X, como sigue: Y = 400, 600, 1000, 2000, si si si si 0,5 ≤ X ≤ 1. 1 < X ≤ 2. 2 < X ≤ 3. 3 < X ≤ 4,5. Determine e interprete el valor esperado del costo de la terapia. Use el modelo probabilı́stico de X y, luego, el de Y. Ejercicio 4.26. La demanda de cierto producto es una variable aleatoria discreta, X, con valores posibles entre 0 y 100 unidades y función de distribución acumulada: FX (x) = x(x + 1) , x ∈ { 0, 1, . . . , 100 }. 10 100 172 Profesor José Flores Delgado Variable aleatoria La utilidad del fabricante del producto, en función de la demanda y en miles de soles, está dada por: 20X − 850, para X = 0, 1, . . . , 80. g(X) = 750, para X = 81, 82, . . . , 100. a) Determine la probabilidad de que el productor obtenga por lo menos 160 mil soles, pero menos de 750 mil. b) Determine la media de la utilidad del productor. c) Halle la función de probabilidad de la variable aleatoria Y = g(X). d) Emplee la definición de valor esperado y el resultado anterior para determinar la media pedida en la parte b. Ejercicio 4.27. Tres pacientes inician un tratamiento que durará un mes. Sea X el número de estos pacientes que estarán curados al cabo del mes. Suponga que el modelo probabilı́stico para esta variable está dado 1 por: f (x) = 27 40 3x , x = 0, 1, 2, 3. a) Determine el valor esperado del número de pacientes que estarán curados al cabo del mes. b) Determine la desviación estándar del número de pacientes que estarán curados al cabo del mes. c) El costo por paciente que se recupere al cabo del mes es de 3 unidades monetarias. Cada paciente que no se recupera al cabo del mes origina un costo adicional de una unidad monetaria. 173 Profesor José Flores Delgado Estadı́stica Además, hay un costo fijo de 2 unidades monetarias. Halle el valor esperado y la desviación estándar del costo total. Ejercicio 4.28. Al invertir una cantidad en una operación financiera, se obtiene una tasa de rentabilidad, X, modelada por la función de densidad siguiente: x + c, si − 1 ≤ x < 0. f (x) = d − x, si 0 ≤ x ≤ 1. con c y d constantes. Además, en tres de cada ocho inversiones, se gana, pero menos del 50 % de lo invertido. a) Determine las constantes c y d. b) Determine la probabilidad de que la rentabilidad esté entre 0,3 y 0,7. c) Halle el valore esperado de la rentabilidad. d) Suponga que, al invertir en esta operación, se quiere que, en el peor de los casos, se pierda una fracción r de lo invertido. Determine el valor r para que lo anterior suceda con una probabilidad de 0,95. Este valor r se conoce como el valor en riesgo (VaR) que tiene una confianza del 95 %. Note que si c0 es la cantidad invertida y cf es la cantidad al final de la inversión; c − c0 entonces, X = f . Si X > 0 : se gana; y si X < 0 : se c0 pierde. Ejercicio 4.29. 174 Profesor José Flores Delgado Variable aleatoria Sea X una variable aleatoria continua, con rango RX = [ 0, 5 ] y modelo probabilı́stico dado por f (x) = 2 x/25 , 0 ≤ x ≤ 5. Halle E g(X) si g(x) = 10x, 0 ≤ x ≤ 2 y g(x) = −5x, 2 < x ≤ 5. Ejercicio 4.30. Una municipalidad verificará si las tiendas de su distrito cumplen una ordenanza dictada recientemente. Con este fin, se escogerá una muestra aleatoria de 20 tiendas. La cantidad de tiendas en la muestra que será seleccionada que incumplan la ordenanza es una variable aleatoria, X, cuya función de probabilidad está dada por f (x) = x/210, x = 0, 1, . . . , 20 . a) Determine la probabilidad de que, por lo menos, cinco de las tiendas de la muestra por seleccionar incumplan la ordenanza. b) Determine e interprete el valor esperado del número de tiendas en la muestra por seleccionar que incumplan la ordenanza. c) Suponga que inspeccionar cada tienda de la muestra seleccionada costará 500 soles. Además, cada detección originará un descuento de 500 soles en el costo, pues esta cantidad será pagada por el propietario de la tienda que incumpla la ordenanza, pero cada tienda seleccionada que cumpla la ordenanza originará un costo adicional de 250 soles, pues el propietario de la tienda recibirá un descuento en sus tributos por este valor. El presupuesto para llevar a cabo este muestreo es de 12 750 soles. c1 ) Cuantifique la confianza de este presupuesto para poder llevar a cabo el muestreo. c2 ) Determine e interprete el valor esperado del costo para llevar a cabo el muestreo. 175 Profesor José Flores Delgado Estadı́stica Ejercicio 4.31. El número de unidades defectuosas que se pueden encontrar en un lote de artı́culos corresponde a una variable aleatoria X cuya distribución acumulada es la siguiente: 0, si x<0 0,75, si 0 ≤ x < 1 0,85, si 1 ≤ x < 2 F (x) = 0,925, si 2 ≤ x < 3 0,975, si 3 ≤ x < 4 1, si x≥4 a) Use F solamente, sin obtener la función de probabilidad asociada f, para obtener las probabilidades de los eventos siguientes: i) No encontrar unidades defectuosas en el lote. ii) Encontrar, como máximo, 3 unidades defectuosas en el lote. iii) Encontrar, por lo menos, 1 unidad defectuosa, pero máximo 3. b) Determine el número promedio de unidades defectuosas. Ejercicio 4.32. El fabricante de cierto producto debe decidir la cantidad ‘t’ de toneladas que debe fabricar mensualmente. Por estudios de mercado realizados por el fabricante sobre la demanda para el mes siguiente, se llegó a establecer que la demanda proyectada debe considerarse una variable aleatoria continua, que puede asumir valores entre 0 y 10 176 Profesor José Flores Delgado Variable aleatoria toneladas y función de densidad f (x) = x/50, 0 ≤ x ≤ 10. El costo de fabricación y el precio de venta proyectados por cada tonelada del producto son 10 mil y 20 mil soles, respectivamente. Además, el estudio de mercado le costó al fabricante 50 mil soles y, naturalmente, deberá incluirlo en sus costos. a) Suponga que el fabricante decidiera producir una cantidad t igual a 8 toneladas. ¿Cuál serı́a la probabilidad de que gane menos de 10 mil soles? b) Determine el valor, t, que debe producir el fabricante para maximizar su utilidad esperada. Ejercicio 4.33. El estudio de la demanda de un bien para el perı́odo de los próximos tres años (1, 2 y 3) determinó que esta podrı́a ser muy baja en cualquiera de estos años, de manera independiente y con una probabilidad de un décimo. Las decisiones que se deben tomar dependen de la variable aleatoria X, definida como la cantidad de años (de este perı́odo) en los que la demanda será muy baja. a) Determine la probabilidad de que, en los 3 años de este perı́odo, la demanda del bien sea muy baja. b) Determine la probabilidad de que, solo en 2 de los años de este perı́odo, la demanda del bien sea muy baja. c) Halle RX , el rango de la variable aleatoria X. d) Determine fX , el modelo probabilı́stico de la variable X. Sugerencia: considere los eventos Ai : la demanda será muy baja en el año i; i = 1, 2 y 3. 177 Profesor José Flores Delgado Estadı́stica e) Halle el valor esperado de la cantidad de años (de este perı́odo) en los que la demanda será muy baja. f) La utilidad de cierta inversión (en miles de soles) es una función g(X), con si x = 0. 1000, g(x) = 1000 − 200x, si x = 1 o 2. 1000 − 400x, si x = 3 o 4. Determine el valor esperado de esta utilidad. Ejercicio 4.34. En cierta inversión, la utilidad generada es una variable aleatoria, X, con valores entre 6,5 y 7,5 miles de soles y función de densidad dada por: 57 51(x − 7)2 f (x) = − ; 6,5 ≤ x ≤ 7,5. 40 10 a) Halle la probabilidad de que esta inversión genere más de 7 mil soles de utilidad. b) Una persona desea invertir de modo que su utilidad esperada sea de 7 mil soles. ¿Esta inversión cumple este requerimiento? c) Determine la probabilidad de que esta inversión genere utilidades superiores a la media. d) Determine los valores de a y b, de modo que la probabilidad de que la utilidad generada, X, esté en el intervalo [ a , b ] sea igual a 0,95. Si es posible, hágalo de tal forma que la longitud de este intervalo sea lo más pequeña posible. e) Halle e interprete la utilidad esperada. 178 Profesor José Flores Delgado Variable aleatoria Ejercicio 4.35. Se debe decidir cuál debe ser el tamaño de un lote de cierto artı́culo que debe ser adquirido. El tamaño posible del lote puede ser 100, 200 o 400 unidades. Además, en cada lote, cada unidad sin defectos genera una ganancia de 500 soles y cada unidad defectuosa origina una pérdida de 300 soles. Por otra parte, se sabe que la proporción de unidades defectuosas, por lote adquirido durante una semana, es una variable aleatoria discreta, X, cuya distribución acumulada, F, tiene la gráfica siguiente: Suponga que el tamaño del lote que se adquirirá será el mismo para un perı́odo de muchas semanas. a) Si adquieren lotes de 100 unidades, ¿cuál será la utilidad esperada por lote? b) Si adquieren lotes de 200 unidades, ¿cuál será la utilidad esperada por lote? c) Si adquieren lotes de 400 unidades, ¿cuál será la utilidad esperada por lote? d) ¿Cuál es el tamaño óptimo del lote que se debe adquirir? 179 Profesor José Flores Delgado Estadı́stica Ejercicio 4.36. La proporción de comerciantes evasores de cierto impuesto es una variable aleatoria continua, X, cuyo modelo probabilı́stico está determinado por la función: f (x) = 2,5 x, 0,1 < x < 0,9. La X pérdida para el fisco (en millones de soles) está determinada por la variable Y = 10X + 5. a) Halle la probabilidad de que la proporción de evasión sea superior a 0,3. b) Halle la probabilidad de que la pérdida del fisco esté entre 7 y 9 millones de soles. c) Determine e interprete el valor esperado de la proporción de evasión. d) Determine e interprete la desviación estándar de la proporción de evasión. e) ¿Cuál es el valor esperado de la pérdida del fisco? f) Determine, fY , la densidad de Y. g) Emplee la definición del valor esperado y el resultado anterior para determinar el valor esperado pedido en la pregunta e. Ejercicio 4.37. La demanda de cierto bien es descrita por una variable aleatoria continua X, cuya función de distribución acumulada está dada por: FX (x) = 1 − e−x − x e−x , x > 0. La utilidad de cierto comerciante (en miles de soles) es una función de la demanda: g(X), con g dada 180 Profesor José Flores Delgado por: g(x) = Variable aleatoria 1, si 0 < x ≤ 1. x, si x ≥ 1. a) Halle la probabilidad de que la demanda sea mayor que 4. b) Halle la probabilidad de que la demanda esté entre 2 y 5. c) Halle la probabilidad de que el comerciante gane entre 2 mil y 3 mil soles. d) Halle la probabilidad de que el comerciante gane entre 500 soles y 3 mil soles. e) Determine la función de densidad de X. f) Determine e interprete el valor esperado de la demanda. g) Determine la desviación estándar de la demanda. h) Determine el valor esperado de la utilidad. i) Determine la desviación estándar de la utilidad. Ejercicio 4.38. La duración, X (en horas), de un dispositivo electrónico tiene una función de distribución acumulada dada por: FX (x) = 1 − e− x/3 ; x > 0. a) Determine la probabilidad de que el dispositivo dure más de dos horas. b) Determine la probabilidad de que el dispositivo dure, máximo, una hora. 181 Profesor José Flores Delgado Estadı́stica c) Determine la probabilidad de que el dispositivo dure entre 2 y 4 horas. d) Determine la media de la duración y su desviación estándar. e) Halle la probabilidad P ( | X − µX | ≤ 2σX ). Ejercicio 4.39. Sea X es una variable aleatoria discreta con función de probabilidad dada por f (x) = 0,9 (0,1)x−1 , x ∈ N+ . Se define Y = X − 1. X a) Determine E(X). b) Determine, f , la función de probabilidad de Y. Y c) Determine E(Y ) con la función de probabilidad de X y, luego, con la de Y. Ejercicio 4.40. Sea X una variable aleatoria continua, positiva, con función de 2 distribución acumulada dada por FX (x) = 1 − e−4x , x > 0. Sea Y = X2 a) Halle P (X > 2). b) Halle P (2 ≤ X ≤ 4). c) Determine, f , la función de densidad de X. X d) Determine, F , la función de distribución acumulada de Y. Y e) Determine, f , la función de densidad de Y. Y 182 Profesor José Flores Delgado Variable aleatoria f) Determine E(Y ) con la función de densidad de Y y, luego, con la de X. Ejercicio 4.41. 2 Sea X una variable aleatoria continua tal que E(X t ) = et , ∀t ∈ R. a) Halle E(X), E(X 2 ), E(X 3 ) y V (X). b) Halle E( 2 + 3e−1 X + 4e−4 X 2 + e−9 X 3 ). Ejercicio 4.42. X es una variable aleatoria continua tal que E(X m ) = √ π 2m+1 , ∀m > 0. a) Halle E(1 + 12 X). b) Halle la varianza de X. c) Halle E(4 + √5 π X+ √2 π X2 − √3 π X 3 ). Ejercicio 4.43. Sea X una variable aleatoria con rango RX = R, media 3,5 y desviación estándar 0,25. La utilidad que genera una inversión, en función de X, está dada por: 100; 2 ≤ X ≤ 4. G(X) = −160; X < 2 ó X > 4. a) Si usa la desigualdad de Chebychev, ¿qué podrı́a concluir acerca de la probabilidad P (3 ≤ X ≤ 4) ? 183 Profesor José Flores Delgado Estadı́stica b) Según su conclusión anterior, ¿qué puede concluir acerca de la probabilidad P (2 ≤ X ≤ 4) ? c) ¿Puede asegurarse que la media de estas utilidades sea por lo menos 35? Ejercicio 4.44. Sea X una variable aleatoria continua y positiva, con función de densidad f (continua) y función de distribución acumulada F. a) Si F (x) = 1 − e−β x , x > 0 (con β > 0), demuestre que: P (X > t + h / X > t) = P (X > h), ∀ h > 0, ∀t > 0. b) Si P (X > t + h / X > t) = P (X > h), ∀ h, ∀t > 0, demuestre que: F (x) = 1 − e−β x , x > 0, con β = F (0) = f (0). Sugerencia: exprese las probabilidades anteriores en términos de F y compruebe que: F (t + h) − F (t) h h→0 F (h) = [1 − F (t)] lim + h h→0 = [1 − F (t)] F (0) , ∀t > 0. F (t) = lim + Ejercicio 4.45. Si X ∼ Pareto(1; θ); es decir, f (x) = θ x−(θ+1) , x > 1, con θ > 0. X Determine E(X) y V (X). 184 Profesor José Flores Delgado Variable aleatoria Ejercicio 4.46. El número de clientes que llegan a un cajero automático a realizar diferentes operaciones hasta el primero que realiza una transferencia hacia otra cuenta es una variable aleatoria discreta X cuya función de distribución acumulada está dada por F (x) = 1 − (0,6)x , x = 1, 2, . . . a) Halle la probabilidad de que el número de clientes que lleguen al cajero, hasta el primero que realice una transferencia hacia otra cuenta, sea mayor o igual que 2 pero menor o igual que 20. Use solo F. b) Halle P (X ≥ 4). Use solo F. c) Halle f (x) = P (X = x), x = 1, 2, . . . Ejercicio 4.47. El tiempo (medido en minutos) hasta el primer automóvil que pasa y contamina el ambiente es una variable aleatoria continua, X, cuya función de distribución acumulada está dada por F (x) = 1 − e−2x , x > 0. a) Halle la probabilidad de que el tiempo hasta el primer automóvil que pasa y contamina el ambiente esté entre 2 y 5 minutos. Use solo F. b) Halle P (X ≥ 4). Use solo F. c) Halle f (x), x > 0. Ejercicio 4.48. En el contexto del ejemplo 3.17 del capı́tulo anterior: 185 Profesor José Flores Delgado Estadı́stica a) Determine la función de distribución acumulada de la variable aleatoria, T, definida como el precio de venta total de una unidad de cada bien. Sugerencia: use la probabilidad geométrica para determinar P (T ≤ t). b) Determine la función de densidad de la variable T, definida en la parte anterior. c) Obtenga e interprete el valor esperado y la desviación estándar de T. Ejercicio 4.49. Sea X una variable aleatoria continua con función de densidad f (x) = 4x3 ,0 ≤ x ≤ 1. Considere la variable Y = 5X, halle f . X Y Use la técnica del cambio de variable descrita en la sección 4.7. Ejercicio 4.50. El modelo binomial, b(n; p), se caracteriza por la función de probabilidad siguiente: n x f (x) = p (1 − p)n−x , x = 0, 1, . . . , n, x donde n ∈ + y p ∈ (0, 1) los parámetros del modelo. Si X ∼ b(n; p) e Y = n − X, deduzca e identifique el modelo probabilı́stico de Y . m Puede ser útil recordar la identidad m m = m−m . Ejercicio 4.51. Una variable aleatoria continua y positiva, X, tiene modelo exponencial con parámetro β (con β > 0) y se denota por X ∼ exp(β).2 , si 2 Véase el ejercicio propuesto 4.11. 186 Profesor José Flores Delgado Variable aleatoria su modelo probabilı́stico está dado por f (x) = β e−β x, x > 0. X a) Si X ∼ exp(β), use la técnica del cambio de variable (descrita en la sección 4.7) para hallar e identificar el modelo probabilı́stico de Y = 17 X. Incluya los parámetros. b) Si X ∼ exp(β), halle F (x), ∀x > 0. X c) Si X ∼ exp(β), halle el modelo de Y = eX . d) Sea X como en el ejercicio 4.45, determine e identifique el modelo de Y = Ln(X). Ejercicio 4.52. Se dice que una variable aleatoria continua y positiva, X, tiene modelo gamma con parámetros α > 0 y β > 0, si su modelo probabilı́stico está dado por βα f (x) = xα−1 e−β x , x > 0; Γ(α) X ∞ donde Γ la función gamma, definida por Γ(z) = tz−1 e−t dt, z > 0. 0 Esto se denota por X ∼ G(α, β). Si X ∼ G(α, β). Use la técnica del cambio de variable (descrita en la sección 4.7) para hallar e identificar el modelo probabilı́stico de Y = 2 X. Incluya los parámetros. Ejercicio 4.53. Se dice que una variable aleatoria continua y positiva, X, tiene modelo Weibull con parámetros α > 0 y β > 0, si su modelo probabilı́stico está dado por α f (x) = β α xα−1 e−β x , x > 0. X 187 Profesor José Flores Delgado Estadı́stica Esto se denota por X ∼ W (α; β). a) Si X ∼ W (α; β), halle e identifique el modelo probabilı́stico de Y = 2 X. b) Si X ∼ exp(β), halle e identifique el modelo probabilı́stico de Y = X α. Ejercicio 4.54. Otro de los modelos probabilı́sticos importantes para variables aleatorias positivas es el Weibull generalizado. Este modelo se caracteriza por la distribución acumulada siguiente: α γ F (x) = 1 − e−βx , x>0 donde α > 0, β > 0 y γ > 0. Si X es una variable positiva que tiene este modelo, denotamos esto por X ∼ W g(α; β; γ). a) Determine las probabilidades siguientes: P (X > 5) y P (2 ≤ X < 5). b) Use la técnica del cambio de variable para hallar e identificar el modelo probabilı́stico de Y = δX, con δ > 0. Ejercicio 4.55. El modelo exponencial generalizado 3 es una extensión del modelo exponencial, definido en el ejercicio 4.51, y es otro de los modelos 3 Gupta & Kundu (1999). Theory & methods: Generalized exponential distributions. Australian and New Zealand Journal of Statistics, 41(2), 173–188. 188 Profesor José Flores Delgado Variable aleatoria importantes para variables aleatorias positivas. Este modelo se caracteriza por la distribución acumulada siguiente: α F (x) = 1 − e−βx , x > 0 donde α > 0 y β > 0. Sea X una variable positiva que tiene este modelo, denotamos esto por X ∼ expg(α; β). Use la técnica del cambio de variable para hallar e identificar el modelo probabilı́stico de Y = γX, con γ > 0. Ejercicio 4.56. Se dice que una variable aleatoria continua, X, tiene modelo normal con parámetros µ y σ 2 (con µ ∈ y σ > 0), si su modelo probabilı́stico está dado por f (x) = √ X 1 2 1 e− 2 σ2 (x−µ) , − ∞ < x < ∞. 2π σ Denotamos esto por X ∼ N (µ, σ 2 ). Si X ∼ N (µ, σ 2 ), use la técnica del cambio de variable (descrita en la sección 4.7) para hallar e identificar el modelo probabilı́stico de Y = a + b X (con a ∈ y b > 0). No olvide dar los parámetros. Ejercicio 4.57. Sea X ∼ N (µ, σ 2 ), es decir, el modelo dado en el ejercicio 4.56. Use la técnica del cambio de variable para hallar el modelo de Y = (X − µ)/σ. Tenga el cuenta el ejercicio 4.52 para reconocer el modelo obtenido anteriormente. Ejercicio 4.58. En la tabla siguiente, se muestran algunos valores de la función de distribución acumulada, F, de una variable aleatoria X : 189 Profesor José Flores Delgado x F (x) x F (x) x F (x) 1,0 0,0190 4,5 0,6577 8,0 0,9182 1,5 0,0656 5,0 0,7350 8,5 0,9409 2,0 0,1429 5,5 0,7983 9,0 0,9576 Estadı́stica 2,5 0,2424 6,0 0,8488 9,5 0,9699 3,0 0,3528 6,5 0,8882 10,0 0,9788 3,5 0,4634 7,0 0,9182 10,5 0,9929 4,0 0,5665 7,5 0,9409 Determine P (2 ≤ X ≤ 10) en cada una de las situaciones siguientes: a) el conjunto de valores posibles de X es RX =] 0; ∞ [ ; b) el conjunto de valores posibles de X es RX = { 0; 0,5; 1; 1,5; . . . ; 11,5; 12 }. Ejercicio 4.59. El fabricante de un producto ha fabricado las unidades que le son demandas en cualquiera de dos de sus fábricas, A y B. El fabricante se enfrenta al problema de continuar la producción solamente con una de las dos fábricas, considerando para la decisión el costo de producción. Resuelva este problema a partir de los supuestos siguientes: s1 ) La producción del producto tiene un costo de 5 mil soles por unidad demandada e, independientemente de la cantidad demandada, un costo fijo de 100 mil soles. s2 ) La cantidad demanda para su producción es una variable aleatoria discreta cuyos valores posibles conforman el conjunto { 0, 1, 2, 3 }. 190 Profesor José Flores Delgado Variable aleatoria s3 ) Cuando se usa la fábrica A, el modelo probabilı́stico de la cantidad demandada está dado en la tabla siguiente: x 0 1 2 3 f (x) 0,1 0,2 0,3 0,4 s4 ) Cuando se usa la fábrica B, el modelo probabilı́stico de la cantidad demandada se muestra en la tabla siguiente: x 0 1 2 3 g(x) 0,05 0,05 0,75 0,15 Justifique su solución mediante conceptos tratados en el capı́tulo. 191 5. Modelos probabilı́sticos importantes En las aplicaciones prácticas, algunas variables aleatorias se presentan con mucha frecuencia. Por tal motivo, a sus distribuciones de probabilidad se les denomina “distribuciones importantes” y son usadas como modelos probabilı́sticos para describir el comportamiento de variables que asumen sus valores de modo incierto. Estas distribuciones o variables ya han sido ampliamente estudiadas por importantes investigadores del área de las ciencias, personas que tuvieron la capacidad de entrar en la “caja negra” donde se originaban estas variables y proporcionarnos la información más relevante en un lenguaje a nuestro alcance; es decir, nos proporcionaron los supuestos básicos que las gobiernan para poder identificar más rápidamente otras variables similares, ası́ como la función matemática o ley de probabilidades que las describe. A continuación, veremos algunas de estas y empezaremos con las que se originan a partir de dos de los procesos más conocidos en probabilidad y estadı́stica: el proceso de Bernoulli y el proceso de Poisson; luego, veremos otros modelos, como el normal. 5.1. Modelos relacionados con un proceso de Bernoulli Nuestro punto de partida para tratar con un proceso de Bernoulli (y también con uno de Poisson) es un evento de interés. Sucede que, en determinado momento, por alguna razón, nuestro interés se concentra 192 Profesor José Flores Delgado Modelos probabilı́sticos importantes en un evento incierto. Por tal motivo, cuando este ocurra, podemos decir que se ha tenido éxito; ası́, podemos denominar a este evento de interés como E: “éxito”, mientras que a su complemento, como E c o F , que significará “fracaso”. En el proceso de Bernoulli, se puede decir que la observación es discreta, puesto que lo hacemos dentro de una secuencia de ensayos u oportunidades: en cada uno de ellos, puede ocurrir el evento que nos interesa o su complemento (todo lo demás que puede ocurrir). Supongamos que, en cualquier secuencia de ensayos, el evento E ocurre independientemente y con la misma probabilidad en cada ensayo. Si el proceso de observación del evento E se da bajo estas condiciones, diremos que estamos frente a un proceso de Bernoulli. Ası́, si definimos la secuencia de eventos E1 , E2 , . . . , con Ei ocurrió E en el i-ésimo ensayo, tendremos que estos eventos son independientes y con la misma probabilidad, la cual la denotamos por p, la probabilidad de éxito; los complementos de estos eventos tendrán como probabilidad a 1 − p, la probabilidad de fracaso, que será denotada por q. Ejemplo 5.1. Un producto se ofrece en venta con una promoción. El promotor de ventas está interesado en averiguar si los clientes que visitará comprarán el producto. Este visitará a muchos clientes; cada uno de estos puede comprar el producto en promoción. Cada visita origina un ensayo u oportunidad para observar si ocurre el evento de interés: que el cliente compre el producto. Entonces, si cada cliente puede comprar el producto independientemente de los demás y con la misma probabilidad, se tendrá un proceso de Bernoulli. 193 Profesor José Flores Delgado Estadı́stica Ahora, veamos los tres modelos que se generan a partir de un proceso de Bernoulli. 5.1.1. El modelo o distribución binomial En un proceso de Bernoulli, definimos X como el número de éxitos obtenidos, en n ensayos. Entonces, el modelo probabilı́stico de X es dado por n x n−x f (x) = P (X = x) = p q , x = 0,1,. . . , n. x Cuando el modelo probabilı́stico de una variable aleatoria X es de esta forma, se dice que X tiene distribución binomial con parámetros n y p. Se denotará esto por: X ∼ b(n,p). Los parámetros sirven para identificar una distribución especı́fica, dentro de una familia de distribuciones, en este caso, de la forma antes indicada. Los valores esperados son µX = np y 2 = npq σX La distribución acumulada no tiene una fórmula explı́cita particular. Ejemplo 5.2. En el contexto del ejemplo 5.1, supongamos que los registros acerca de este tipo de promociones indican que el 75 % de los clientes suele comprar el producto cuando se da esta promoción. Ası́, tenemos que la probabilidad de nuestro evento de interés (que el cliente visitado compre el producto) es P (E) = 0,75. Supongamos ahora que el promotor visite a 50 clientes. Entonces, si X es el número de clientes que comprarán el producto, tenemos que X ∼ b(50; 0,75). 194 Profesor José Flores Delgado Modelos probabilı́sticos importantes Esto se justifica porque X puede ser vista como el número de éxitos en una secuencia de 50 eventos de un proceso de Bernoulli. Siendo ası́, tenemos que la probabilidad de que x de estos clientes compren el producto es 50 f (x) = P (X = x) = (0,75)x (0,25)50−x , x = 0,1, . . . , 50. x En particular, la probabilidad de que 30 clientes compren el producto es 50 P (X = 30) = f (30) = (0,75)30 (0,25)50−30 = 0,0077. 30 La media (promedio) o valor esperado del número de clientes que comprarán el producto es µX = E(X) = np = (50)(0,75) = 37,5. ¿Entre qué valores se encontrará el grupo promedio de esta distribución? Ya sabemos que este es el grupo de datos que está entre µX ± σX . Como ya se vio, µX = 37,5. 2 = npq = (50)(0,75)(0,25) = 9,375, ası́, σ = 3,0618. Además, σX X Por lo tanto, los datos dentro del promedio estarán entre 34,4382 y 40,5618 o, equivalentemente, entre 35 y 40. Ası́, cuando se dé esta promoción y se ofrezca a 50 clientes en muchas ocasiones, observaremos con mayor frecuencia que el número de clientes que comprarán este producto estará entre 35 y 40. Obtengamos otra probabilidad, por ejemplo, la de que, a lo más, 45 de estos clientes compren el producto en promoción es P (X ≤ 45) y conviene hallarla por el complemento: 195 Profesor José Flores Delgado Estadı́stica P (X > 45) = f (46) + f (47) + f (48) + f (49) + f (50) = + + 50 (0,75)46 (0,25)50−46 + 46 50 (0,75)48 (0,25)50−48 + 48 50 50 (0,75)50 (0,25)50−50 50 (0,75)47 (0,25)50−47 47 50 49 (0,75)49 (0,25)50−49 = 0,0021. Ası́, P (X ≤ 45) = 1 − P (X > 45) = 1 − 0,0021 = 0,9979. Podemos también obtener probabilidades a partir de la distribución acumulada, pero como esta no tiene una fórmula explı́cita, debemos usar la computadora o, como era costumbre hace algún tiempo atrás, con tablas. Si usamos el Excel, podemos obtener muy rápidamente probabilidades en este contexto. Por ejemplo, la probabilidad de que más de 25, pero a lo sumo 40 clientes compren el producto es P (25 < X ≤ 40) = f (26) + · · · + f (40) = F (40) − F (25) = 0,8363 − 0,0001 = 0,8362. Se ha restado la probabilidad acumulada hasta 25, porque deseamos excluir este valor. O la probabilidad de que compren como mı́nimo 30, pero a lo sumo 45 clientes es 196 Profesor José Flores Delgado Modelos probabilı́sticos importantes P (30 ≤ X ≤ 45) = f (30) + · · · + f (45) = F (45) − F (29) = 0,9979 − 0,0063 = 0,9916. Se ha restado la probabilidad acumulada hasta 29, porque debemos incluir el valor 30. Para terminar, la probabilidad de que por lo menos 35 clientes compren el producto es P (X ≥ 35) = 1 − P (X ≤ 34) = 1 − F (34) = 1 − 0,1631 = 0,8369. Ejemplo 5.3. (modelo financiero binomial) Cada dı́a, puede llevarse a cabo una operación financiera, la cual puede resultar exitosa o fracasada. Cuando la operación es exitosa, lo cual ocurre con probabilidad 0,7, se gana una proporción de lo invertido igual a 0,02, mientras que, cuando la operación fracasa, se pierde una fracción de lo invertido igual a 0,04. El capital inicial es de 50 mil soles y, en las sucesivas operaciones, se invierte el monto que resulta de las inversiones anteriores. Además, los resultados de las operaciones financieras se asumen independientes. Por las condiciones dadas, la secuencia de operaciones realizadas originan un proceso de Bernoulli con evento de interés, E, de que la operación sea exitosa (también pudo escogerse su complemento) con probabilidad p = 0,7. En particular, X, el número de operaciones que resulten exitosas, entre n llevadas a cabo, tiene distribución binomial con parámetros n y p = 0,7, es decir, X ∼ b(n, 0,7). Esta variable X nos permite determinar cuál será el valor del capital acumulado, Y, hasta la enésima operación. En efecto, no es difı́cil verificar que: Y = 50 000(1 + 0,02)X (1 − 0,04)n−X 197 (5.1) Profesor José Flores Delgado Estadı́stica Tenemos una situación de incertidumbre, pero la formalización anterior nos permite cuantificar, mediante probabilidades, confianzas y riesgos. Por ejemplo, si la inversión de los 50 mil soles se hace con la meta de que, al cabo de 10 operaciones, se obtenga una ganancia de, por lo menos, 5 mil soles, entonces, el riesgo que se corre puede cuantificarse por la probabilidad de que el capital acumulado, al cabo de las 10 operaciones, resulte menor que 55 mil soles; es decir, la probabilidad P (Y < 55 000) que por la ecuación 5.1 dada anteriormente, equivale a P (50 000(1 + 0,02)X (1 − 0,04)10−X < 55 000) o, despejando X P (X < 8,3057) = 1 − fX (9) + fX (10) 9 10−9 + 10 (0,7)10 (0,3)10−10 = 1 − 10 9 (0,7) (0,3) 10 = 1 − 0,1493 = 0,8507 Es decir, el riesgo que corre el inversionista es bastante alto. Otro asunto de interés al respecto se encuentra en el ejercicio propuesto 5.8. 5.1.2. El modelo o distribución geométrico Definimos ahora, X, como el número de ensayos que son necesarios para conseguir el primer éxito. Entonces, el modelo probabilı́stico de X viene dado por f (x) = P (X = x) = q x−1 p, x = 1, 2, . . . Cuando el modelo probabilı́stico de una variable aleatoria X es de esta forma, se dice que X tiene distribución geométrica con parámetro p. Se denotará esto por X ∼ g(p). 198 Profesor José Flores Delgado Modelos probabilı́sticos importantes 2 = q/p2 . µX = 1/p y σX Los valores esperados son La distribución acumulada está dada por: F (x) = P (X ≤ x) = x j=1 q j−1 p = 1 − q x , x = 1, 2, . . . Ejemplo 5.4. Continuando con el evento de interés anterior, supongamos que ahora nos interese la variable X definida como el número de clientes que debe visitar el promotor hasta el primero que compre el producto. Entonces, como el proceso es de Bernoulli y X puede verse como el número de ensayos (en la secuencia de visitas) hasta lograr el primer éxito, se tiene que X ∼ g(0,75). Ası́, la probabilidad de que el primer cliente, que compre el producto, sea el x-ésimo que visite es P (X = x) = f (x) = (0,25)x−1 (0,75), x = 1, 2, . . . El valor esperado de esta variable es µX = 1/p = 1/0,75 = 4/3 = 1,333. Por lo tanto, si fueran muchas las visitas que haga el promotor y asumimos condiciones similares para cada una de estas, en promedio, en la primera visita, el cliente comprará el producto. En este caso, como la distribución acumulada tiene una fórmula explı́cita, podemos calcular muchas probabilidades usando dicha fórmula: F (x) = P (X ≤ x) = 1 − q x = 1 − (0,25)x ; x = 1, 2, . . . Por ejemplo, la probabilidad de que el primer cliente que compre el producto sea por lo menos el cuarto que visite, pero a lo más el décimo, es: P (4 ≤ X ≤ 10) = F (10)−F (3) = (1−(0,25)10 )−(1−(0,25)3 ) = 0,0156. 199 Profesor José Flores Delgado Estadı́stica Propiedad: esta es la única distribución discreta que satisface la relación: P (X > m + n / X > m) = P (X > n), ∀ m,n ∈ N+ . Esta propiedad afirma que, si ya se han realizado m ensayos sin haber obtenido un éxito, entonces, la probabilidad de que sean necesarios n ensayos adicionales para lograrlo es exactamente igual a la probabilidad que se tenı́a antes de realizar estos m ensayos. Por ello, se dice que la distribución no tiene memoria. 5.1.3. El modelo o distribución de Pascal o binomial negativa Si ahora X es el número de ensayos que son necesarios hasta conseguir el r-ésimo éxito, entonces, el modelo probabilı́stico de X viene dado por x − 1 x−r r f (x) = P (X = x) = q p , x = r, r + 1, . . . r−1 Cuando el modelo probabilı́stico de una variable aleatoria X es de esta forma, se dice que X tiene distribución de Pascal con parámetros r y p. Se denotará esto por X ∼ P s(r,p). Los valores esperados son 2 = rq/p2 . µX = r/p y σX La distribución acumulada no tiene una fórmula explı́cita particular. Ejemplo 5.5. Nuevamente en el contexto del proceso de Bernoulli de los ejemplos anteriores, sea ahora la variable X definida como el número de clientes que debe visitar el promotor hasta el tercero que 200 Profesor José Flores Delgado Modelos probabilı́sticos importantes compre el producto. Entonces, como el proceso es de Bernoulli y X puede verse como el número de ensayos hasta lograr el tercer éxito, se tiene que X ∼ g(0,75). Ası́, la probabilidad de que el tercer cliente que compre el producto sea el x-ésimo visitado es P (X = x) = f (x) = x−1 x−3 3 (0,75) , x = 3, 4, . . . 3−1 (0,25) Propiedades: a) La variable X tiene distribución geométrica con parámetro p si, y solo si, X tiene distribución de Pascal con parámetros 1 y p. b) La suma de variables independientes y cuya distribución sea geométrica tiene una distribución de Pascal. Es decir, si X1 , . . . , Xn son variables aleatorias independientes, con n distribución geométrica de parámetro p, entonces Xj tiene j=1 distribución de pascal con parámetros r = n y p. En el proceso de Poisson, se observa el evento de interés, E, en una región continua, como, por ejemplo, un intervalo de tiempo o un área, y con los supuestos siguientes: S1. La probabilidad de que ocurra E en una región de medida pequeña, ∆t, es aproximadamente igual a ω ∆t, para cierta constante positiva ω independiente de la medida de la región ∆t. S2. La probabilidad de que ocurra E más de una vez en una región pequeña es casi nula. 201 Profesor José Flores Delgado Estadı́stica S3. Las ocurrencias de E en regiones excluyentes son independientes. Si E ocurre satisfaciendo los supuestos anteriores, entonces estamos frente a un proceso de Poisson con tasa, o promedio de ocurrencias, ω por unidad de medida. Ejemplo 5.6. Hoy que comenzamos a tomar más conciencia del problema de la contaminación ambiental, podemos interesarnos en observar, durante cierto perı́odo del dı́a, los vehı́culos que pasan y contaminan el ambiente por determinada avenida. Supongamos que se cumplen los siguientes supuestos: S1. La probabilidad de que pase un vehı́culo que contamine el ambiente en una región de medida pequeña, ∆t, es aproximadamente proporcional a dicha medida, esto es, aproximadamente igual a ω∆t, para cierta constante positiva ω independiente de la medida de la región ∆t, digamos ω = 2 vehı́culos por minuto. S2. La probabilidad de que pase más de un vehı́culo que contamine el ambiente en un intervalo de tiempo muy pequeño es casi nula. S3. Las ocurrencias de las llegadas de los automóviles que contaminan el ambiente, en regiones excluyentes, son independientes. En este caso, los automóviles pasan y contaminan el ambiente según un proceso de Poisson, con una tasa de 2 automóviles por minuto. Veamos ahora las variables aleatorias y distribuciones de probabilidad que se generan a partir de un proceso de Poisson; cada una tiene su análoga en el proceso de Bernoulli. 202 Profesor José Flores Delgado 5.1.4. Modelos probabilı́sticos importantes El modelo o distribución de Poisson Si definimos X como el número de ocurrencias de E en una región de medida t, entonces, el modelo probabilı́stico de X viene dado por f (x) = P (X = x) = e−λ λx , x = 0, 1, . . . x! con λ = ωt. Cuando el modelo probabilı́stico de una variable aleatoria X es de esta forma, se dice que X tiene distribución de Poisson con parámetro λ. Se denotará esto por X ∼ P (λ). 2 = λ. µ X = λ y σX Los valores esperados son La distribución acumulada no tiene una fórmula explı́cita particular. Ejemplo 5.7. En el ejemplo 5.6, si X es el número de vehı́culos que pasan durante un perı́odo de media hora y contaminan el ambiente, entonces, X tiene distribución de Poisson con parámetro λ = ω t = 2 vehı́culos minuto × 30 minutos = 60 vehı́culos. Ası́, la probabilidad de que, durante un perı́odo de media hora, pasen x vehı́culos que contaminen el ambiente es P (X = x) = f (x) = e−60 (60)x , x = 0, 1, . . . x! En particular, la probabilidad de que, durante un perı́odo de media hora, no pasen vehı́culos que contaminen el ambiente es P (X = 0) = f (0) = e−60 (60)0 = e−60 = 8,8 × 10−27 . 0! O la probabilidad de que, durante un perı́odo de media hora, pasen entre 59 y 61 vehı́culos que contaminen el ambiente es 203 Profesor José Flores Delgado Estadı́stica P (59 ≤ X ≤ 61) = f (59) + f (60) + f (61) = e−60 (60)59 e−60 (60)60 e−60 (60)61 + + = 0,1535. 59! 60! 61! También podemos obtener probabilidades a partir de la distribución acumulada, F, la cual se obtiene con la ayuda de una computadora, por ejemplo, la probabilidad de que, durante un perı́odo de media hora, pasen entre 50 y 70 vehı́culos que contaminen el ambiente es: P (50 ≤ X ≤ 70) = f (50) + . . . + f (70) = F (70) − F (49) = 0,9098 − 0,0844 = 0,8254. Propiedades: a) Este proceso es estacionario en la región de observación en el sentido de que la distribución del número de éxitos solo depende de la medida de la región de observación y no de la parte de la región escogida para la observación. Ası́, el número de vehı́culos que pasan y contaminan el ambiente en un perı́odo de una hora deberı́a comportarse probabilı́sticamente igual si el perı́odo es de 8 a 9 de la mañana o si es de 8 a 9 de la noche. Lo que ocurre en la realidad es que, a veces, la tasa del proceso no es la misma a lo largo del tiempo; es decir, existen procesos con tasas heterogéneas. b) La distribución de Poisson puede verse como un caso lı́mite de la distribución binomial. En efecto, si el número de observaciones, n, crece indefinidamente y p tiende a cero, de modo que np tienda a λ, la distribución binomial tiende a una distribución de Poisson con parámetro λ. 204 Profesor José Flores Delgado Modelos probabilı́sticos importantes Una forma de entender la anterior propiedad es la siguiente: dividamos la región de observación en una gran cantidad, n, de partes muy pequeñas y excluyentes. Tenemos, entonces, una secuencia de n partes y el número de éxitos en la región puede obtenerse observando la cantidad de éxitos en cada una de estas partes muy pequeñas; sin embargo, por los supuestos S2 y S3, puede decirse que, en cada una de estas partes, solo puede ocurrir una o ninguna vez el evento de interés y que, además, estas ocurrencias son independientes. Por lo tanto, el número de éxitos en estas n partes muy pequeñas (que también da el número de éxitos en toda la región) sigue, aproximadamente, una distribución binomial; esto es, se estarı́a aproximando la distribución binomial a la de Poisson. 5.1.5. El modelo o distribución exponencial En el proceso de Poisson, si definimos X como la medida de la región que habrá que observar hasta que se presente el primer éxito, entonces, se puede verificar que la distribución de probabilidades de X es dada por f (x) = βe−βx ,x > 0; siendo β = ω. Cuando la densidad de una variable aleatoria X es de esta forma, se dice que X tiene distribución exponencial con parámetro β. Se denotará esto por X ∼ exp(β). A continuación, se muestran las gráficas de la densidad y de la distribución acumulada: 205 Profesor José Flores Delgado Los valores esperados son La distribución acumulada, Estadı́stica 2 = 1/β 2 . µX = 1/β y σX F (x) = P (X ≤ x) = 1 − e−βx , x > 0. x βe−βt dt = 0 Ejemplo 5.8. Nuevamente en el contexto del ejemplo 5.6, tenemos que la variable X, definida como el tiempo (en minutos) que hay que esperar hasta que pase el primer vehı́culo que contamine el ambiente, sigue una distribución exponencial con parámetro β = 2 si medimos el tiempo en minutos (recuérdese que la tasa del proceso de llegadas de los vehı́culos que contaminan el ambiente es ω = 2 vehı́culos minuto ). Ası́, su modelo probabilı́stico está determinado por la función f (x) = 2e−2x ,x > 0 y su función de distribución acumulada es dada por F (x) = 1 − e−2x , x > 0. En particular, la probabilidad de que sea necesario esperar menos de 5 minutos hasta que pase el primer vehı́culo que contamine el ambiente es P (X < 5) = P (X ≤ 5) = F (5) = 1 − e−2(5) = 0,99995. Propiedad: esta es la única distribución continua que satisface P (X > t + h / X > t) = P (X > h), ∀ h, t > 0. Según lo indicado en el caso de la distribución geométrica, se dice que la distribución no tiene memoria. Por ejemplo, si suponemos que 206 Profesor José Flores Delgado Modelos probabilı́sticos importantes la duración de una computadora tiene una distribución exponencial y si tenemos que, al cabo de dos años, esta aún no se ha malogrado, entonces, el riesgo de malograrse dentro del año siguiente serı́a el mismo que el correspondiente a cuando esta era nueva. Una interpretación que se le puede dar a esto, al parecer increı́ble, es que cuando la computadora falla se debe a causas incidentales. 5.1.6. Modelo o distribución gamma En el proceso de Poisson, si definimos ahora X como la medida de la región que se debe observar hasta que se presente el r-ésimo éxito, entonces, el modelo probabilı́stico, o función de densidad, de X es dado por f (x) = β α xα−1 e−βx , x > 0, Γ(α) con α = r, β = ω > 0 y Γ la función gamma. Cuando la densidad de una variable aleatoria X es de esta forma, se dice que X tiene distribución gamma con parámetros α y β. Se denotará esto por X ∼ G(α,β). Observación 5.1. La función gamma, Γ, se define para todo y > 0, ∞ ty−1 e−t dt. como: Γ(y) = 0 Tiene, entre otras, las propiedades siguientes: Γ(y+1) = yΓ(y); Γ(0,5) = √ π y si y es natural positivo Γ(y) = (y − 1)! La distribución gamma se extiende para todo α positivo y también se le conoce como la distribución de Pearson Tipo-III y, cuando α es un número natural, también se denomina distribución de Erlang. 207 Profesor José Flores Delgado Estadı́stica La gráfica de la densidad es como se muestra a continuación: 2 = α/β 2 . µX = α/β y σX Los valores esperados son Si el parámetro α es un número natural, la distribución acumulada tiene la forma siguiente: F (x) = 1 − α−1 j=0 e−βx (βx)j , x > 0. j! Ejemplo 5.9. Siguiendo con los ejemplos anteriores, si definimos la variable X como el tiempo (en minutos) que habrá que esperar hasta que pase el quinto vehı́culo que contamine el ambiente, tenemos que X tiene distribución gamma con parámetros α = 5 y β = 2. Podemos, por ejemplo, obtener la probabilidad de que el quinto vehı́culo que pase y contamine el ambiente lo haga luego de 4 minutos: P (X > 4) = 1 − P (X ≤ 4) = 1 − F (4) = 1 − (1 − = 0,0996. e−2(4) (2(4))j ) j! j=0 5−1 Propiedades. Este modelo tiene, entre otras, las propiedades siguientes: a) Se cumple que X tiene distribución exponencial de parámetro β, si y solo si, X tiene distribución Gamma de parámetros α = 1 y β. 208 Profesor José Flores Delgado Modelos probabilı́sticos importantes b) Si X1 , . . . , Xn son variables aleatorias independientes y con distribución exponencial de parámetro β, entonces, la suma n tiene distribución gamma: Xj ∼ G(n,β). j=1 5.2. Modelo gaussiano o distribución normal Si la densidad de una variable aleatoria X está dada por 2 f (x) = √ (x−µ) 1 e− 2σ2 , − ∞ < x < ∞; con σ > 0 y µ ∈ R. 2πσ Se dice que X tiene distribución normal o gaussiana, con parámetros µ y σ 2 . Esto lo denotamos por X ∼ N (µ,σ 2 ). La gráfica de esta función es de la forma siguiente: Es decir, la gráfica tiene forma de campana y es simétrica alrededor de µ, con inflexiones en µ−σ y µ+σ. Además, las áreas a los extremos de la media tienden a 0 conforme se distancian de esta, tanto ası́ que, con fines prácticos, si consideramos solo cuatro decimales, el rango de la variable se reduce al intervalo [µ − 4σ; µ + 4σ]; es decir, fuera de este intervalo, f (x) es aproximadamente cero. Los valores esperados son 2 = σ2. µ X = µ y σX 209 Profesor José Flores Delgado Estadı́stica Observación 5.2. a) Si µ = 0 y σ = 1 : la distribución se llama normal estándar. Es decir, si Z ∼ N (0; 1) 1 f (z) = √ e− Z 2π z2 2 , − ∞ < z < ∞. b) No hay una fórmula explı́cita para la distribución acumulada, pero existen tablas para la distribución normal estándar. Ası́, para poder usarlas, previamente se debe pasar a la forma estándar, como se indica en la segunda de las propiedades que se dan a continuación. Sin embargo, debe mencionarse que, hoy en dı́a, estas tablas están cayendo en desuso; la razón es obvia: las computadoras. c) Originalmente, esta distribución fue propuesta por Karl Gauss (1777-1855) para modelar errores (en el ejemplo siguiente, se ilustra esta situación) Propiedades del modelo gaussiano o normal A continuación, veremos las propiedades de este modelo. 1. Propiedad de cerradura respecto a transformaciones lineales. Si X tiene distribución normal, entonces, la transformación lineal Y = a + bX, para b = 0, también tiene distribución normal. Es decir, 2 X ∼ N (µX ; σX ) e Y = a + bX ⇒ Y ∼ N (µY ; σY2 ), 2. donde µY = a + bµX y σY2 = b2 σX 210 Profesor José Flores Delgado Modelos probabilı́sticos importantes Ejemplo 5.10. Al medir con cierto instrumento la longitud, µ, de un objeto, se produce un error aleatorio, . Es muy razonable modelar este error con el modelo normal, con media 0 mm y desviación estándar σ mm . A continuación, determinamos el modelo probabilı́stico que describe a X, la medición resultante. Para este fin, notemos que X = µ + , es decir, X es una transformación lineal de y este tiene distribución normal, es decir, ∼ N (0; σ 2 ). Por lo tanto, por la propiedad anterior: X ∼ N (µ; σ 2 ). 2. Propiedad de estandarización Cualquier distribución normal puede convertirse en una normal estándar. En efecto, si X tiene distribución normal y consideramos Z= X − µX , σX 2 ) y Z = entonces, Z ∼ N (0, 1). Es decir, X ∼ N (µX ; σX Z ∼ N (0, 1). X − µX ⇒ σX Por lo tanto, F (x) = F ( X Z x−µX σX ). Esta transformación se deduce de la primera propiedad y se le conoce como fórmula de estandarización. Ejemplo 5.11. Los ingresos en cierto sector pueden ser modelados por una variable X con distribución normal de media 20 unidades monetarias (um) y desviación estándar de 5 um. 211 Profesor José Flores Delgado Estadı́stica A manera de ejemplo, calculemos la probabilidad de que el ingreso de un trabajador de este sector sea superior a 22 um, es decir, la probabilidad P (X > 22). Para esto, obtenemos, primero, FX (22), y tenemos dos formas de obtener esta probabilidad acumulada: con la computadora o con una tabla de la distribución normal estándar. Si usamos el Excel, solo debemos pedir FX (22) y se obtendrá inmediatamente FX (22) = 0,6554. Por lo tanto, P (X > 22) = 1 − FX (22) = 1 − 0,6554 = 0,3446. Si usamos una tabla de la distribución normal estándar, como nuestra variable X no es estándar, previamente debemos estandarizarla según la segunda propiedad de la distribución normal. En este caso, Z = X−20 5 ∼ N (0; 1). Ası́, FX (22) = FZ 22 − 20 = FZ (0,4) = 0,6554. 5 Para hacer un cálculo más, supongamos que, en este sector, solo los ingresos superiores a 25 um están sujetos a un impuesto extraordinario y queremos averiguar, para el sector de trabajadores que ganan más de 22 um, cuál es el porcentaje que paga este impuesto. En este caso, basta obtener la probabilidad P (X > 25/ X > 22) = 1−F (25) = X 1−F (22) = 0,1587 0,3446 P (X>25∩X>22) P (X>22) = P (X>25) P (X>22) = 0,4604. X Las probabilidades anteriores se han obtenido usando el programa Excel, pero también pueden obtenerse usando una tabla de la 212 Profesor José Flores Delgado Modelos probabilı́sticos importantes distribución normal estándar. F (25) = F 25−20 = F (1) = 0,8413; 5 X Z Z Y como ya se obtuvo antes F (22) = F 22−20 = F (0,4) = 0,6554. 5 X Z Z Ası́, el porcentaje buscado es 46,04 %. 3. Propiedad de cerradura de la distribución normal, respecto de la suma La suma de variables normales e independientes sigue teniendo distribución normal: Si X1 , . . . , Xn son variables aleatorias independientes y con distribun ción normal, entonces, la suma de ellas, T = Xj , también tiene j=1 distribución normal: T ∼ N (µT ; σT2 ), con µT = En este caso, Z= n µXj y σT2 = j=1 n j=1 2 σX . j T − µT ∼ N (0,1). σT Observación 5.3. La propiedad anterior requiere las aclaraciones siguientes: Se dice que las variables aleatorias X1 , . . . , Xn son independientes cuando, para cada Ai , conjunto de valores posibles para Xi , se tiene que P (X1 ∈ A1 ∩ . . . ∩ Xn ∈ An ) = P (X1 ∈ A1 ) . . . P (Xn ∈ An ) 213 Profesor José Flores Delgado Estadı́stica La esperanza de una suma de variables aleatorias es igual a la suma n n de sus esperanzas, es decir: E E(Xj ). Xj = j=1 j=1 Y cuando las variables son independientes, la varianza de su suma es n n igual a la suma de sus varianzas, es decir, V ( Xj ) = V (Xj ). j=1 j=1 Además, si a esta propiedad le añadimos la de linealidad, tenemos que n n T = a0 + aj µXj y σT2 = aj Xj ∼ N (µT ; σT2 ), con µT = a0 + n j=1 j=1 j=1 2 , con a , a , . . . , a constantes, con por lo menos una de a2j σX n 0 1 j estas distinta de cero. Ejemplo 5.12. En el contexto del ejemplo anterior, supongamos que para 10 trabajadores, cuyos ingresos son independientes, interesa determinar la probabilidad de que la suma de los ingresos correspondientes esté entre 190 um y 240 um. Para este fin, consideremos las variables Xj , el ingreso del j-ésimo 10 trabajador, j = 1, . . . , 10. Ası́, la suma los ingresos es T = Xj ; e j=1 interesa obtener la probabilidad P (190 ≤ T ≤ 240). Tenemos que estas variables Xj tienen distribución normal (Xj ∼ N (20, 52 )) y son independientes. Entonces, podemos aplicar esta propiedad de cerradura respecto de la suma para establecer que 10 T = Xj también sigue una distribución normal, pero con una j=1 media, µT , igual a la suma de las medias, es decir, µT = 200, y una varianza, σT2 , igual a la suma de las varianzas, es decir, σT2 = 250. 214 Profesor José Flores Delgado Modelos probabilı́sticos importantes Ası́, T ∼ N (200, 250) y P (190 ≤ T ≤ 240) = FT (240) − FT (190) = 0,9943 − 0,2635 = 0,7307. Para calcular las probabilidades anteriores con la distribución normal estándar, debe considerarse la variable: T − 200 T − µT = √ . σT 250 √ Ası́, FT (240) = FZ 240−200 = FZ (2,53) = 0,9943 y FT (190) = 250 190−200 FZ √250 = FZ (−0,63). Z= Ejemplo 5.13. En el contexto del ejemplo 5.10, suponga que, para determinar la verdadera longitud del objeto, µ, se realizarán n mediciones independientes con las caracterı́sticas mencionadas. Luego, se estimará µ con la media aritmética de las mediciones efectuadas, X̄. a) Deducir la distribución de T = X1 + . . . + Xn , la suma de las mediciones efectuadas y, a partir de esta, deduzca la de X̄. b) Deducir la distribución de X̄. c) Si n = 4 y σ = 5, halle la probabilidad de que el error de estimación, |X̄ − µ|, sea a lo sumo 2 mm . Solución: a) Por lo visto en el ejemplo 5.10, cada una de las mediciones X1 , . . . , Xn tiene distribución normal, con media µ y desviación estándar σ; además, estas son independientes. Entonces, por la propiedad anterior de la distribución normal, la suma de 215 Profesor José Flores Delgado Estadı́stica estas variables, T, tiene distribución normal con media µT = 2 + . . . + σ2 = n σ2, µX1 + . . . + µXn = n µ y varianza σT2 = σX Xn 1 es decir, T ∼ N (n µ; n σ 2 ). T b) Como T ∼ N (n µ; n σ 2 ) y X̄ = es una transformación lineal n de T , entonces, la primera propiedad de la distribución normal establece que X̄ también tiene distribución normal, pero con 2 = 1 σ 2 = σ 2 , es decir, media µX̄ = n1 µT = µ y varianza σX̄ n n2 T σ2 X̄ ∼ N (µ; n ). c) Queremos determinar la probabilidad P (|X̄ −µ| ≤ 2) = FX̄ (µ+ 2) − FX̄ (µ − 2). 2 La deducción anterior aplicada a este caso da X̄ ∼ N (µ; 54 ). Es claro que no se puede usar directamente FX̄ , la distribución acumulada de X̄, porque el valor de µ es desconocido; sin embargo, con la estandarización, sı́ lo será. X̄ − µ X̄ − µ ∼ N (0; 1), 2,5 − FZ µ−2−µ luego, FX̄ (µ + 2) − FX̄ (µ − 2) = FZ µ+2−µ 2,5 2,5 En efecto, en este caso, Z = 5 2 = = FZ (0,8) − FZ (−0,8) = 0,7881 − 0,2119 = 0,5763. Observación 5.4. (Muestra aleatoria y distribución de la media de una muestra) Si X es una variable aleatoria, una muestra aleatoria de X, de tamaño n, es un conjunto de n variables aleatorias, X1 , . . . , Xn , independientes y con la misma distribución que la de X. Como consecuencia del ejemplo anterior, se tiene el resultado siguiente: 216 Profesor José Flores Delgado Modelos probabilı́sticos importantes Si X1 , . . . , Xn es una muestra aleatoria de una variable, X, con 2 , entonces, su media distribución normal de media µX y varianza σX aritmética, X̄, tiene distribución normal con media µX y varianza 2 σX σ2 , es decir: X̄ ∼ N (µ; ). n n 4. Teorema del lı́mite central (T.L.C.) La suma de muchas variables independientes tiene una distribución aproximadamente normal. En efecto, si las variables X1 , . . . , Xn son independientes y n es suficientemente grande, entonces: T = n Xj , tiene aproximadamente distribución normal de media j=1 µT y varianza σT2 , con µT = aprox. T ∼ N (µT ,σ 2 ). T n j=1 µXj y σT2 = n j=1 2 , es decir, σX j En particular, si las Xj tienen la misma distribución: µT = nµ y σT2 = nσ 2 , con µ y σ 2 la media y varianza común a todas las variables Xj . Ejemplo 5.14. Un inversionista recibe 100 utilidades, las cuales pueden ser consideradas como variables aleatorias independientes de igual distribución, con una media de 5 um y una desviación estándar de 0,5 um. Interesa saber la probabilidad de que la utilidad total recibida por el inversionista sea menor que 510 um (el mı́nimo previsto). Para averiguar lo deseado consideremos, como en el ejemplo anterior, las variables: Xj , la j-ésima utilidad recibida, j = 1, . . . , 100. Como estas variables son muchas e independientes, entonces, por la cuarta propiedad de la distribución normal (el 100 teorema del lı́mite central), la suma de estas, T = Xj , sigue j=1 217 Profesor José Flores Delgado Estadı́stica aproximadamente una distribución normal con media µT , igual a la suma de las medias, y varianza σT2 , igual a la suma de las varianzas, es decir, µT = 500 y σ 2 = 25. Entonces tenemos que T ∼ N (500, 25), luego podemos obtener la probabilidad de interés directamente con el Excel. Es decir: P (T < 510) = FT (510) = 0,9772. Obsérvese que, en este caso, para usar la distribución normal estándar debe considerarse la variable: T − µT T − 500 Z= ∼ N (0; 1). = σT 5 Ası́, el cálculo de la probabilidad que interesa resulta ahora: FT (510) = P (T ≤ 510) = FZ 510−500 5 = FZ (2) = 0,9772. Ejemplo 5.15. En el contexto del ejemplo anterior, ¿cuál serı́a la probabilidad de que la media de las utilidades recibidas sea menor o igual a 5,1 um? Ahora se desea averiguar el valor de la probabilidad 100 P (X̄ ≤ 5,1), con X̄ = Xj /100 = T /100. j=1 T ≤ 5,1) = P (T ≤ 510) = FT (510) = Ası́: P (X̄ ≤ 5,1) = P ( 100 FZ (2) = 0,9772. También puede deducirse la distribución de X̄ a partir de la de 100 T Xj . En efecto, como X̄ = 100 y T ∼ N (500; 25), entonces, T = j=1 por la propiedad de linealidad de la distribución normal, tenemos 2 2 ), con µ = µT = 500 = 5, y σ 2 = σT = 25 = que: X̄ ∼ N (µX̄ , σX̄ 100 100 X̄ 1002 1002 X̄ 0,0025, es decir, X̄ ∼ N (5; 0,0025). Para usar la distribución normal estándar tenemos que: Z = X̄−5 0,05 ∼ 5,1−5 N (0, 1). Ası́, P (X̄ ≤ 5,1) = FX̄ (5,1) = FZ 0,05 = FZ (2) = 0,9772. 218 Profesor José Flores Delgado Modelos probabilı́sticos importantes 5.3. Modelo o distribución lognormal Se dice que una variable aleatoria, X, tiene distribución lognormal si, y solo si, la transformación logaritmo natural de X, Ln(X), tiene una distribución normal. Puede verificar que la densidad es la siguiente: (lnx − µ)2 − 1 f (x) = √ 2σ 2 , x > 0. x−1 e 2πσ Esto lo denotamos por: X ∼ logN (µ; σ 2 ). Las constantes µ ∈ R y σ 2 > 0, son los parámetros del modelo y estos son también los parámetros de la distribución de Ln(X), es decir, se tiene que Ln(X) ∼ N (µ, σ 2 ). La gráfica de la función de densidad es de la forma siguiente: Los valores esperados son σ2 µX = e (2µ+σ 2 )/2 µ2X (e − 1). 2 =e y σX 2µ+σ 2 σ2 (e −1) = Observación 5.5. En general, este modelo es útil para describir datos con valores positivos y distribución asimétrica, como suele ocurrir con los ingresos o algunos precios. 219 Profesor José Flores Delgado Estadı́stica En la economı́a y las finanzas, esta distribución aparece, por ejemplo, cuando el valor de cierta inversión es el resultado de muchas variaciones ocasionadas por incrementos o reducciones aleatorias; cada variación reduce o aumenta el valor actual en una proporción aleatoria. Esto se conoce como la Ley de fragmentación de Kolmogorov. Una explicación de la validez de esta ley se muestra en el ejemplo siguiente. Ejemplo 5.16. En la enésima operación de una serie de operaciones financieras, se invierte el capital acumulado, cuyo valor es Xn unidades monetarias. La tasa de rentabilidad de esta operación se define como Xn − Xn−1 Rn = , Xn−1 con Xn−1 el valor del capital acumulado disponible antes de realizar la operación. Sigue inmediatamente que el valor del capital acumulado, Xn , en función del capital invertido (Xn−1 ) y la tasa de rentabilidad de esta inversión (Rn ), está dada por: Xn = (1 + Rn )Xn−1 Y si usamos Wn = 1 + Rn , que se conoce como el factor de capitalización, tenemos que: Xn = Wn Xn−1 De aquı́, no es difı́cil verificar que Xn = W1 , . . . , Wn X0 , con X0 el valor del capital inicial (un valor conocido). Y si en esta última ecuación tomamos logaritmos resulta que: Ln(Xn ) = Ln(W1 ) + Ln(W2 ) + . . . + Ln(Wn ) + Ln(X0 ). 220 Profesor José Flores Delgado Modelos probabilı́sticos importantes Supongamos un contexto financiero de incertidumbre según el cual las tasas de rentabilidad, Ri , son variables aleatorias independientes; entonces, ası́ también lo serán los factores de capitalización, Wi . Si, además de este supuesto, tenemos muchas operaciones, entonces, por el teorema del lı́mite central, tendremos que Ln(Xn ) tendrá aproximadamente una distribución normal y, por lo tanto, Xn una distribución lognormal. Entonces, podemos decir que el valor del capital, al cabo de muchas operaciones (en el largo plazo), sigue una distribución lognormal. Ejemplo 5.17. Actualmente, en finanzas, se ha hecho bastante conocido el modelo de precios de Black-Scholes1 . Por ejemplo, según este modelo, la ecuación que describe la evolución del precio de un stock en el tiempo es de la forma: 1 St = S0 exp [ (µ − σ 2 ) t + σXt ], t > 0, (1) 2 donde: S0 > 0 es el precio inicial del stock; µ es el valor esperado de la tasa instantánea de rentabilidad; σ > 0 es la volatilidad del stock (estos últimos no se consideran aleatorios sino constantes) y Xt es una variable aleatoria con distribución normal, de media cero y varianza t, es decir, Xt ∼ N (0, t). El modelo anterior puede escribirse como 1 (2) LnSt = LnS0 + (µ − σ 2 ) t + σXt 2 Y como Xt tiene distribución normal, entonces, por la primera propiedad de la distribución normal, Ln(St ) también tendrá distribución normal, es decir, 1 LnSt ∼ N ( LnS0 + (µ − σ 2 )t; σ 2 t ) (3) 2 1 Veáse Lars Tyge Nielsen (1999), ejemplo 1.7, p. 13. 221 Profesor José Flores Delgado Estadı́stica Por lo tanto, la distribución de St es lognormal. Para ilustrar el uso de este modelo, supongamos que el valor inicial del stock sea 20 um , que el valor esperado de la tasa instantánea de rentabilidad sea 0,2 y que la volatilidad del stock sea 0,4. Entonces, reemplazando estos valores en la ecuación (3), tenemos que: LnS5 ∼ N (2,795; 0,8 ) En particular, la probabilidad de que el precio del stock, después de 5 unidades de tiempo, sea inferior a 55 um está dada por: P (S5 < 55) = P (Ln(S5 ) < Ln(55)) = P (Ln(S5 ) < 4) = F (4) = 0,911. Ln(S5 ) Y para usar la normal estándar tenemos que Z = N (0, 1). Ası́: F (4) = F Ln(S5 ) Z 4−2,795 √ 0,8 Ln(S5 ) − 2,795 √ 0,8 ∼ = F (1,35) = 0,911. Z 5.4. Modelo o distribución hipergeométrica Si de una población con N elementos, de los cuales M son de interés, se toma una muestra aleatoria de n elementos; y definimos X como el número de elementos de interés en la muestra, entonces el modelo probabilı́stico de X viene dado por: f (x) = P (X = x) = N −M CxM Cn−x , x = 0, 1, . . . , n. CnN Cuando la ley de probabilidad de una variable aleatoria X es ası́, se dice que tiene una distribución hipergeométrica con parámetros N , M y n. 222 Profesor José Flores Delgado Modelos probabilı́sticos importantes Se denotará esto por: X ∼ H(N,M,n). Observación 5.6. en realidad X asume valores que van, desde el mayor de los valores entre 0 y n − (N − M ), hasta el menor de los valores de n y M , es decir, no necesariamente entre 0 y n. Los valores esperados son: p= M N y q = 1 − p. 2 = npq( N −n ), siendo µX = np y σX N −1 La distribución acumulada no tiene una fórmula explı́cita particular. Observación 5.7. Si la muestra es con reposición, X ∼ b(n,p); y si N es muy grande, en relación con n, la distribución hipergeométrica se aproxima a la binomial. Ejemplo 5.18. En el ejemplo 4.1 del capı́tulo anterior, la variable X, el número de empresas del tipo a en la muestra de tamaño 4, tomada de la población de 20 empresas entre las cuales 5 son del tipo a, sigue una distribución hipergeométrica con parámetros: N = 20, M = 5 y n = 4. Ası́, su modelo probabilı́stico está dado por la función: 5 15 f (X = x) = P (X = x) = x 204−x , 4 para cualquier x ∈ RX = { 0, 1, 2, 3, 4 }. 5.5. Modelo o distribución uniforme Si una variable aleatoria X tiene como rango a un intervalo de extremos finitos, a y b, y su densidad es constante, es decir, dada por: f (x) = 1 , a ≤ x ≤ b. b−a 223 Profesor José Flores Delgado Estadı́stica Se dice que X tiene distribución uniforme. Denotamos esto por X ∼ U (a,b). La gráfica de la densidad es la de una función constante: Los valores esperados son: La distribución acumulada: b. µX = 2 a+b 2 = (b − a) . y σX 2 12 F (x) = P (X ≤ x) = x−a ,a≤x≤ b−a Observación 5.8. Esta distribución es adecuada para describir a una variable que asuma sus valores uniforme o indistintamente en un intervalo de extremos finitos. Propiedad: Sea U una variable aleatoria con distribución uniforme en el intervalo [0, 1], es decir, U ∼ U [0,1], y X una variable aleatoria con distribución acumulada F. Caso 1: Si X es continua podemos asumir que F es continua sobre RX y suponiendo que esta sea estrictamente creciente, entonces tendrá una inversa F −1 . Definimos para cada 0 ≤ u ≤ 1 : G(u) = F −1 (u). Caso 2: Si X es discreta, definimos para cada 0 ≤ u ≤ 1 : G(u) = min{x ∈ RX / F (x) ≥ u} Entonces, en ambos casos, la variable transformada de U, G(U ), tiene d la misma distribución que la de X: G(U ) = X. 224 Profesor José Flores Delgado Modelos probabilı́sticos importantes Observación 5.9. La propiedad anterior nos dice cómo transformar una variable aleatoria con distribución uniforme en [0, 1], U ∼ U [0,1], en otra que tenga una distribución deseada. Esto permite generar valores de una distribución arbitraria, a partir de valores generados de una distribución uniforme y es la técnica más conocida en simulación. Es decir, si u1 , . . . , un son n valores generados de una distribución uniforme entre 0 y 1, entonces, los valores asociados a una variable X, con distribución con acumulada F, se pueden generar como sigue. En el caso que X sea continua, consideraremos: xj = F −1 (uj ) ⇔ uj = F (xj ), j = 1, . . . , n. Y en el caso que X sea discreta: xj = G(uj ) = min{x ∈ RX / F (x) ≥ uj }, j = 1, . . . , n. Ejemplo 5.19. Simulemos 50 valores de una variable aleatoria, X, con modelo exponencial con parámetro β = 1/4. Para generar, mediante simulación, 50 valores de X : x1 , . . . , x50 . Primero simulamos 50 valores de una variable aleatoria con distribución uniforme en [0, 1], U ∼ U (0; 1). Por ejemplo, con una computadora y el Excel obtenemos los números aleatorios siguientes: 0,674 0,696 0,734 0,070 0,377 0,558 0,926 0,126 0,973 0,661 0,682 0,271 0,732 0,948 0,519 0,914 0,073 0,493 0,592 0,603 0,104 0,817 0,194 0,580 0,504 0,273 0,639 0,470 0,479 0,480 0,854 0,005 0,019 0,832 0,614 0,430 0,947 0,191 0,208 0,213 0,508 0,906 0,870 0,522 0,345 0,089 0,449 0,785 0,524 0,878 Como X es continua, podemos considerar xj = G(uj ) = F −1 (uj ), j = 1, . . . , 50. Ası́, ya que X ∼ exp(1/4), se tiene que F (x) = 1 − e−x/4 , x > 0. 225 Profesor José Flores Delgado Estadı́stica Luego: xj = F −1 (uj ) ⇔ uj = F (xj ) = 1−e−xj /4 ⇔ xj = −4Ln(1−uj ), j = 1, . . . , 30. De este modo se obtienen los valores deseados: 4,480 4,761 5,299 0,290 1,891 3,263 10,406 0,537 14,506 4,330 4,582 1,266 5,274 11,861 2,930 9,815 0,305 2,715 3,589 3,691 0,439 6,800 0,864 3,471 2,801 1,277 4,072 2,540 2,611 2,618 7,683 0,019 0,077 7,137 3,806 2,246 11,770 0,850 0,932 0,956 2,833 9,442 8,168 2,951 1,695 0,374 2,382 6,152 2,973 8,429 Si consideramos estos datos generados como una muestra aleatoria de X existe una técnica llamada “bondad de ajuste” para verificar que efectivamente el modelo de esta variable es uno especificado, en este caso exponencial con parámetro β = 1/4. A continuación aplicaremos esta técnica que requiere una muestra grande, como lo es en este caso, pero solo en la etapa descriptiva y no en la de inferencia. Empezamos por ver cómo es la distribución de frecuencias de la muestra generada: X frecuencia observada frecuencia relativa observada 0−3 26 0,52 226 3−6 12 0,24 6−9 7 0,14 9−∞ 5 0,1 Profesor José Flores Delgado Modelos probabilı́sticos importantes Se observa una tendencia decreciente, como ocurre en un una distribución exponencial; pero esto -incluso en esta etapa descriptivoaún resulta impreciso, pues esta gráfica depende del número de intervalos y además solo esta forma del polı́gono no garantiza que la distribución exponencial con el parámetro especificado (β = 1/4). Entonces, debemos comparar las frecuencias observadas (las de los valores obtenidos para X) con las frecuencias esperadas, según la distribución supuesta para X (en este caso exp (1/4)). A continuación expresamos los valores de estos tipos de frecuencias en la tabla siguiente: X frecuencia observada (oj ) frecuencia relativa observada (fj ) frec. relativa esperada (pj ) frec. esperada (ei = npj ) 0−3 26 0,52 0,5276 26,3817 3−6 12 0,24∗ 0,2492∗∗ 12,4618∗∗∗ 6−9 7 0,14 0,1177 5,8865 9−∞ 5 0,1 0,1054 5,2700 Se observa que las frecuencias observadas están próximas a las esperadas. Por lo tanto, el modelo especificado parece ajustar a los datos; es decir, la simulación parece haber sido adecuada. ∗ 0,24 = 12/50; ∗∗ 0,2492 = FX (6) − FX (3); ∗∗∗ 12,4618 = 50 × 0,2492. También se acostumbra ilustrar la conclusión con la llamada gráfica de probabilidades, es decir, la gráfica de las frecuencias relativas esperadas (probabilidades esperadas según el modelo) con las correspondientes a las observadas: 227 Profesor José Flores Delgado Estadı́stica Se observa que las frecuencias observadas están próximas de las esperadas. Por lo tanto, la simulación parece haber sido adecuada; es decir, generado datos según el modelo especificado. Esto se cumple, pues el método para simular lo establece y la cantidad de datos es grande. 5.6. Modelo o distribución Beta Se dice que la variable aleatoria X tiene modelo o distribución beta, si su función de densidad está dada por: f (x) = Γ(α + β) α−1 x (1 − x)β−1 , 0 ≤ x ≤ 1. Γ(α)Γ(β) con α > 0 y β > 0, los parámetros del modelo. Esto lo denotamos por X ∼ B(α; β). A continuación se muestran las gráficas tı́picas de este modelo, para α = 1 y β = 1 : 228 Profesor José Flores Delgado Los valores esperados son: Modelos probabilı́sticos importantes µX = α αβ 2 = y σX . 2 α+β (α + β) (α + β + 1) Observación 5.10. Esta distribución puede ser generalizada para un intervalo de extremos arbitrarios, a < b, mediante el cambio de variable Y = a + (b − a)X. En este caso la densidad de Y está dada por: fY (y) = Γ(α + β) (y − a)α−1 (b − y)β−1 /(b − a)α+β−1 , a ≤ y ≤ b. Γ(α)Γ(β) Además, la distribución uniforme en el intervalo de extremos 0 y 1 es un caso particular de esta distribución. En efecto: X ∼ U (0; 1) ⇔ X ∼ B(1; 1). Ası́, el modelo beta es de gran utilidad para modelar una variable aleatoria que asume sus valores en un intervalo de extremos finitos y aun cuando no sea de manera uniforme, generalizando de este modo a la distribución uniforme. 5.7. La función generadora de momentos Definición 5.1. Si X es una variable aleatoria, se define su función generadora de momentos MX : R → R, mediante: MX(t) = E(et X ). t → MX(t) A continuación veamos la propiedad principal de la función generadora de momentos, esta explica el nombre que se le da. Aunque la deduciremos para una variable discreta, similarmente se puede deducir para el caso continuo. 229 Profesor José Flores Delgado Estadı́stica Por la propiedad que permite obtener el valor esperado de una función de una variable aleatoria, se tiene que: MX(t) = E(et X ) = etx fX (x) x∈RX Entonces, al derivar respecto de t y evaluar en cero, obtenemos: MX (t) = xetx fX (x) x∈RX M (0) = X xfX (x) x∈RX Entonces, MX (0) = E(X). Pero se debe observar que no siempre es posible hacer esta derivación. Y al derivar una vez más respecto de t y evaluar en cero, obtenemos: MX (t) = x2 etx fX (x) x∈RX M (0) X = x2 fX (x) x∈RX Entonces, MX (0) = E(X 2 ). Generalizando, tenemos que MX(j) (0) = E(X j ). 230 Profesor José Flores Delgado Modelos probabilı́sticos importantes 2 Ejemplo 5.20. Si Z ∼ N (0; 1), entonces: MZ (t) = et /2 ∀t ∈ efecto: MZ (t) = E(etZ ) ∞ z2 1 = etz √ e − 2 dz 2π −∞ ∞ z2 1 √ e tz− 2 dz = 2π −∞ ∞ 1 1 2 √ e − 2 (z −2tz) dz = 2π −∞ ∞ 1 1 2 2 2 √ e − 2 (z −2tz+t −t ) dz = 2π −∞ ∞ 1 1 2 1 2 √ e − 2 (z−t) + 2 t dz = 2π −∞ ∞ 1 1 2 2 √ e − 2 (z−t) dz = e t /2 2π −∞ . En 1 = 2 e t /2 , ∀t ∈ . Propiedad 1. Si X es una variable aleatoria, con función generadora de momentos MX , e Y = a + bX; entonces: MY (t) = e a t MX (bt). Ejemplo 5.21. Como se vio en el ejemplo anterior, si Z ∼ N (0; 1); 2 entonces, MZ (t) = e t /2 , ∀t ∈ R. A partir de este resultado, usaremos la propiedad anterior para determinar la función generadora de una normal con parámetros arbitrarios, X ∼ N (µ; σ 2 ). 231 Profesor José Flores Delgado Estadı́stica Ası́, si X ∼ N (µ; σ 2 ) : X = a + b Z X −µ ∼ N (0; 1) ⇒ X = µ + σ Z; Z= σ luego, por la propiedad anterior MY (t) = e a t MX (bt) : MX (t) = eµ t MZ (σ t) = e tµ eσ 2 2 e tµ+σ t /2 , ∀t ∈ . 2 t2 /2 = e tµ+σ 2 t2 /2 ; ası́, MX (t) = Propiedad 2. La función generadora de momentos determina unı́vocamente el modelo probabilı́stico. Ejemplo 5.22. Demostremos la propiedad de cerradura del modelo normal respecto de la transformación lineal. Es decir, si X ∼ 2 ) e Y = a + b X, entonces: Y ∼ N (a + b µ ; b2 σ 2 ). N (µX ; σX X X Para esto, hallaremos la función generadora de Y y veremos que esta 2, corresponde a la de una normal con parámetros a + b µX ; b2 σX ası́ el resultado quedará garantizado por esta última propiedad de la función generadora. 2 ), su función generadora Como ya hemos visto, si X ∼ N (µX ; σX está dada por: 2 2 MX (t) = e tµ+σ t /2 , ∀t ∈ . Luego, como Y = a + b X, entonces, por la propiedad 1 se puede derivar la función generadora de momentos de Y a partir de la de X : MY (t) = e a t MX (bt) 2 = e a t e btµX +σX (bt) 2 /2 at+bµX t+b2 σ 2 t2 /2 , ∀bt ∈ R X =e 2 2 = e (a+b µX )t+(bσX ) t /2 , ∀t ∈ R. 232 Profesor José Flores Delgado Modelos probabilı́sticos importantes Ası́, la función generadora de momentos de Y corresponde a la de 2 ; y como la función una normal con parámetros a + b µX ; y b2 σX generadora determine unı́vocamente el modelo, entonces se puede 2 ). afirmar que Y ∼ N (a + b µX ; b2 σX Propiedad 3. Si X1 , . . . , Xn son variables aleatorias independientes, entonces, la función generadora de momentos de la suma es el producto de las correspondientes a estas variables: M (t) = M (t) . . . M (t) . X 1 + · · · + Xn X1 Xn Ejemplo 5.23. Demostremos la propiedad de cerradura del modelo normal respecto de la suma de variables independientes. 2 ), para j = 1, . . . , n; entonces, Es decir, si Xj ∼ N (µXj ; σX j 2 + · · · + σ 2 ). X1 + · · · + Xn ∼ N (µX1 + · · · + µXn ; σX Xn 1 Para esto, hallaremos la función generadora de X1 + · · · + Xn y veremos que esta corresponde a la de una normal con parámetros 2 +· · ·+σ 2 , ası́ el resultado quedará garantizado µX1 +· · ·+µXn y σX Xn 1 por esta última propiedad de la función generadora. M (t) = M (t) X1 + · · · + Xn ... M (t) X1 =e =e MX1 +···+Xn (t) = e Xn tµX +σ 2 t2 /2 1 X1 ... e tµX +σ 2 n Xn tµX +σ 2 t2 /2 +... +tµX +σ 2 1 n X1 Xn t2 /2 t(µX +···+µX )+(σ 2 X +... + σ 2 n 1 233 1 t2 /2 Xn )t2 /2 Profesor José Flores Delgado Estadı́stica Que era lo que se querı́a demostrar, es decir, la función generadora de momentos de la suma corresponde a la de una normal con parámetros 2 + · · · + σ 2 , por lo tanto, este será el modelo µX1 + · · · + µXn y σX Xn 1 2 + · · · + σ 2 ). de la suma: N (µX1 + · · · + µXn ; σX Xn 1 234 Profesor José Flores Delgado Modelos probabilı́sticos importantes 5.8. Ejercicios propuestos Ejercicio 5.1. En cierto sector del comercio, los establecimientos comerciales pueden pagar sus tributos a tiempo independientemente entre estos y en un porcentaje del 95 %. a) Identifique la distribución de la variable X definida como el número de establecimientos, entre 8 por inspeccionar, que paguen a tiempo sus tributos. A partir de esta distribución, determine la probabilidad del evento siguiente: Por lo menos 6 de los 8 establecimientos pagan a tiempo sus tributos. b) Identifique la distribución de la variable X definida como el número de establecimientos que deben ser inspeccionados hasta que se encuentre el primero que haya pagado a tiempo sus tributos. A partir de esta distribución, determine la probabilidad del evento siguiente: El número de establecimientos inspeccionados, hasta el primero que pague sus impuestos a tiempo, está entre 5 como mı́nimo y 15 como máximo. c) Identifique la distribución de la variable X definida como el número de establecimientos que deben inspeccionarse hasta que se encuentre el cuarto que haya pagado a tiempo sus tributos. A partir de esta distribución, determine la probabilidad del evento siguiente: 235 Profesor José Flores Delgado Estadı́stica El número de establecimientos inspeccionados, hasta el cuarto que pague sus tributos a tiempo, está entre 5 como mı́nimo y 7 como máximo. Ejercicio 5.2. En una empresa de transporte, cada vehı́culo puede llegar a tiempo independientemente de otros vehı́culos y con una probabilidad de 0,6. a) En un dı́a, la terminal espera el arribo de 20 vehı́culos; determine la probabilidad de que por lo menos dos de estos vehı́culos lleguen a tiempo. Debe definir una variable e identificar (justificando) su modelo. b) Halle la probabilidad de que el primer vehı́culo que llegue a tiempo sea por lo menos el vigésimo. Debe definir una variable e identificar (justificando) su modelo. c) Halle e interprete el valor esperado del número de vehı́culos hasta el primero que llegue a tiempo. d) Halle la probabilidad de que el tercer vehı́culo que llegue a tiempo sea por lo menos el quinto. Debe definir una variable e identificar (justificando) su modelo. Ejercicio 5.3. Suponga que los usuarios de un sistema de información llegan de acuerdo con un proceso de Poisson con una tasa de 2 usuarios por minuto. a) Identifique la distribución de la variable X definida como el número de usuarios que llegan al sistema en un perı́odo 236 Profesor José Flores Delgado Modelos probabilı́sticos importantes de 5 minutos. A partir de esta distribución, determine la probabilidad de que el número de usuarios que llegan al sistema en un perı́odo de 5 minutos es por lo menos 6 y máximo 7. b) Identifique la distribución de la variable X definida como el tiempo (en minutos) hasta que llegue el primer usuario del sistema. A partir de esta distribución, determine la probabilidad de que se deba esperar entre 4 y 12 minutos hasta que llegue el primer usuario. c) Identifique la distribución de la variable X definida como el tiempo (en minutos) hasta que llegue el tercer usuario del sistema. A partir de esta distribución, determine la probabilidad de que se espere por lo menos 3 minutos hasta que llegue el tercer usuario. Ejercicio 5.4. Una agencia bancaria (que nunca cierra para los clientes) divide su trabajo interno en perı́odos. Durante cada perı́odo, se debe realizar cierta operación de verificación; esta se puede realizar mal con una probabilidad de 0,9 e independientemente en cada perı́odo. a) ¿Cuán probable es que esta operación se realice mal después del quinto perı́odo? b) Cada vez que dicha operación se realice mal, se deben registrar algunos datos en una ficha especial. Al empezar la jornada de trabajo de 10 perı́odos, el administrador se da cuenta de que solo dispone de 5 de estas fichas, pero no solicita más. Determine el número esperado de fichas que serán usadas durante esta jornada de trabajo. 237 Profesor José Flores Delgado Estadı́stica c) Determine la función de probabilidad de la variable aleatoria Y, definida como la cantidad de perı́odos de trabajo antes de que se realice mal dicha operación. Ejercicio 5.5. Determine la probabilidad de que por lo menos 2 vehı́culos lleguen a tiempo en cada una de las situaciones siguientes: a) Hay 20 vehı́culos en total; además, se sabe que cada vehı́culo puede llegar a tiempo, independientemente entre ellos y con una probabilidad de 0,6. b) En un perı́odo de 2 minutos, además, se sabe que los vehı́culos llegan a tiempo según un proceso de Poisson con una tasa de 5 vehı́culos por minuto. Ejercicio 5.6. Un educador ha elaborado una prueba de opción múltiple con 10 preguntas de 5 opciones cada una. El educador es consciente de que algunos alumnos rendirán la prueba simplemente escogiendo al azar una de las 5 opciones como respuesta y harán esto para cada una de las preguntas de modo independiente. Por tal motivo, es necesario penalizar las respuestas incorrectas. En las cuestiones siguientes, solo considere este tipo de alumnos. a) Identifique un proceso de observación de Bernoulli en el contexto dado. b) Determine el modelo probabilı́stico más adecuado para describir a la variable X, el número de respuestas acertadas. 238 Profesor José Flores Delgado Modelos probabilı́sticos importantes c) Determine e interprete el número de respuestas correctamente contestadas. d) Cada pregunta bien contestada vale 2 puntos. Determine cuánto debe descontarse por cada pregunta mal contestada, de modo que la nota esperada de los alumnos de este grupo sea 0. Sugerencia: si k es el valor buscado, vea que la nota es 2X − k(10 − X). e) Uno de estos alumnos necesita por lo menos 14 en esta prueba para aprobar el curso. Cuantifique el riesgo que correrá. Use el valor de k obtenido en la parte anterior. Ejercicio 5.7. Los clientes de un banco que deben recibir un tratamiento especial llegan de acuerdo con un proceso de Poisson con un tasa de un cliente cada 20 minutos. a) ¿Cuál es la probabilidad de que, en un perı́odo de media hora, lleguen más de 2 clientes que deben recibir un tratamiento especial en el banco? b) A todo cliente que debe recibir un tratamiento especial se le entrega un premio, pero, al empezar la jornada de trabajo, el administrador se da cuenta de que solo dispone de 5 de estos premios. Determine el número esperado de premios que serán entregados durante la primera hora de atención. c) Determine el tiempo que dispone el administrador para que, con una probabilidad de 0,9, pueda completar una pequeña 239 Profesor José Flores Delgado Estadı́stica labor antes de la llegada del primer cliente que deba recibir un tratamiento especial. d) ¿Cuál es la probabilidad de que pase más de una hora hasta la llegada del tercer cliente que deba recibir un tratamiento especial en el banco? Ejercicio 5.8. En el contexto del modelo binomial de finanzas, descrito en el ejemplo 5.3, determine el valor esperado del capital acumulado al cabo de 10 operaciones. Puede ser útil la fórmula del binomio de Newton: (a + b)n = n n i n−i . i a b i=0 Ejercicio 5.9. La ocurrencia de cierto evento catastrófico ocurre de acuerdo con un proceso de Poisson con una tasa de uno cada cinco años. a) Halle la probabilidad de que, en una década, no ocurra más de 2 veces este evento. b) Halle la probabilidad de que en, un perı́odo de 5 años, ocurra más de 2 veces este evento catastrófico. c) Un proyecto debe ejecutarse durante un perı́odo de 10 años. Si este evento no se presenta durante el perı́odo de ejecución del proyecto, el costo es de 200 unidades monetarias (um); en otro caso, este costo se incrementa en 100 um por cada unidad de tiempo faltante hasta completar la ejecución del proyecto. Determine el valor esperado del costo de ejecución del proyecto. 240 Profesor José Flores Delgado Modelos probabilı́sticos importantes d) ¿Cuán probable es que pasen más de 20 años hasta que ocurra tres veces dicho evento? e) Considerando las próximas 5 décadas, determine la probabilidad de que en por lo menos dos de estas el evento catastrófico ocurra más de dos veces. Asuma independencia y condiciones similares en cada una de las 5 décadas. Ejercicio 5.10. Cierto evento imprevisto puede ocurrir durante cada mes, con una probabilidad de 0,1 e independientemente de otros meses. a) Al comenzar el mes, se inicia la ejecución de un proyecto que debe tardar 10 meses. Además, el proyecto se concluirá en el plazo previsto siempre y cuando el evento imprevisto no ocurra en más de 2 meses de este plazo. Cuantifique el riesgo que se corre al afirmar que la ejecución se concluirá en el plazo previsto. b) Una persona adquiere una póliza contra este tipo de evento, que regirá durante los 5 meses siguientes. El contrato estipula que si el evento ocurre antes del quinto mes, entonces, la compañı́a aseguradora debe pagarle una suma indemnizatoria de 6 mil soles, pero no volverá hacerlo si ocurriera nuevamente; además, la persona solo hará un único pago de 10 mil soles. Determine la utilidad esperada de la aseguradora. c) Halle la probabilidad de que el evento ocurra por tercera vez después del quinto mes. 241 Profesor José Flores Delgado Estadı́stica Ejercicio 5.11. Los pedidos llegan a cierto supermercado (que atiende las 24 horas del dı́a) según un proceso de Poisson, con una media de 4 pedidos por hora. a) Desde que empezó un dı́a, ha pasado media hora y no ha llegado el primer pedido. Halle la probabilidad de que este pedido tampoco llegue durante la siguiente media hora. b) Por dı́a, el supermercado tiene un costo de 250 soles, siempre y cuando el primer pedido llegue durante las dos primeras horas del dı́a; pero, por cada hora adicional (a las primeras dos horas del dı́a) que tarde este primer pedido, dicho costo se incrementa en 50 soles. Determine el costo esperado por dı́a. Ejercicio 5.12. Se sabe que la demanda anual de un bien puede ser muy baja en cualquier año de manera independiente de otros años y con una probabilidad de un décimo. a) Un comerciante estudia la posibilidad de adquirir grandes cantidades de este bien, en cada uno de los próximos 6 años. a1 ) El comerciante ha calculado que su inversión será exitosa si a lo más en 4 de estos 6 años la demanda del bien es muy baja. Cuantifique el riesgo que corre. a2 ) El comerciante ha calculado que, en cada año en el que la demanda del bien sea muy baja perderá 10 um ; pero en cada año en el que la demanda no sea muy baja 242 Profesor José Flores Delgado Modelos probabilı́sticos importantes ganará 30 um. Determine e interprete la utilidad esperada del comerciante. b) Calcule la probabilidad de que el primer año en el que la demanda sea muy baja sea por lo menos el quinto, pero máximo el vigésimo. Ejercicio 5.13. Suponga que, durante un año, en cierto paı́s, los eventos catastróficos ocurren según un proceso de Poisson con una tasa de 2 eventos por mes. Además, cada evento catastrófico produce una daño cuya magnitud es independiente de las correspondientes a otros eventos catastróficos y con distribución exponencial. El diseño de “prevención contra desastres”del Gobierno consideró un valor crı́tico para el daño ocasionado por una catástrofe cuando esta es 3,5 veces la media de dicha magnitud. Obtenga la “confiabilidad del diseño prevención contra desastres”durante el perı́odo de un año, es decir, la probabilidad de que, durante dicho perı́odo, ninguna de las magnitudes de los daños que se produzcan supere el valor crı́tico2 . Sugerencia: sean X el número de tales eventos en un año e Y, el número de los que su magnitud supera el valor crı́tico. Se desea hallar ∞ P (Y = 0) = P (X = 0 ∩ Y = 0). Note que si X = x : Y ∼ b(x,p), x=0 con p = P (Z > 3,5/β), donde Z ∼ exp(β). Ejercicio 5.14. Una municipalidad verificará si las tiendas de su distrito cumplen una ordenanza dictada recientemente. Con este fin, se escogerá una 2 Este ejercicio está basado en la teorı́a estudio de peligro sı́smico, presentada en Alejandro Muñoz P. (2002). 243 Profesor José Flores Delgado Estadı́stica muestra aleatoria de 20 tiendas del distrito. Además, por experiencia, se sabe que el 25 % de estos establecimientos suele incumplir las ordenanzas nuevas. a) Identifique un proceso de observación de Bernoulli en el contexto dado. Deberá asumir la validez de los supuestos necesarios y dar su significado en este contexto. b) Halle el modelo probabilı́stico que describe a la variable X, definida como el número de tiendas en la muestra por seleccionar que incumplen la ordenanza. c) Determine la probabilidad de que por lo menos cinco de las tiendas de la muestra por seleccionar incumplan la ordenanza. d) Determine e interprete el valor esperado del número de tiendas en la muestra por seleccionar que incumplan la ordenanza. e) Suponga que inspeccionar cada tienda de la muestra seleccionada costará 500 soles. Además, cada detección originará un descuento de 500 soles en el costo, pues esta cantidad será pagada por el propietario de la tienda que incumpla la ordenanza; por el contrario, cada tienda seleccionada que cumpla la ordenanza originará un costo adicional de 250 soles, pues el propietario de la tienda recibirá un descuento en sus tributos por este valor. Si el presupuesto para llevar a cabo este muestreo es de 12 750 soles: e1 ) Cuantifique la confianza de este presupuesto para poder llevar a cabo el muestreo. e2 ) Determine e interprete el valor esperado del costo para llevar a cabo el muestreo. 244 Profesor José Flores Delgado Modelos probabilı́sticos importantes Ejercicio 5.15. Una compañı́a alquila un equipo que se puede descomponer durante un mes independientemente de otros meses y con probabilidad de 0,2. El equipo se usará 20 meses. Cada mes, le generará un ingreso de 1000 soles (ası́ se descomponga el equipo); además, cada mes en el que se descomponga el equipo, le significará un egreso de 500 soles por reparación. a) Identifique el modelo probabilı́stico que describe a la variable, X, definida como el número de meses (entre los 20) en los que el equipo se descompondrá. b) Halle el valor esperado y la desviación estándar del número de meses en los que se descompondrá el equipo. c) Determine la utilidad esperada de la compañı́a. d) La compañı́a desea ganar, por lo menos, 18 500 soles. Cuantifique el riesgo que correrá. Ejercicio 5.16. Los pedidos llegan a una central según un proceso de Poisson con una tasa de 3 por minuto. a) Determine la probabilidad de que, en un intervalo de 10 minutos, lleguen más de 2 pedidos. Debe definir una variable e identificar (justificando) su modelo. b) Halle la probabilidad de que el primer pedido demore en llegar más de 5 minutos pero menos de 10. Debe definir una variable e identificar (justificando) su modelo. 245 Profesor José Flores Delgado Estadı́stica c) Halle la probabilidad de que el segundo pedido demore en llegar más de 5 minutos pero menos de 10. Debe definir una variable e identificar (justificando) su modelo. Ejercicio 5.17. En una empresa de transporte, cada vehı́culo puede llegar a tiempo, independientemente de otros vehı́culos y con una probabilidad de 0,6. a) En un dı́a, la terminal espera el arribo de 20 vehı́culos; determine la probabilidad de que por lo menos 2 de estos vehı́culos lleguen a tiempo. Debe definir una variable e identificar (justificando) su modelo. b) Halle la probabilidad de que el primer vehı́culo que llegue a tiempo sea por lo menos el vigésimo. Debe definir una variable e identificar (justificando) su modelo. Ejercicio 5.18. Si X ∼ b(10; 0,1), encuentre f : la función de probabilidad de Y Y = 10 − X. Use la técnica descrita al final del capı́tulo anterior. Ejercicio 5.19. Si X ∼ exp(2), encuentre la función de densidad de Y = 3X. Use la técnica descrita al final del capı́tulo anterior. Ejercicio 5.20. Una operación financiera resulta rentable con una probabilidad de 0,25. 246 Profesor José Flores Delgado Modelos probabilı́sticos importantes Un inversionista realizará esta operación en 20 oportunidades. Para evaluar los riesgos, se supondrá que las operaciones originan resultados independientes y que la probabilidad de que sea rentable se mantiene constante. Determine la probabilidad de que por lo menos 3 de las operaciones resulten rentables. Debe definir una variable X e identificar, justificando, su modelo. Ejercicio 5.21. Parte del trabajo de un promotor que trabaja en una Administradora de Fondos de Pensiones (AFP) consistente en visitar a personas que están afiliadas a una AFP distinta para tratar de convencerlos de que se cambien a esta AFP. Este promotor, según su experiencia, estima que la probabilidad de convencer a una persona es de apenas 0,05. El promotor decide evaluar ciertos riesgos, para esto considerará que este trabajo obedece un proceso de Bernoulli. a) Diga cuáles son las 2 condiciones que se deben cumplir para que, efectivamente, convencer a los afiliados, en las visitas que realice el promotor, ocurra según un proceso de Bernoulli. b) Durante el año que termina, la gerencia de la AFP considera que el promotor ha realizado un buen trabajo; ası́, le ofrece otorgarle una bonificación extraordinaria (por fin de año) siempre y cuando convenza a, por lo menos, 3 clientes más. La dificultad que enfrenta el promotor es que solo dispone de 20 visitas más; entonces, antes de tomar una medida distinta a las usadas hasta ahora, decide suponer que las condiciones mencionadas en la parte anterior se verifican y emplear la teorı́a básica de modelos probabilı́sticos para cuantificar su confianza actual en lograr 247 Profesor José Flores Delgado Estadı́stica esta bonificación extraordinaria. Efectúe el procedimiento que realizará el promotor y determine el valor que obtendrá. Ejercicio 5.22. Ciertas bacterias se presentan en un depósito de agua conforme un proceso de Poisson con una tasa de cuatro bacterias por cm3 . a) Determine la probabilidad de que, en un volumen de cinco cm3 , se encuentren por lo menos 2 bacterias. Debe definir una variable e identificar, justificando, su modelo. b) Halle la probabilidad de que el volumen de agua que se debe revisar hasta ubicar la primera bacteria esté entre 5 y 10 cm3 . Ejercicio 5.23. Sea X una variable aleatoria con modelo probabilı́stico normal, con media µX y desviación estándar σX . a) Obtenga el valor de la probabilidad P ( | X − µX | ≤ 2σX ). b) Use la técnica de cambio de variable para demostrar la propiedad de estandarización. c) Use la técnica de cambio de variable para demostrar la propiedad de cerradura del modelo normal respecto con respecto a transformaciones lineales. d) Use la técnica de cambio de variable, para demostrar que el cuadrado de la variable estandarizada de X tiene distribución gamma con parámetros α = β = 12 . 248 Profesor José Flores Delgado Modelos probabilı́sticos importantes Ejercicio 5.24. El precio de una unidad del bien A es una variable aleatoria X con modelo normal de media 30 soles y desviación estándar 4 soles. El precio de una unidad del bien B es una variable aleatoria Y con modelo normal de media 20 soles y desviación estándar 3 soles. Estas dos variables son independientes. a) Halle la probabilidad de que el precio de una unidad del bien A sea mayor que 25 soles. b) Se debe comprar una unidad del bien A y otra del bien B; halle la probabilidad de que 55 soles sean suficientes. c) Halle la probabilidad de que el precio de una unidad del bien A sea mayor que el de una del bien B. d) Halle la probabilidad de que el precio de una unidad del bien A sea mayor que dos del bien B. e) Se debe comprar una unidad del bien A y dos del bien B; halle la probabilidad de que 60 soles sean suficientes. Ejercicio 5.25. La distribución de los tiempos necesarios para que las personas se recuperen de la dolencia A se considera normal con media 14,5 horas y desviación estándar 3 horas; mientras que el tiempo necesario correspondiente a la recuperación de la dolencia B se considera normal con media 13,5 horas y cuarto inferior a partir de 15 horas. Suponiendo que existe independencia entre ambos tiempos: 249 Profesor José Flores Delgado Estadı́stica a) Determine el porcentaje de personas que se recuperan de la dolencia A después de 11 horas. b) Determine la cantidad de horas, t, que deberı́a disminuir el tiempo de recuperación de cada persona para reducir en 25 el porcentaje de personas que se recuperan de la dolencia A después de 11 horas. c) Halle la desviación estándar de los tiempos de recuperación de la dolencia B. d) ¿Cuál es la probabilidad de que ambos tiempos de recuperación sean mayores que 11 horas? e) ¿Cuál es la probabilidad de que la media de los tiempos de recuperación de ambas dolencias, para una persona, sea mayor que 11 horas? f) ¿Cuál es el porcentaje de personas que se recuperan de la dolencia A en mayor tiempo que el correspondiente a la dolencia B? Ejercicio 5.26. En una operación financiera la tasa de rentabilidad, R, se considera una variable aleatoria con distribución normal de media 0,05 y desviación estándar 0,25. a) Determine la probabilidad de que la tasa de rentabilidad R, asociada a esta operación financiera, sea superior a 0,3. b) Halle el valor en riesgo (VaR) de un grado de confianza del 95 %. Vea el ejercicio 4.28 250 Profesor José Flores Delgado Modelos probabilı́sticos importantes c) Determine la probabilidad de que el factor de capitalización W = 1 + R, asociado a esta operación, sea superior a 1,25. d) Un inversionista coloca un capital de 10 unidades monetarias (um), en esta operación financiera, a fin de ganar por lo menos 5,5 um. Cuantifique el riesgo que afrontará. e) En el contexto de la parte anterior, determine cuál debe ser el monto del capital que deberá colocar el inversionista para que, con una probabilidad de 0,95 o más, la pérdida no pase de 5,5 um f) Suponga que se realizan dos operaciones independientes con estas caracterı́sticas, pero una de 10 um y la otra de 20 um f1 ) Determine la probabilidad de que, R1 , la rentabilidad de la primera inversión, sea menor o igual que 0,95. f2 ) Determine la probabilidad de que, R2 , la rentabilidad de la segunda inversión, sea mayor que 1,02. f3 ) Halle la probabilidad que la suma de los capitales finales sea por lo menos 30 um. g) El capital acumulado al cabo de una gran cantidad de estas operaciones tiene distribución lognormal con media 60,34 um y desviación estándar 28,39 um. Determine la probabilidad de que un capital inicial de 20 um genere más de 50 um de utilidad. Ejercicio 5.27. El modelo probabilı́stico de Pareto se usa para describir los ingresos, su densidad es de la forma f (x) = α x−β , x > 0, donde α > 0 y β > 0 los parámetros del modelo. 251 Profesor José Flores Delgado Estadı́stica a) Bosqueje, lo más precisamente posible, la gráfica de dicha densidad. b) Encuentre una fórmula explı́cita para la distribución acumulada. c) Encuentre fórmulas explı́citas para la media y la desviación estándar. d) Determine la probabilidad de que el ingreso de una persona sea superior a la media. Ejercicio 5.28. La distribución de los salarios en el sector A se considera normal con una media de 1 450 soles y una desviación estándar de 300 soles. En el sector B la distribución de los ingresos es normal con media 1 350 soles; además el 25 % de los asalariados gana más de 1 500 soles. a) Determine el porcentaje de asalariados, en el sector A, que ganan más de 1 100 soles. b) Determine el percentil 75 de la distribución de los salarios en el sector A. c) ¿En cuál sector los salarios son menos variables? d) Un promotor de créditos visita a una pareja de asalariados, uno del sector A y el otro del B, para ofrecerles un crédito que requiere un salario conjunto de por lo menos 2 500 soles. ¿Cuál es la probabilidad de que esta pareja cumpla el requisito anterior para poder acceder al crédito? Asuma que los salarios son independientes. 252 Profesor José Flores Delgado Modelos probabilı́sticos importantes e) Se escoge al azar un asalariado de la ciudad A y otro de la B. Determine la probabilidad de que el de la ciudad A gane más. Asuma que los salarios son independientes. f) En el contexto de la parte anterior, determine la probabilidad de que ambos salarios se diferencien en 200 soles, como máximo. Ejercicio 5.29. Se realizarán 100 operaciones financieras, en cada una se invertirá 10 um , las tasas de rentabilidad correspondientes son variables aleatorias con modelos probabilı́sticos desconocidos; pero estas son independientes, cada una de las primeras 25 tiene una media de 0,01, y cada una de las restantes 75 una media de 0,02. Cada tasa tiene una desviación estándar de 0,3. Halle la probabilidad de que el capital final esté entre 950 y 1100 um. Ejercicio 5.30. Para el ingreso familiar en una región se considera un modelo lognormal con media 1,65 miles de soles y desviación estándar 2,16 miles de soles. En la tabla siguiente se muestra información incompleta respecto a estos ingresos: x F (x) 0 0 0,5 0,2441 0,75 0,3868 1 --- 1,5 --- 2 --- 2,5 --- 4 --- 8 0,9812 9 0,9860 x es un valor del ingreso familiar y F (x) la proporción de familias con ingresos hasta x. a) ¿El modelo parece estar en armonı́a con los datos? 253 Profesor José Flores Delgado Estadı́stica b) Complete la tabla dada, a partir del modelo dado. c) ¿Cuál es la proporción de familias con ingresos superiores a 5 mil soles? Ejercicio 5.31. La rentabilidad de la operación financiera AA es una variable X ∼ N (0; 0,12 ); mientras que la correspondiente a la operación BB es Y ∼ N (0; 0,22 ), con X e Y independientes. a) Determine el valor en riesgo (VaR), de la operación AA, de un grado de confianza del 95 %; es decir, determine el valor x tal que al invertir en AA, se tenga una probabilidad de 0,95 de que la peor rentabilidad sea -x. b) Un inversionista va a invertir un capital de 10 unidades monetarias (um), con el objetivo de ganar por lo menos 0,25 um b1 ) Determine cuál de las opciones siguientes le resultarı́a más confiable: b11 ) Invertir todo el capital en la operación AA. Note que en este caso la ganancia resulta 10X. b12 ) Invertir todo el capital en la operación BB. b13 ) Invertir 6 um en la operación AA y las otras 4 um en la BB. Note que en este caso la ganancia resulta 4X + 6Y . b2 ) Determine, de ser posible, en qué cantidades debe distribuir el inversionista las 10 um entre las dos operaciones, para tener una confianza del 45 % de lograr su objetivo. 254 Profesor José Flores Delgado Modelos probabilı́sticos importantes Note que en este caso la ganancia resulta aX + (10 − a)Y , con a y 10−a las inversiones en AA y BB, respectivamente. También recuerde que las soluciones de la ecuación √ −B+ B 2 −4AC 2 cuadrática Ax + Bx + C = 0, son y 2A √ −B− B 2 −4AC . 2A Ejercicio 5.32. Un inversionista compra hoy dia un activo financiero, con la expectativa de que al cabo de 4 meses su precio sea de por lo menos 5 mil soles y ası́ vender el activo adquirido. Considere que el precio del activo, en miles de soles, luego de t meses es una variable aleatoria, Yt , descrita por el modelo de precios de Black-Scholes 3 siguiente: Yt = 0,005 exp(1,92t + 0,2Xt ), con Xt ∼ N (0; t), para t > 0. a) Evalúe el riesgo que correrá el inversionista. Recuerde que para b > 0: exp(a) ≤ b ⇔ a ≤ Ln(b). b) ¿Serı́a conveniente para el inversionista no esperar hasta el cuarto mes, sino vender el activo luego de 2 meses solamente? Responda a partir de probabilidades. Ejercicio 5.33. El capital acumulado al cabo de una gran cantidad de operaciones financieras tiene una distribución lognormal, su media es de 60 um y su desviación estándar de 28 um. 3 Veáse Lars Tyge Nielsen (1999), ejemplo 1.7, pág. 13. 255 Profesor José Flores Delgado Estadı́stica a) Encuentre los parámetros de este modelo lognormal. b) Halle la probabilidad de que un capital inicial de 20 um genere más de 25 um de utilidad. Ejercicio 5.34. Los ingresos (en miles de soles), de los trabajadores de cierto sector, son explicados por un modelo lognormal con parámetros µ = 3 y σ 2 = 1. a) Determine la probabilidad de que un trabajador gane 55 mil soles o menos. b) Halle la media y la desviación estándar de los ingresos en este sector. Ejercicio 5.35. Sea X ∼ b(n; p). a) Verifique, calculando, que MX (t) = E(etX ) = (pet +q)n , ∀t ∈ n n i n−i Recuerde que (a + b)n = . i a b . i=0 b) Halle E(X) y E(X 2 ), a partir de la función generadora de momentos. c) Si Y = n − X, halle MY . Recuerde la propiedad: si Y = a + bX, entonces, MY (t) = e a t MX (bt). d) Si Y = n − X, demuestre que X ∼ b(n; q). 256 Profesor José Flores Delgado Modelos probabilı́sticos importantes Use el resultado de la parte anterior y la propiedad por la que la función generadora de momentos determina unı́vocamente el modelo o distribución de la variable. Ejercicio 5.36. Sea X una variable aleatoria con distribución binomial con parámetros n = 1 y p. a) Deducir la función generadora de momentos de X. b) Use la función generadora de X para obtener E(X) y E(X 2 ). c) Si X1 , . . . , Xn es una muestra aleatoria de X, deducir el modelo de X1 + · · · + Xn , a partir de su función generadora de momentos. Ejercicio 5.37. Sea X una variable aleatoria con distribución gamma de parámetros α y β. a) Demuestre que la función generadora de momentos de este modelo está dada por: MX (t) = βα , t < β. (β − t)α b) Sea Y = b X, con b > 0. Use la técnica de cambio de variable para obtener fY : la función de densidad de Y. Luego identifique el modelo obtenido. c) Sea Y = b X, con b > 0. Use la técnica de la función generadora de momentos para obtener el modelo probabilı́stico de Y. 257 Profesor José Flores Delgado Estadı́stica d) Sean X1 , . . . , Xn variables aleatorias independientes y cada una con modelo probabilı́stico gamma con primeros parámetros α1 , . . . , αn , respectivamente, y segundos parámetros iguales a β. Use la técnica de la función generadora de momentos para determinar el modelo probabilı́stico (con sus parámetros) de X1 + · · · + Xn . e) Use la función generadora de X para obtener E(X) y E(X 2 ). Ejercicio 5.38. Sea X una variable aleatoria con distribución exponencial de parámetro β. a) Sea Y = b X, con b > 0. Use la técnica de cambio de variable para obtener fY : la función de densidad de Y. Luego identifique el modelo obtenido. b) Halle la función generadora de X. Use la definición y propiedades del valor esperado. c) Sea Y = b X, con b > 0. Use la técnica de la función generadora de momentos para obtener el modelo probabilı́stico de Y. d) Sean X1 , . . . , Xn variables anteriores independientes y cada una con modelo probabilı́stico exponencial de parámetro β. Use la técnica de la función generadora de momentos para determinar el modelo probabilı́stico (con sus parámetros) de X1 + · · · + Xn . Para esto último vea el resultado del ejercicio siguiente. 258 Profesor José Flores Delgado Modelos probabilı́sticos importantes Ejercicio 5.39. Sea X una variable aleatoria con distribución de Poisson de parámetro λ. a) Deducir la función generadora de momentos de X. b) Use la función generadora de X para obtener E(X) y E(X 2 ). c) Si X1 , . . . , Xn es una muestra aleatoria de X, deducir el modelo de X1 + · · · + Xn , a partir de su función generadora de momentos. Ejercicio 5.40. Sea X una variable aleatoria con distribución de Pascal con parámetros r y p. a) Deducir la función generadora de momentos de X. b) Si X1 , . . . , Xn es una muestra aleatoria de X, deducir el modelo de X1 + · · · + Xn , a partir de su función generadora de momentos. c) Use la función generadora de X para obtener E(X) y E(X 2 ). Ejercicio 5.41. Sea X ∼ g(p). a) Verifique, calculando, que MX (t) = E(etX ) = Recuerde que si 0 < r < 1 : ∞ i=1 259 ri = r 1−r . pet 1−qet , t < −ln q. Profesor José Flores Delgado Estadı́stica b) Si X1 , . . . , Xn son independientes, determine el modelo probabilı́stico X1 + · · · + Xn , a partir de su función generadora. Ejercicio 5.42. Sea X una variable aleatoria con modelo probabilı́stico normal, media igual a µ y varianza igual a σ 2 . Determine, de ser posible, el valor de la constante c tal que P ( | X − µ | ≤ cσ ) = 0,95. Recuerde que |a| ≤ b ⇔ − b ≤ a ≤ b. F (−z) = 1 − F (z). Z Z 260 Además, Z ∼ N (0; 1) ⇒ Profesor José Flores Delgado Referencias bibliográficas 261 Referencias bibliográficas BENJAMIN, Jack, y CORNELL, Allin 1970 Probability, Statistics and Decision for Civil Engineers. New York: McGraw-Hill. COWELL, Frank 1995 Measuring inequality. Londres: Prentice Hall. DEL PINO, Guido 2000 Estadı́stica Teorı́a y Métodos. Santiago de Chile: Ediciones Universidad Católica. LARSON, Harold 1989 Introducción a la Teorı́a de Probabilidades e Inferencia Estadı́stica. México D.F.: Limusa. MUÑOZ, Alejandro 2002 Ingenierı́a sismorresistente. Lima: PUCP. NIELSEN , Lars Tyge 1999 Pricing and hedging of derivate securities. Nueva York: Oxford University Press. PARZEN, Emanuel 1960 Modern probability theory and its applications. Nueva York: Willey. 261 Se terminó de imprimir en los talleres gráficos de T area A sociación G ráfica E ducativa Pasaje María Auxiliadora 156 - Breña Correo e.: tareagrafica@tareagrafica.com Página web: www.tareagrafica.com Teléf. 332-3229 Fax: 424-1582 Setiembre 2017 Lima - Perú ISBN: 978-612-47379-0-9 9 786124 737909