Escuela Profesional de Contabilidad ESTADÍSTICA APLICADA A LOS NEGOCIOS I MODELOS DE DISTRIBUCIÓN DE PROBABILIDADES Docente: Luis Fernando Guerra Jordán Arequipa - 2020 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Tema 1: Variables aleatorias Introducción 1.1. Experimento Aleatorio 1.1.1. Espacio muestral 1.2. Variables Aleatorias 1.2.1. Tipos de variables aleatorias 1.2.2. Variable aleatoria discreta 1.2.3. Variable aleatoria continua 1.3. Funciones de distribución de probabilidades 1.3.1. Función de masa de probabilidad 1.3.2. Función de distribución acumulada 1.4. Parámetros 1.4.1. Valor esperado variable aleatoria discreta 1.4.2. Varianza variable aleatoria discreta 1.5. Propiedades 1.6. Función de una variable aleatoria discreta Relación de problemas de variables discretas 1.7. Variable aleatoria continua 1.8. Función de distribución de probabilidad 1.9. Función de densidad 1.10. Parámetros 1.10.1. Valor esperado variable aleatoria continua 1.10.2. Varianza variable aleatoria discreta 1.11. Función de una variable aleatoria continua Relación de problemas de variables continúas 4 4 4 6 6 7 8 9 9 12 16 16 17 17 19 23 27 27 28 31 31 32 33 36 Tema 2: Modelos de distribución de probabilidades de variables aleatorias discretas Introducción 2.1. Variable aleatoria con distribución binomial 2.1.1. Parámetros Relación de problemas 2.2. Variable aleatoria con distribución geométrica 2.2.1. Parámetros Relación de problemas 2.3. Variable aleatoria con distribución binomial negativa 2.3.1 Parámetros Relación de problemas 2.4. Variable aleatoria con distribución hipergeométrica 2.4.1. Parámetros Relación de problemas 2.5. Variable aleatoria con distribución Poisson 2.5.1. Parámetros Relación de problemas 2 39 40 41 43 44 45 49 50 50 54 56 56 61 62 62 66 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Tema 3: Modelos de distribución de probabilidades de variables aleatorias continuos Introducción 3.1. Variable aleatoria con distribución normal 3.1.1. Parámetros 3.1.2. Cálculo de probabilidades para una distribución normal Relación de problemas 3.2. Variable aleatoria con distribución Chi Cuadrado 3.2.1. Parámetros 3.2.2. Cálculo de probabilidades para una distribución Chi cuadrado Relación de problemas 3.3. Variable aleatoria con distribución t student 3.3.1. Parámetros Relación de problemas 3.4. Variable aleatoria con distribución F 3.4.1. Parámetros Relación de problemas Anexos 3 72 73 73 75 85 102 102 104 108 109 110 113 115 115 121 122 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán EXPERIMENTO ALEATORIO Introducción La finalidad de todo experimento científico es la obtención de información de interés acerca de cualquier fenómeno de la Naturaleza. Dentro de los experimentos científicos hay algunos cuyo desarrollo es previsible con certidumbre, y sus resultados están perfectamente determinados una vez fijada las condiciones del mismo: se conocen con el nombre de “experimentos determinísticos”. Frente a estos experimentos que pueden realizarse en contexto de certidumbre, aparecen los que pueden realizarse en un contexto de incertidumbre. A estos se les llama “experimentos o fenómenos aleatorios”; estos fenómenos dependen del “azar”. El objeto de estudio del Cálculo de Probabilidades lo constituyen los fenómenos o experimentos aleatorios. Algunas propiedades que caracterizan los fenómenos aleatorios son: 1. 2. 3. 4. En las mismas condiciones iniciales pueden dar lugar a diferentes resultados finales. Todos los resultados posibles se conocen por anticipado. No se puede predecir el resultado en cada experimento particular. En general, puede repetirse en las mismas condiciones indefinidamente. Definición Un experimento "𝜉" es aleatorio, cuando bajo las mismas condiciones que se realiza, los resultados no se pueden conocer anticipadamente, sino posteriormente. Ejemplos 1.1 𝜉 : Ir eligiendo los distintos días (individuos) y observando la demanda de 4 artículos por día. 𝜉 : Lanzar un dado y anotar el número que aparece en la cara superior. 𝜉 : Lanzar un par de monedas y anotar el resultado que aparece en cada una de ellas. 𝜉 : Orientación del voto de un elector antes que se produzcan las elecciones presidenciales. 𝜉 : Seleccionar una familia de un barrio popular de un distrito y anotar el número de integrantes. 𝜉 : Seleccionar un ama de casa y anotar la cantidad de hijos que tiene. Si bien es cierto que en los experimentos aleatorios no se pueden conocer los resultados anticipadamente, se debe conocer los resultados posibles de un experimento de esta naturaleza. Para comenzar a construir el modelo de distribución de probabilidad asociado a una variable aleatoria, es necesario especificar los resultados posibles de un experimento aleatorio 𝜉 , al conjunto de resultados posibles de un experimento aleatorio se le llama espacio muestral. ESPACIO MUESTRAL Definición Al conjunto de todos los resultados diferentes de un experimento aleatorio 𝜉, lo denominaremos espacio muestral, y se denota por Ω. Cada resultado diferente del experimento se llama evento elemental o suceso elemental, y lo denotaremos por 𝜔. 4 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplos 1.1 Si el experimento aleatorio 𝜉, consiste en lanzar un dado, podemos convenir que los resultados posibles son cada una de las posibles caras., luego el espacio muestral es, Ω = {1; 2; 3; 4; 5; 6} Si el experimento aleatorio 𝜉, consiste en seleccionar un ama de casa y anotar la cantidad de hijos que tiene, luego el espacio muestral es, .Ω = {0; 1; 2; 3; … } Si el experimento aleatorio 𝜉, consiste en predecir la orientación del voto de un elector antes que se produzcan las elecciones presidenciales. Si se considera que los resultado posibles son: derecha, centro e izquierda, el espacio muestral es, .Ω = {𝑑𝑒𝑟𝑒𝑐ℎ𝑎; 𝑐𝑒𝑛𝑡𝑟𝑜; 𝑖𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑎} Si el experimento aleatorio 𝜉 consiste en seleccionar dos familias de un barrio popular de un distrito y anotar si no superan los 4 integrantes o si él número de integrantes es superior a 4, luego el espacio muestral es, .Ω = {(𝐴; 𝐴); (𝐴; 𝐵); (𝐵; 𝐴); (𝐵; 𝐵)} Donde: 𝐴: La familia de un barrio popular de un distrito no superan los 4 integrantes. 𝐵: La familia de un barrio popular de un distrito superan los 4 integrantes. Sin embargo, para experimentos más complejos, en cuanto a la determinación de la cantidad de elementos del espacio muestral Ω, se puede utilizar diferentes técnicas, por ejemplo el diagrama del árbol. Ejemplos 1.2 Las personas A, B y C entran a un edificio en diferentes momentos. El resultado de que A llegue primero, B segundo y C tercero puede ser indicado por ABC. Determine: a) El espacio muestral de las posibles llegadas. b) El evento de que llegue A primero. c) El evento de que A no llegue primero. SOLUCIÓN Para determinar los elementos del espacio muestral Ω, utilizamos el diagrama del árbol, como se muestra en la siguiente figura: Persona que Persona que llega primero llega segundo A B C Persona que llega tercero B C ABC C B A C C ACB BAC A BCA B A CBA A B CAB 5 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad a) Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Luego el espacio muestral es, Ω = {(ABC); (ACB); (BAC); (BCA); (CBA); (CAB)} b) El evento de que llegue A primero, está dado por: {(ABC); (ACB)} c) El evento de que A no llegue primero, está dado por: {(BAC); (BCA); (CBA); (CAB)} Ejemplos 1.3 Un empleado de banco que va todos los días a su oficina en automóvil puede llegar desde su casa hasta la autopista por dos rutas diferentes (A; B). Luego,, puede tomar tres caminos distintos para ir de la autopista al centro de la ciudad (I, I y III) y del centro de la ciudad hasta el parqueadero donde guarda su automóvil, puede ir por dos rutas (1 y 2). Determine: a) El espacio muestral de cuántas rutas diferentes puede ir el empleado a su oficina b) El evento de que use la ruta II para llegar a su oficina. c) El evento de que llegue usando la autopista B y el parqueadero 1 para llegar a su oficina. ¿Por cuántas rutas diferentes puede ir el empleado a su oficina?. Para enumerar los elementos del espacio muestral Ω asociado al Experimento aleatorio 𝜉, utilizamos el diagrama del árbol: Autopista A B Centro Parqueadero 1 de I la 2 1 II 2 1 III 2 1 I 2 1 II 2 1 III 2 Número de rutas diferentes AI1 AI2 AII1 AII2 AIII1 AIII2 BI1 BI2 BII1 BII2 BIII1 BIII2 a) El espacio muestral Ω asociado al Experimento aleatorio 𝜉 es: Ω = {AI1; AI2; AII1; AII2; AIII1; AIII2; 𝐵I1; 𝐵I2; 𝐵II1; 𝐵II2; 𝐵III1; 𝐵III2} Donde: 𝐴; 𝐵: Es el evento “Tipo de ruta para ir de la casa a la autopista” 𝐼; 𝐼𝐼 𝑦 𝐼𝐼𝐼: Es el evento “Tipo de ruta para ir de la autopista al centro” 1 𝑦 2: Es el evento “Tipo de ruta del centro de la ciudad hasta el parqueadero donde guarda su automóvil” b) El evento de que use la ruta II para llegar a su oficina está dado por: Ω = {AII1; AII2; 𝐵II1; 𝐵II2; 𝐵III1} c) El evento de que llegue usando la autopista B y el parqueadero 1 para llegar a su oficina está dado por: Ω = {𝐵I1; 𝐵I2} 6 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIABLE ALEATORIA Introducción Al realizar un experimento, las unidades de análisis presentan características que pueden ser medibles o ser atributos, por ejemplo, al analizar las familias debe ser más importante cuantificar el número de familias con más de 4 integrantes. Esa cantidad de interés, definida sobre el espacio muestral se denomina variable aleatoria. Podemos encontrar variables aleatorias en las que algunos valores aparecen con mayor frecuencia (o mayor probabilidad) y otros lo hacen con una frecuencia menor (menor probabilidad). Otras variables, en cambio, presentan valores que se repiten aproximadamente con la misma frecuencia (misma probabilidad). Este hecho hace que el comportamiento que tienen los posibles valores de una variable aleatoria en relación a la frecuencia con la que los podemos encontrar en las unidades experimentales sea objeto de posible estudio. Definición Una variable aleatoria 𝑋, es una función que asigna un número real 𝑥 a cada posible resultado de un experimento aleatorio 𝜉, es decir: 𝑋: Ω → 𝑅 𝜔 ↦ 𝑋(𝜔) = 𝑥 Donde: Ω: Espacio muestral asociado al experimento aleatorio 𝜉. 𝑅: Conjunto de número reales. 𝜔: Elemento del espacio muestral Ω, A continuación veremos su representación gráfica Figura 1.1 Representación gráfica de una variable aleatoria X Dominio: El dominio de la función 𝑋 está dado por el conjunto de resultados del espacio muestral Ω, es decir: 𝐷𝑜𝑚𝑋 = Ω Rango o Soporte: El rango o soporte de la función 𝑋 está dado por el conjunto de valores que puede tomar una variable aleatoria 𝑋,, es decir: 𝑆𝑋 = {𝑥 ∈ 𝑹/ 𝑋(𝜔) = 𝑥 } ; 7 𝑆𝑋 ⊂ 𝑅 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán La descripción numérica del resultado de un experimento aleatorio se denomina variable aleatoria. Tipo de Variables Aleatorias De acuerdo a los valores que asume la variable aleatoria, se puede clasificar en: Variable aleatoria discreta Variable aleatoria continua VARIABLE ALEATORIA DISCRETA CONTINUA Variable Aleatoria Discreta Si el número de posibles valores de X (esto es su RX) es finito (contable) o es infinito numerable. Ejemplos 1.4 Variable Aleatoria Continua Si el número de posibles valores de X (esto es su R X) es infinito no es numerable, es decir puede tomar infinitos valores dentro de un intervalo de la recta real. Ejemplos 1.5 Observación En los experimentos aleatorios 𝜉, no sólo existe una variable aleatoria que es de interés, puede estar interesado en otras variables de interés, por ejemplo, en las vigas de concreto en otras variables de medición físicas o químicas. 8 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán DISTRIBUCIONES DE PROBABILIDAD DE UNA VARIABLE ALEATORIA Las distribuciones de probabilidad de una variable aleatoria X, consiste en conocer la función 𝑓, que determine para cada valor asociado de la variable aleatoria, su probabilidad de ocurrencia correspondiente, sus parámetros asociados, los cuales permiten conocer el promedio y la variabilidad de los valores de la variable y sus probabilidades correspondientes y además, en forma gráfica es tablecer el comportamiento correspondiente. DISTRIBUCIONES DE PROBABILIDAD FUNCIONES GRÁFICOS PARÁMETROS La distribución de una variable X se define como una descripción del conjunto de valores posibles 𝑥𝑖 de X, junto con la probabilidad asociada 𝑝𝑖 con cada uno de estos valores. La distribución de probabilidad se puede representar mediante: a) Función de probabilidad: 𝑓 (Fórmula) b) Tabla c) Diagrama o Gráfica Es decir: 𝒇 𝒙𝟏 𝒙𝟐 𝒙𝟑 ⋮ 𝒙𝒏 𝒑𝟏 𝒑𝟐 𝒑𝟑 ⋮ 𝒑𝒏 Función discreta de masa de probabilidades o de cuantía (𝒇𝒎𝒑) Es una función de probabilidad 𝒇 , que asigna al conjunto de sus posibles valores numéricos 𝒙 de la variable aleatoria discreta 𝑿 , sus probabilidades 𝒑𝒊 correspondientes, es decir: 𝒇: 𝑹 → [𝟎; 𝟏] 𝒙 ↦ 𝒇(𝒙) = 𝑃(𝑋 = 𝑥) Donde: 𝑃(𝑋 = 𝑥) ; 𝑥 ∈ 𝑆𝑥 . 𝑓(𝑥) = { 0 ; 𝑥 ∉ 𝑆𝑥 Tal que: (1) 𝑓 (𝑥 ) ≥ 0 (2) ∑ 𝑓 (𝑥 ) ≥ 0 𝑥∈𝑅𝑥 9 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Notación: 𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑝(𝑥) = 𝑝𝑥 A continuación veremos su representación gráfica Figura 1.3. Representación gráfica de la función de masa de probabilidad variable aleatoria X Ejemplos 1.6 Una viga de concreto podría fallar ya sea por esfuerzo de corte (S) o flexión ( F). Supóngase que se eligen al azar tres vigas con fallas y se determina el tipo de falla para cada una. Sea X = número de vigas entre las tres seleccionadas que fallaron por esfuerzo de corte. Considérese que la probabilidad de que una viga falle por esfuerzo de corte, es de 0.25. Encuentre las probabilidades asociadas a todos los valores de la variable X. Solución El espacio muestral Ω asociado al Experimento aleatorio 𝜉 es: Ω = {𝑆𝑆𝑆; 𝑆𝑆𝐹; 𝑆𝐹𝑆; 𝐹𝑆𝑆; 𝑆𝐹𝐹; 𝐹𝑆𝐹; 𝐹𝐹𝑆; 𝐹𝐹𝐹} Donde: 𝑆: Es el evento “Una viga de concreto falla por esfuerzo de corte” 𝐹: Es el evento “Una viga de concreto falla por esfuerzo de flexión” Sea X la variable aleatoria definida como “número de vigas entre las tres seleccionadas que fallaron por esfuerzo de corte”. Según esto, pueden fallar 0, 1, 2 o las 3 vigas de concreto; por lo que los valores posibles de X son 0, 1, 2, 3; es decir: 𝑅𝑥 = 0; 1; 2; 3 Luego, se resume en la siguiente tabla el espacio muestral Ω y los valores de la variable aleatoria 𝑋 Espacio Muestral: Ω Variable aleatoria: 𝑋 𝑆𝑆𝑆 𝑆𝑆𝐹; 𝑆𝐹𝑆; 𝐹𝑆𝑆 𝑆𝐹𝐹; 𝐹𝑆𝐹; 𝐹𝐹𝑆 𝐹𝐹𝐹 𝑥1 𝑥2 𝑥3 𝑥4 =0 =1 =2 =3 Sea 𝑆 el evento “Una viga de concreto falla por esfuerzo de corte” tal que 𝑃(𝑆) = 0,25 𝑦 𝑆 𝑐 = 𝐹, el evento “Una viga de concreto no falla por esfuerzo de corte, es decir, falle por esfuerzo de flexión (F)” luego 𝑃(𝐹 𝑐 ) = 𝑃(𝐹) = 0,75 10 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Entonces: 𝑝(0) = 𝑃(𝑋 = 0) = 𝑃(𝑆 𝑐 𝑆 𝑐 𝑆 𝑐 ) = 𝑃 (𝐹𝐹𝐹 ) = 𝑃(𝐹)𝑃(𝐹 )𝑃(𝐹 ) = (3/4)3 = 27⁄64 𝑝(1) = 𝑃(𝑋 = 1) = 𝑃{(𝐹𝐹𝑆) ∪ (𝐹𝑆𝐹 ) ∪ (𝑆𝐹𝐹 )} = 𝑃(𝐹𝐹𝑆) + (𝐹𝑆𝐹 ) + (𝑆𝐹𝐹 ) = 3(1/4)(3/4)2 = 27⁄64 𝑝(2) = 𝑃(𝑋 = 2) = 𝑃{(𝑆𝑆𝐹 ) ∪ (𝑆𝐹𝑆) ∪ (𝐹𝑆𝑆)} = 𝑃(𝑆𝑆𝐹 ) + (𝑆𝐹𝑆) + (𝐹𝑆𝑆) = 3(1/4)2 (3/4) = 9⁄64 𝑝(3) = 𝑃(𝑋 = 3) = 𝑃(𝑆𝑆𝑆) = (1/4)3 = 1⁄64 Luego, se resume en la siguiente tabla los valores de la variable aleatoria 𝑋 y las probabilidades asociadas. 𝑋 = 𝑥𝑖 𝑃(𝑋 = 𝑥𝑖 ) = 𝑝(𝑥𝑖 ) = 𝑝𝑖 0 (3/4)3 = 27⁄64 1 3(1/4)(3/4)2 = 27⁄64 2 3(1/4)2 (3/4) = 9⁄64 3 (1/4)3 = 1⁄64 La función "𝑓", que establece el cálculo de las probabilidades está dada por. 3 𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝑥 1 3 𝑥 2 3 3−𝑥 A continuación veremos su representación gráfica 𝒇(𝒙) 27/64 9/64 1/64 0 1 2 3 𝒙 En muchas ocasiones, se requiere calcular la probabilidad de que el valor observado de una variable aleatoria 𝑿 sea menor o igual que algún número real 𝒙. La distribución acumulada de probabilidad puede usarse para encontrar la función de masa de probabilidad 𝒇, de una variable aleatoria. Luego, la función de distribución acumulada es un método alternativo para describir la distribución de probabilidad de una variable aleatoria. 11 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 𝑭 𝒙𝟏 𝒙𝟐 𝒙𝟑 ⋮ 𝒙𝒏 𝒑𝟏 𝒑𝟏 + 𝒑𝟐 𝒑𝟏 + 𝒑𝟐 + 𝒑𝟑 ⋮ 𝒑𝟏 + 𝒑𝟐 + ⋯ + 𝒑𝒏−𝟏 + 𝒑𝒏 Función de distribución de probabilidad acumulada (𝒇𝒅𝒑) Es una función de probabilidad 𝑭 , que asigna las probabilidades acumuladas menores o iguales al conjunto de sus posibles valores numéricos 𝒙𝒊 de la variable aleatoria discreta 𝑿 , es decir: 𝐹: 𝑅 → [0; 1] 𝑥 ↦ 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) Donde: 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∑ 𝑝(𝑥𝑖 ) ∀𝑥 ∈ 𝑅 𝑥𝑖 ∈𝑆𝑥 , 𝑥𝑖≤𝑥 Tal que: (1) 0 ≤ 𝐹(𝑥𝑖 ) ≤ 1 (2) 𝐹(𝑥1 ) ≤ 𝐹(𝑥2 ) ∀ 𝑥1 < 𝑥2 Ejemplos 1.7 Una viga de concreto podría fallar ya sea por esfuerzo de corte (S) o flexión ( F). Supóngase que se eligen al azar tres vigas con fallas y se determina el tipo de falla para cada una. Sea X = número de vigas entre las tres seleccionadas que fallaron por esfuerzo de corte. Considérese que la probabilidad de que una viga falle por esfuerzo de corte, es de 0.25. Establezca la función de distribución acumulada. Solución Sabemos que la función de probabilidad está dado por la siguiente tabla: 𝑋=𝑥 𝑃(𝑋 = 𝑥) = 𝑝(𝑥) 0 1 2 3 27⁄64 27⁄64 9⁄64 1⁄64 Por consiguiente, la función de distribución tomaría los siguientes valores: 12 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 𝐹(𝑡) = 𝑃(𝑋 ≤ 𝑡) = ∑ 𝑝(𝑥) ∀𝑡 ∈ 𝑅 𝑥∈𝑆𝑥 , 𝑥≤𝑡 Veamos qué sucede cuando 𝑡 resulta siendo un valor de la variable aleatoria, es decir: 𝑡 ∈ 𝑆𝑥 𝐹 (0) = 𝑃 (𝑋 ≤ 0) = 𝑝(𝑥 ) = 𝑝(0) = 27⁄64 ∑ 𝑥∈𝑆𝑥 , 𝑥≤0 𝐹 (1) = 𝑃 (𝑋 ≤ 1) = 𝑝(𝑥 ) = 𝑝(0) + 𝑝(1) = 27⁄64 + 27⁄64 = 54⁄64 ∑ 𝑥∈𝑆𝑥 , 𝑥≤1 𝐹 (2) = 𝑃 (𝑋 ≤ 2) = 𝑝(𝑥 ) = 𝑝(0) + 𝑝(1) + 𝑝(2) = 27⁄64 + 27⁄64 + 9⁄64 = 63⁄64 ∑ 𝑥∈𝑆𝑥 , 𝑥≤2 𝐹 (3 ) = 𝑃 (𝑋 ≤ 3 ) = 𝑝( 𝑥 ) = 𝑝 ( 0 ) + 𝑝 ( 1 ) + 𝑝 ( 2 ) + 𝑝 ( 3 ) ∑ 𝑥∈𝑆𝑥 , 𝑥≤3 = 27⁄64 + 27⁄64 + 9⁄64 + 1⁄64 = 64⁄64 = 1 Hay que hacer notar que la función de distribución está definida para cualquier número real, es decir que toma un valor también para valores que no tome la variable aleatoria, es decir, 𝑡 resulta un número real, 𝑡 ∈ 𝑅 𝑡 = −0,54 𝐹 (−0,54) = 𝑃(𝑋 ≤ −0,54) = 𝑝( 𝑥 ) = 0 ∑ 𝑥∈𝑆𝑥 , 𝑥≤−0,54 𝑡 = 0,80 𝐹 (0,80) = 𝑃(𝑋 ≤ 0,80) = 𝑝(𝑥) = 𝑝(0) = 27⁄64 ∑ 𝑥∈𝑆𝑥 , 𝑥≤0,80 𝑡 = 1,42 𝐹(1,42) = 𝑃(𝑋 ≤ 1,42) = 𝑝(𝑥 ) = 𝑝(0) + 𝑝(1) = 54⁄64 ∑ 𝑥∈𝑆𝑥 , 𝑥≤1,42 Luego, la función de distribución acumulada está dada por la función: 0 ; 27⁄64 ; 𝐹(𝑡) = 54⁄64 ; 63⁄64 ; { 64⁄64 = 1 𝑡<0 0≤𝑡<1 1≤𝑡<2 2≤𝑡<3 ; 𝑡≥3 A continuación veremos su representación gráfica de la función de distribución (fdp): 𝑭(𝒙) 64/64 63/64 54/64 27/64 0 1 2 13 3 𝒙 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán En forma general la función de distribución acumulada 𝐹(𝑥 ) se puede representar mediante la siguiente regla de correspondencia: La representación gráfica de la función de distribución acumulada 𝐹 (𝑥 ) se muestra en la siguiente figura: Relación entre la función de distribución de probabilidad (𝒇𝒅𝒑) y la función de masa de probabilidad (𝒇𝒎𝒑) La función de distribución acumulada está relacionada con la función de probabilidad (cuantía o masa) de la siguiente manera: 𝑓(𝑥𝑖 ) = 𝐹(𝑥𝑖 ) − 𝐹(𝑥𝑖−1 ) ; ∀ 𝑥𝑖 ∈ 𝑅𝑥 Ejemplos 1.8 Suponga que la función de distribución acumulada de la variable aleatoria X es la de la figura: Determine la función de probabilidad (cuantía o masa) de la variable aleatoria X. SOLUCIÓN De acuerdo a la gráfica y la propiedad (según el ejercicio anterior) tenemos 𝑓(𝑥𝑖 ) = 𝐹(𝑥𝑖 ) − 𝐹(𝑥𝑖−1 ) 14 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Luego, la función de probabilidad (cuantía o masa) de la variable aleatoria X es: Propiedades Tenemos las siguientes propiedades que se cumplen, de acuerdo a la definición de la función de distribución acumulada (𝒇𝒅𝒑) y el cálculo de probabilidades, consideremos 𝑥𝑖 , 𝑥𝑗 ∈ 𝑅𝑥 . (Puntos de discontinuidad). a) b) c) d) e) 𝐹(𝑥𝑖 ) = 𝑃(𝑋 ≤ 𝑥𝑖 ) 𝐹(𝑥𝑖−1 ) = 𝑃(𝑋 < 𝑥𝑖 ) 1 − 𝐹(𝑥𝑖−1 ) = 𝑃(𝑋 ≥ 𝑥𝑖 ) 1 − 𝐹(𝑥𝑖 ) = 𝑃(𝑋 > 𝑥𝑖 ) 𝐹(𝑥𝑖 ) − 𝐹(𝑥𝑗−1 ) = 𝑃(𝑥𝑗−1 ≤ 𝑋 ≤ 𝑥𝑖 ) Si consideremos 𝑠, 𝑡 ∈ 𝑅. (Puntos que no son de discontinuidad), es decir 𝑥, 𝑠 ∉ 𝑅𝑥 , entonces se cumple las siguientes relaciones: a) b) c) 𝐹(𝑠) = 𝑃(𝑋 < 𝑠) = 𝑃(𝑋 ≤ 𝑠) 1 − 𝐹(𝑠) = 𝑃(𝑋 ≥ 𝑠) = 𝑃(𝑋 > 𝑠) 𝐹(𝑡) − 𝐹(𝑠) = 𝑃(𝑠 ≤ 𝑋 ≤ 𝑡) Ejemplos 1.9 Sea 𝑋: número de vigas entre las tres seleccionadas que fallaron por esfuerzo de corte con valores 𝑅𝑋 = 0; 1; 2; 3 y la función de distribución acumulada (𝒇𝒅𝒑): 0 ; 𝑥<0 . 27⁄64 𝐹(𝑥 ) = 54⁄64 ; 0≤𝑥<1 . ; 1≤𝑥<2 . 63⁄64 ; 2≤𝑥<3 . { 64⁄64 = 1 ; 𝑥 ≥ 3 Calcule las siguientes probabilidades: a) b) c) d) e) 𝑃(𝑋 < 1.1) 𝑃 (𝑋 < 1) 𝑃(𝑋 > 2.75) 𝑃 (𝑋 > 2) 𝑃(0.2 < 𝑋 < 1.8) 15 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Solución a) 𝑃(𝑋 < 1.1) = 𝐹 (1.1) = 54⁄64 b) c) d) e) 𝑃(𝑋 < 1) = 𝐹 (0) = 27⁄64 𝑃(𝑋 > 2.75) = 1 − 𝐹 (2.75) = 1 − 63⁄64 𝑃(𝑋 > 2) = 1 − 𝐹(2) = 1 − 63⁄64 𝑃(0.2 < 𝑋 < 1.8) = 𝐹 (1.8) − 𝐹 (0.2) = 54⁄64 − 27⁄64 Ejemplos 1.10 Sea la variable aleatoria 𝑋 con valores 𝑅𝑋 = 0; 1; 2; 3 y la función de distribución acumulada (𝒇𝒅𝒑): 0 ; 𝑥<0 . 𝐹 (𝑥 ) = 0.3 ; 0≤𝑥<1 0.5 ; 1≤𝑥<2 . ; 2≤𝑥<3 . ; 𝑥≥3 . 0.9 { 1 Calcule las siguientes probabilidades: a) b) c) d) e) 𝑃(𝑋 < 1.6) 𝑃 (𝑋 < 1) 𝑃(𝑋 > 2.86) 𝑃 (𝑋 > 2) 𝑃(0.5 < 𝑋 < 1.6) Respuestas: a) 0.5 b) 0.3 c) 0.1 d) 0.1 e) 0.2 PARÁMETROS Es una función de probabilidad 𝑭 , que asigna las probabilidades acumuladas menores o iguales al conjunto de sus posibles valores numéricos 𝒙𝒊 de la variable aleatoria discreta 𝑿 , es decir: Valor esperado de una variable aleatoria Varianza y desviación estándar de una variable aleatoria PARÁMETROS VALOR ESPERADO VARIANZA Y DESVIACIÓN ESTÁNDAR ESPERANZA O VALOR ESPERADO Es el valor promedio, a largo plazo de la variable aleatoria. Es conocida también como su “valor esperado” 𝝁𝑿 = 𝑬(𝑿) = ∑ 𝒙 𝒑(𝒙) 𝑥∈𝑅𝑥 16 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIANZA Se utiliza para describir el grado de dispersión o variación cuadrática en una distribución de probabilidades. 𝜎𝑋2 = 𝑉𝑎𝑟(𝑋) = ∑ (𝑥 − 𝜇𝑋 )2 𝑝(𝑥) 𝑥∈𝑅𝑥 Otra forma, para el cálculo de la varianza está dado por la siguiente expresión: 𝜎𝑋2 = 𝑉𝑎𝑟(𝑋) = ∑ 𝑥 2 𝑝(𝑥) − 𝜇𝑋 2 𝑥∈𝑅𝑥 DESVIACIÓN ESTÁNDAR Se utiliza para describir el grado de dispersión o variación en una distribución de probabilidades. 𝜎𝑋 = √𝑉𝑎𝑟(𝑋) Ejemplos 1.11 Una viga de concreto podría fallar ya sea por esfuerzo de corte (S) o flexión ( F). Supóngase que se eligen al azar tres vigas con fallas y se determina el tipo de falla para cada una. Sea X = número de vigas entre las tres seleccionadas que fallaron por esfuerzo de corte. Considérese que la probabilidad de que una viga falle por esfuerzo de corte, es de 0.25. Calcule e interprete: a) El valor esperado de la variable aleatoria X b) La varianza y desviación estándar de la variable aleatoria X Se calcula el “valor esperado” 𝝁𝑿 , y la varianza 𝜎𝑋2 , de la variable aleatoria X, realizando los cálculos correspondientes, como se muestra en la siguiente tabla: 𝑥 𝑝(𝑥) 𝑥𝑝(𝑥) 𝑥 2 𝑝(𝑥) 0 1 2 3 27⁄64 27⁄64 9⁄64 1⁄64 0 27⁄64 18⁄64 3⁄64 48⁄64 0 27⁄64 36⁄64 9⁄64 72⁄64 Según la tabla, tenemos los siguientes resultados: ∑ 𝑥 𝑝(𝑥) = 48⁄64 = 3⁄4 𝑥∈𝑅𝑥 ∑ 𝑥2 𝑝(𝑥) = 72⁄64 = 9⁄8 𝑥∈𝑅𝑥 Reemplazando en las fórmulas tenemos que: 𝜇𝑋 = 𝐸(𝑋) = ∑ 𝑥 𝑝(𝑥) = 3⁄4 𝑥∈𝑅𝑥 𝜎𝑋2 = 𝑉𝑎𝑟(𝑋) = ∑ 𝑥 2 𝑝(𝑥) − 𝜇𝑋 2 = 9⁄8 − (3⁄4)2 = 9⁄16 𝑥∈𝑅𝑥 𝜎𝑋 = √𝑉𝑎𝑟(𝑋) = √9⁄16 = 3⁄4 17 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Interpretación Se espera que el número de vigas entre las tres seleccionadas que fallaron por esfuerzo de corte es de aproximadamente 1. ( 𝜇𝑋 = 3⁄4) Se espera que la dispersión del número de vigas entre las tres seleccionadas que fallaron por esfuerzo de corte con respecto a su valor esperado sea de aproximadamente ±1. ( 𝜎𝑋 = 3⁄4). PROPIEDADES DEL VALOR ESPERADO Y LA VARIANZA PROPIEDADES DEL VALOR ESPERADO Sea X una variable aleatoria con valor esperado 𝐸[𝑋]. Si b 𝑦 𝑐 son constantes, entonces: (1) 𝐸[𝑐]= 𝑐 (2) 𝐸[𝑐𝑋]= 𝑐𝐸[𝑋] (3) 𝐸[𝑋 + 𝑐]= 𝐸[𝑋] + 𝑐 (4) 𝐸[𝑏𝑋 + 𝑐]= 𝑏𝐸[𝑋] + 𝑐 Ejemplos 1.12 Una pareja casada trabaja para un empresario. La paga extra de Navidad de la mujer es una variable aleatoria cuyo valor esperado es 1500 dólares. (a) Si la paga extra del marido se fija igual al 80% de la de la mujer, encuentre el valor esperado de la paga extra del marido (b) Si la paga extra del marido se establece igual a 1000 dólares más que la de su mujer, encuentre su valor esperado. Denote como X la paga extra (en dólares) de la mujer. (a) Puesto que la paga extra del marido es 0,8X; se tiene que 𝐸[𝑝𝑎𝑔𝑎 𝑒𝑥𝑡𝑟𝑎 𝑑𝑒𝑙 𝑚𝑎𝑟𝑖𝑑𝑜] = 𝐸[0,8𝑋] = 0,8𝐸[𝑋] = 1200 𝑑ó𝑙𝑎𝑟𝑒𝑠 (b) En este caso, la paga extra del marido es X+100; por consiguiente 𝐸[𝑝𝑎𝑔𝑎 𝑒𝑥𝑡𝑟𝑎 𝑑𝑒𝑙 𝑚𝑎𝑟𝑖𝑑𝑜] = 𝐸[𝑋 + 100] = 𝐸[𝑋] + 100 = 2500 PROPIEDADES DE LA VARIANZA Sea X una variable aleatoria con varianza 𝑉[𝑋]. Si b 𝑦 𝑐 son constantes, entonces: (1) 𝑉[𝑐]=0 (2) 𝑉[𝑋 + 𝑐]=𝑉[𝑋] 18 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán (3) 𝑉[𝑏𝑋]= 𝑏 2 𝑉[𝑋] (4)𝑉[𝑏𝑋 + 𝑐]= 𝑏 2 𝑉[𝑋] FUNCIÓN DE UNA VARIABLE ALEATORIA Dado un experimento aleatorio y una variable aleatoria discreta X en él, con rango 𝑅𝑋 , y sea una 𝑌 = ℎ(𝑋) una variable aleatoria discreta, donde, ℎ es una función definida en 𝑅𝑋 , entonces: 𝒀: 𝑅𝑋 → 𝑅𝑌 𝒙 ↦ 𝒀(𝒙) = 𝒚 Donde: 𝑌 = ℎ(𝑋) = ℎ ∘ 𝑋 A continuación veremos su representación gráfica Figura 1.3. Representación gráfica de la composición entre las variables aleatoria X e Y. Función discreta de masa de probabilidades o de cuantía (𝒇𝒎𝒑) asociada a la variable aleatoria 𝒀 Es una función de probabilidad 𝒈 , que asigna al conjunto de sus posibles valores numéricos 𝒚 de la variable aleatoria discreta 𝒀 = 𝒉(𝑿) , sus probabilidades 𝒑(𝒚) correspondientes, es decir: 𝒈: 𝑹 → [𝟎; 𝟏] 𝒚 ↦ 𝒈(𝒚) = 𝑃(𝑌 = 𝑦) Donde: 𝑃(𝑌 = 𝑦) ; 𝑦 ∈ 𝑅𝑌 . 𝑔(𝑦) = { 0 19 ; 𝑥 ∉ 𝑅𝑌 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Como 𝑌 = ℎ(𝑋), entonces el cálculo de probabilidades, estará en función de las probabilidades asociadas a la variable aleatoria 𝑋, es decir: 𝑃(𝑌 = 𝑦) = ∑ 𝑃(𝑋 = 𝑥) 𝑥∈𝑅𝑥 ; 𝑓(𝑥)=𝑦 Figura 1.3. Representación gráfica de la composición entre las variables aleatoria X e Y. Dado un experimento aleatorio y una variable aleatoria discreta X en él, con rango 𝑅𝑋 , y sea una 𝑌 = ℎ(𝑋) una variable aleatoria discreta, donde, ℎ es una función uno a uno definida en 𝑅𝑋 , con rango 𝑅𝑌 , entonces: 𝑃(𝑌 = 𝑦) = 𝑃(𝑋 = 𝑥) Ejemplos 1.13 Sea X la variable aleatoria discreta, con función de probabilidad definida mediante la siguiente tabla: 𝑋=𝑥 −1 0 1 2 𝑃(𝑋 = 𝑥) 0.2 0.1 0.3 0.4 Encuentre la distribución de probabilidad, en cada uno de los casos siguientes: a) 𝑌 = 3𝑋 + 8 b) 𝑌 = 3𝑋2 + 2 En el primer caso, como la función ℎ, definida por 𝑌 = ℎ(𝑋) = 3𝑋 + 8, es uno a uno, entonces 𝑃(𝑌 = 𝑦) = 𝑃(𝑋 = 𝑥) 𝑋=𝑥 −1 0 1 2 𝑌 = ℎ(𝑋) = 3𝑋 + 8 5 8 11 14 𝑃(𝑋 = 𝑥) = 𝑃(𝑌 = 𝑦) 0.2 0.1 0.3 0.4 En el segundo caso, como la función ℎ, definida por 𝑌 = ℎ(𝑋) = 3𝑋2 + 2, no es uno a uno en todo 𝑅, entonces, en los puntos 𝑋 = ±1, la variable aleatoria 𝑌 = ℎ(𝑋) = 3𝑋2 + 2 asume el mismo valor 𝑌 = 5 𝑌 = ℎ(1) = 3(1)2 + 2 = 5 20 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 𝑌 = ℎ(−1) = 3(−1)2 + 2 = 5 Entonces: 𝑃(𝑌 = 5) = ∑ 𝑃(𝑋 = 𝑥) = 𝑃(𝑋 = −1) + 𝑃(𝑋 = 1) 𝑥∈𝑅𝑥 ; 𝑓(𝑥)=𝑦 = 0.2 + 0.3 = 0.5 Luego, la tabla de probabilidades queda de la siguiente manera: 𝑌 = ℎ(𝑋) = 3𝑋2 + 2 𝑃(𝑌 = 𝑦) 2 5 14 0.1 0.5 0.4 VALOR ESPERADO DE UNA FUNCIÓN DE VARIABLE ALEATORIA Sea 𝑋 una variable aleatoria discreta con función de probabilidad 𝑝(𝑥) y sea ℎ(𝑥) una función de 𝑋. El valor esperado de ℎ(𝑥), denotado por 𝐸(ℎ(𝑋)) está dado por: VARIANZA DE UNA FUNCIÓN DE VARIABLE ALEATORIA Sea 𝑋 una variable aleatoria discreta con función de probabilidad 𝑝(𝑥), sea ℎ(𝑥) = 𝑌 una función de 𝑋 y 𝐸(ℎ(𝑋)), el valor esperado de 𝑌 = ℎ(𝑥). Entonces la varianza de la variable aleatoria, ℎ(𝑥) = 𝑌 denotado por 𝑉𝑎𝑟(𝑌 = ℎ(𝑋)) está dado por: 𝑉𝑎𝑟(𝑌 = ℎ(𝑋)) = 𝟐 ∑ (𝒚 = 𝒉(𝑿) − 𝐸(ℎ(𝑋))) 𝑃(𝑌 = 𝑦) 𝒚∈𝑹𝒀 ;𝒚=𝒉(𝑿) Ejemplos 1.14 Suponga que el número de automóviles que pasan por un auto lavado entre las 4:00 y las 5:00 en un viernes cualquiera tienen la siguiente distribución de probabilidad. 𝑋=𝑥 4 𝑃(𝑋 = 𝑥) 1/12 5 6 7 8 9 1/12 1/4 1/4 1/6 1/6 Sea 𝑔(𝑋) = 2𝑋 − 1, la cantidad de dinero en dólares que el administrador le paga al empleado. Encuentre la ganancia que espera el dependiente en ese periodo específico. SOLUCIÓN De acuerdo a la definición, la función "𝑔" es lineal, entonces, 𝑃(𝑌 = 𝑦) = 𝑃(𝑋 = 𝑥) Luego, calculamos los valores de la variable 𝑌 mediante 𝑔(𝑋) = 2𝑋 − 1, como se observa en la siguiente tabla 21 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 𝑋=𝑥 4 𝑌=𝑦 𝑃(𝑋 = 𝑥) 7 1/12 5 6 7 8 9 9 11 13 15 17 1/12 1/4 1/4 1/6 1/6 El dependiente espera recibir en ese periodo específico: 𝐸[𝑔(𝑋)] = ∑ 𝑔(𝑋)𝑝(𝑥) 𝒙∈𝑹𝑿 𝐸[𝑔(𝑋)] = 𝐸[𝑌] = 7 1 1 1 1 1 1 +9 + 11 + 13 + 15 + 17 12 12 4 4 6 6 𝐸[𝑔(𝑋)] = 𝐸[𝑌] = 12.67 El dependiente espera recibir en ese periodo específico, 12.67 dólares. Ejemplos 1.15 Sea 𝑋 la variable aleatoria discreta, con rango o soporte consta de tres valores, es decir 𝑆𝑋 = {1; 2; 3} con probabilidades siguientes 𝑃(𝑋 = 1) = 0,2; 𝑃(𝑋 = 2) = 0,1 ; 𝑃(𝑋 = 3) = 0,7. Definimos una nueva variable 𝑌 = ℎ(𝑋) = 2𝑋 2 − 1. Calcular el valor esperado de la variable aleatoria 𝑌. SOLUCIÓN Como la función "ℎ" definida como 𝑌 = ℎ(𝑋) = 2𝑋2 − 1, es inyectiva (uno a uno) en ⟨−∞; 1⁄ ] o en √2 [1⁄ ; ∞⟩. √2 De acuerdo a los valores que asume la variable 𝑋, es decir, 𝑆𝑋 = {1; 2; 3}. Entonces, la función ℎ, es inyectiva en 𝑆𝑋 , por lo tanto, 𝑃(𝑌 = 𝑦) = 𝑃(𝑋 = 𝑥) Luego, 𝑃(𝑋 = 1) = 𝑃(𝑌 = 1) = 0,2 𝑃(𝑋 = 2) = 𝑃(𝑌 = 7) = 0,1 𝑃(𝑋 = 3) = 𝑃(𝑌 = 17) = 0,7 Estos resultados, se pueden observar en la siguiente tabla: 𝑋=𝑥 𝑌 = ℎ(𝑋) = 2𝑋2 − 1 𝑃(𝑋 = 𝑥) = 𝑃(𝑌 = 𝑦) 1 1 0.2 2 7 0.1 3 17 0.7 Luego, el valor esperado de la variable aleatoria 𝑌 = ℎ(𝑋) = 2𝑋2 − 1, cuando es la función inyectiva (uno a uno) es: 𝐸[𝑔(𝑋)] = ∑ 𝑔(𝑋)𝑝(𝑥) 𝒙∈𝑹𝑿 𝐸[ℎ(𝑋)] = 𝐸[𝑌] = 1(0.2) + 7(0.1) + 17(0.7) 𝐸[ℎ(𝑋)] = 𝐸[𝑌] = 12.8 22 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán RELACION DE PROBLEMAS N 1 VARIABLES ALEATORIAS DISCRETAS EJERCICIOS PROPUESTOS 1. Al arrancar a una hora fija, cada automóvil que llega a un crucero es observado para ver si da vuelta a la izquierda ( I), a la derecha (D) o avanza de frente (F). El experimento terminará cuando se observe que un automóvil da vuelta a la izquierda. Sea X = al número de automóviles observados. ¿Cuáles son los valores posibles de X? Haga una lista de 5 resultados y sus valores X asociados. 2. A veces las aerolíneas registran más pasajeros del cupo normal de los vuelos. Supóngase que para un avión con 50 asientos, 55 pasajeros tienen boleto. Defina la variable aleatoria Y como el número de pasajeros con boleto que en realidad se presentan para el vuelo. En la tabla siguiente se ilustra la función masa de probabilidad de Y. y 45 46 47 p(y) 0.050 0.10 0.12 48 49 50 51 52 53 54 55 0.14 0.25 0.17 0.06 0.05 0.03 0.02 0.01 a. ¿Cuál es la probabilidad de que se pueda acomodar a todos los pasajeros con boleto que se presentan para realizar el vuelo? b. ¿Cuál es la probabilidad de que no todos los pasajeros con boleto que se presentan para realizar el vuelo puedan ser acomodados? c. Si el lector es la primera persona en lista de espera (lo que significa que será el primero en abordar el avión si hay asientos disponibles después que han sido acomodados todos los pasajeros con boleto), ¿cuál es la probabilidad de que pueda realizar el vuelo? ¿Cuál es la probabilidad si es la tercera persona en lista de espera? 3. Si X denota el número de horas que una alumna estudia durante un día seleccionado al azar. Suponga que la función de probabilidad de X es: a) Encontrar el valor de k. b) ¿Cuál es la probabilidad de que la alumna estudie: por lo menos dos horas. exactamente dos horas. a lo más dos horas. 0,75 0,30 0,55 4. Algunas regiones de California son particularmente propensas a temblores. Supongamos que en una parte de la región 30% de todos los propietarios de casa están asegurados contra daños por temblores. Cuatro propietarios son seleccionados al azar; sea X el número de propietarios, entre los cuatro, con seguro contra temblores. a. Encuentre la distribución de probabilidad de X. (Sugerencia: denotemos por S a un propietario de casa asegurado y con F a uno sin seguro. Entonces un posible resultado es SFSS, con probabilidad (0.3)(0.7)(0.3)(0.3) y valor 3 asociado a X. Hay otros 15 resultados.). b. Dibuje el histograma de probabilidad correspondiente. c. ¿Cuál es el valor más probable para X? d. ¿Cuál es la probabilidad de que al menos dos de los cuatro seleccionados tenga un seguro contra temblores? 23 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 5. Un contratista es requerido por un departamento de planeación de un municipio para que remita una, dos, tres, cuatro o cinco formas (dependiendo de la naturaleza del proyecto) para solicitar permiso de construcción. Sea Y = número de formas requeridas del siguiente solicitante. La probabilidad de que y formas se requieren es proporcional a y, esto es 𝑝(𝑦) = 𝑘𝑦 para 𝑦 = 1; 2; 3; 4; 5. a. ¿Cuál es el valor de k? b. ¿Cuál es la probabilidad de que por lo menos se necesiten 3 formas? c. ¿Cuál es la probabilidad de que se necesiten entre dos y cuatro formas? d. ¿Podría ser 𝑝(𝑦) = 𝑦 2 ⁄50 para 𝑦 = 1; 2; 3; 4; 5. la función de probabilidad de Y? 6. Sea X una variable aleatoria discreta con distribución de probabilidad dada por la siguiente tabla: x -5 -2 0 1 p(x) 0.1 0.2 0.1 0.2 3 a 8 0.1 a. Calcule la constante a. b. Encuentre la función de distribución acumulada F(x). c. Calcule P(X = 1), P(X = 2), P(X < 3), P(X ≥ 0) y P( -2 ≤ X ≤ 3) 7. Se sabe que la función de distribución de una variable aleatoria es Calcule: a) La función de probabilidad (cuantía). b) El valor esperado y la varianza. c) 𝑃(−1.5 ≤ 𝑋 ≤ 3.5) 8. Una organización de consumidores que evalúa automóviles nuevos, reporta regularmente el número de defectos importantes en cada examen. Sea X el número de defectos importantes en un automóvil seleccionado al azar de cierto tipo. La fpa de X es como sigue: 0 .06 .19 .39 F ( x) .67 .92 .97 1 x0 0 x 1 1 x 2 2 x3 3 x4 4 x5 5 x6 6 x Calcule las siguientes probabilidades directamente de función de distribución acumulada. a. b. c. d. p(2), esto es P (X = 2) P(X >3) P(2 ≤ x ≤ 5) P(2< x < 5) 24 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 9. A partir de la gráfica siguiente, de una función de probabilidad: a) b) Construya la tabla de la función de probabilidad. Encuentre el valor esperado de la variable aleatoria. E(X) = 10,6 10. La tabla siguiente muestra la función de distribución acumulativa de la variable aleatoria X Determinar: a) La función de probabilidad. b) 𝑃(1 ≤ 𝑋 ≤ 3) c) 𝑃(𝑋 ≥ 2) d) 𝑃(𝑋 < 3) e) 𝑃(𝑋 > 4) 3/4 7/8 3/8 7/8 11. Sea X una variable aleatoria que representa el número de clientes que en un día se quejan por el servicio de una tienda. a) b) 12. Determine el valor de k para que la función siguiente sea de probabilidad para X Calcule 𝑃(1 ≤ 𝑋 < 4) ¿Para qué valores del parámetro c la función p(x) definida por: 𝑐 𝑝(𝑘) = {𝑘(𝑘 + 1) 0 ¿Es la función de probabilidad de una variable aleatoria discreta? 25 ; 𝑘 = 1; 2; … ; 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 13. El administrador de una empresa ha anotado que la cantidad de inasistencias mensuales promedio de los trabajadores es una variable aleatoria con la siguiente distribución de probabilidad. Si la empresa le cuesta 𝑌 = 120𝑋 + 10 soles cada vez que un trabajador falta, encuentre la distribución de probabilidad para el costo. 14. Dado un experimento aleatorio resultó que su función de distribución acumulada estaba dada por: Encuentre la función de distribución acumulada para la variable 𝑌 = 2𝑋2 − 1. 15. El número de periódicos que vende cierto kiosco en un día cualquiera es un fenómeno aleatorio, cuya función de probabilidad es la siguiente: a) Calcular el valor de A b) Calcular la probabilidad de que el número de periódicos que se vendan cierto día sea: i) Mayor que 50 ii) Menor que 50 iii) Igual que 50 iv) Un número comprendido entre 25 y 75 16. Se conocen la función de distribución de la variable aleatoria X: ‘número de llamadas que recibe cierta persona al móvil en un día’ Se pide: a) El número medio de llamadas que recibe esa persona en un día; b) La probabilidad de que en un día reciba alguna llamada, pero menos de 3; c) La probabilidad de que en un día reciba más de 3 llamadas; 26 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIABLE ALEATORIA CONTINUA Existen muchas situaciones prácticas en las que las variables de interés toman valores en un conjunto no numerable de puntos: Tiempo de vida de un determinado producto. Suma de dos puntos elegidos al azar de un intervalo. En tales casos, no es posible asignar una probabilidad positiva a cada uno de los valores de la variable de forma que la suma de esas probabilidades sea la unidad como ocurre en el caso discreto. Así, el tratamiento probabilístico de este tipo de variables es diferente al de las variables discretas. Aunque la clase de variables de este tipo es más amplia, vamos a estudiar ahora un tipo particular, las denominadas variables absolutamente continuas, a las que es usual llamar simplemente de tipo continuo. Definición Si el número de posibles valores de X (esto es su R X) es infinito no es numerable, es decir puede tomar infinitos valores dentro de un intervalo de la recta real. Ejemplos 1.16 Función de distribución de probabilidad (CDF) Definición La función de distribución 𝑭𝑿 de una variable aleatoria 𝑿, es una función que a cada valor 𝑥 ∈ 𝑅, le asocia la probabilidad de que la variable tome valores menores o iguales a dicho número. Es decir: 𝑭: 𝑹 → [𝟎; 𝟏] 𝒙 ↦ 𝑭(𝒙) = 𝑷(𝑿 ≤ 𝒙) Es decir 𝑭𝑿 es una función continua en todo 𝑹 y derivable, y con derivada continua, salvo en a lo sumo un conjunto numerable de puntos. Esto es equivalente a que existe una función 𝑓𝑋 : 𝑅 → 𝑅 no negativa e integrable tal que 𝑥 𝑭𝑿 (𝑥) = ∫ 𝑓𝑋 (𝑡)𝑑𝑡 −∞ 27 ∀𝑥 ∈ 𝑅 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Donde: 𝑓𝑋 : Es la llamada la función de densidad de la variable aleatoria 𝑿. Propiedades a) La función de densidad de una variable aleatoria 𝑿, es una función no negativa, integrable y ∞ ∫ 𝑓𝑋 (𝑡)𝑑𝑡 = 1 −∞ b) Si 𝑥0 es un punto de continuidad de 𝑓𝑋 , entonces 𝐹𝑋 es derivable en 𝑥0 y 𝐹𝑋′ (𝑥0 ) = 𝑓𝑋 (𝑥0 ). c) La función de densidad de una variable continua determina a su función de distribución 𝐹𝑋 y a su distribución de probabilidad 𝑃𝑋 , ya que por definición se tiene que 𝑥 𝑭𝑿 (𝑥) = ∫ 𝑓𝑋 (𝑡)𝑑𝑡 −∞ Además, se cumple que: 𝑎 𝐹(𝑎) = 𝑃(𝑋 ≤ 𝑎) = 𝑃(𝑋 < 𝑎) = ∫ 𝑓𝑋 (𝑥)𝑑𝑥 −∞ 𝑏 𝐹(𝑏) − 𝐹(𝑎) = 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏) = ∫ 𝑓𝑋 (𝑥)𝑑𝑥 𝑎 Función de densidad de probabilidades (𝒇𝒅𝒑) Es una función de densidad 𝒇 , es no negativa e integrable tal que asigna a un valor 𝒙 ∈ 𝑅, un valor no negativo 𝒇(𝒙) tal que: 𝒇: 𝑹 → [𝟎; ∞⟩ 𝒙 ↦ 𝒇(𝒙) Tal que verifica las siguientes condiciones: (1) 𝑓𝑿 (𝑥) ≥ 0 ∀𝑥 ∈𝑅 𝑥 (2) ∫ 𝑓𝑋 (𝑡)𝑑𝑡 = 1 −∞ (3) De acuerdo a la definición de la función de distribución 𝑭𝑿 tenemos la relación que se cumple con la función de densidad conjunta (PDF) como: 28 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 𝜕 𝐹 (𝑥) 𝜕𝑥 𝑋 𝑓𝑋 (𝑥) = { 0, 𝑠𝑖 𝑙𝑎 𝑑𝑒𝑟𝑖𝑣𝑎𝑑𝑎 𝑛𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 Ejemplos 1.16 Sea 𝑿 una variable aleatoria con función de distribución 0 ; 𝑥<0 . 𝐹 (𝑥 ) = 𝑥 ;0 ≤ 𝑥 < 1 . { 1 ; 𝑥≥1 𝑭 es derivable en 𝑹 − {𝟎; 𝟏} y: 0 ; 𝑥<0 . 𝐹𝑋′ (𝑥) = 1 ;0 < 𝑥 < 1 . { 0 ; 𝑥>1 Entonces, podemos definir 𝑓 (𝑥 ) = 0 ; . 1 ;0 ≤ 𝑥 ≤ 1 𝑥<0 . { 0 ; 𝑥>1 Que es continua salvo en 𝑥 = 0; 1 y es evidente que 𝑥 𝑭𝑿 (𝑥) = ∫ 𝑓(𝑡)𝑑𝑡 −∞ Por tanto, se puede calcular las probabilidades, por ejemplo 29 ∀𝑥 ∈𝑅 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 0.6 𝑃(0.4 ≤ 𝑋 ≤ 0.6) = 𝑃(0.4 < 𝑋 < 0.6) = 𝐹(0.6) − 𝐹(0.4) = ∫ 1𝑑𝑡 = 0.6 − 0,4 = 0.2 0.4 Ejemplos 1.17 Comprobar que la siguiente función es función de densidad. Calcular su función de distribución y, si 𝑿 es una variable aleatoria con dicha distribución, calcular 𝑃(0.3 ≤ 𝑋 ≤ 1.5). 0 ; . 𝑥 ;0 < 𝑥 ≤ 1 𝑓 (𝑥 ) = 𝑥≤0 . 2−𝑥 { ; 1≤𝑥<2 . ;𝑥 ≥ 2 0 Dicha función es no negativa y además, +∞ 1 2 ∫ 𝑓(𝑡)𝑑𝑡 = ∫ 𝑡𝑑𝑡 + ∫(2 − 𝑡)𝑑𝑡 = −∞ 0 1 Ejemplos 1.18 Si 𝑿 es una variable aleatoria continua, con función de densidad dada por: 𝑥 𝑘𝑒 −2 𝑓 (𝑥 ) = { 0 ;𝑥 > 0 . ; 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠 30 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad a) b) c) d) Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Determinar el valor de “k” La función de distribución 𝑭𝑿 𝑃(2 < 𝑋 < 6) 𝑃(𝑋 ≤ 8) SOLUCIÓN a) Para determinar el valor de “k”, hacemos cumplir la condición de que bajo la integral, la función de densidad es igual a 1, es decir: ∞ 𝑥 ∫ 𝑘𝑒−2𝑑𝑥 = 1 0 ∞ 𝑥 𝑘 ∫ 𝑒 −2 𝑑𝑥 = 1 0 𝑥 1 Cambio de variable: − 2 = 𝑢 𝑑𝑢 = − 2 𝑑𝑥 Reemplazando tenemos: 𝑎 −2𝑘 lim ∫ 𝑒 𝑢 𝑑𝑢 = 1 𝑎→∞ 0 −2𝑘 lim [𝑒 𝑎 − 𝑒 0 ] = 1 𝑎→∞ −2𝑘 [ lim 𝑒 𝑎 − 1] = 1 𝑎→∞ −2𝑘[0 − 1] = 1 Luego, 𝑘 = 1 2 b) Calculando la función de distribución, 𝑥 1 𝑡 𝑭𝑿 (𝑥) = ∫ 𝑒 −2 𝑑𝑡 2 −∞ Desarrollando la integral 0 𝑥 1 𝑡 1 𝑡 𝑭𝑿 (𝑥) = ∫ 𝑒 −2 𝑑𝑡 + ∫ 𝑒 −2 𝑑𝑡 2 2 −∞ 0 Luego, la función de distribución resulta: 𝑥 𝑭𝑿 (𝑥) = 1 − 𝑒 −2 31 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad c) Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 6 2 𝑃(2 < 𝑋 < 6) = 𝐹(6) − 𝐹(2) = [1 − 𝑒 −2 ] − [1 − 𝑒 −2 ] = 𝑒 −1 − 𝑒 −3 = 0.3180 8 𝑑) 𝑃(𝑋 ≤ 8) = 1 − 𝑒 −2 = 1 − 𝑒 −4 = 0.982 Parámetros de una distribución de probabilidad de una variable aleatoria continua Valor esperado o esperanza matemática Sea 𝑿 una variable aleatoria continúa con función de densidad 𝒇𝑿 , se define el valor esperado o esperanza matemática de la variable aleatoria 𝑿, denotado por 𝐸(𝑋) como: ∞ 𝐸(𝑋) = 𝜇𝑋 = ∫ 𝑥𝑓(𝑥)𝑑𝑥 −∞ Ejemplos 1.19 Si 𝑿 es una variable aleatoria continua, con función de densidad dada por: 𝑒 −𝑥 𝑓 (𝑥 ) = { 0 ;𝑥 ≥ 0 . ; 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠 El valor esperado de la variable aleatoria 𝑿, está dado por: ∞ 𝐸(𝑋) = 𝜇𝑋 = ∫ 𝑥 𝑒−𝑥 𝑑𝑥 = 1 0 Varianza Sea 𝑿 una variable aleatoria continúa con función de densidad 𝒇𝑿 y valor esperado 𝐸(𝑋), se define la varianza de la variable aleatoria 𝑿, denotado por 𝑉(𝑋) como: ∞ 𝑉(𝑋) = 𝜎𝑋2 2 = 𝐸(𝑋 − 𝐸(𝑋)) = ∫ (𝑥 − 𝜇𝑋 )2 𝑓(𝑥)𝑑𝑥 −∞ Otra manera de calcular la varianza 𝑉(𝑋), es utilizando el siguiente resultado: ∞ 𝑉(𝑋) = 𝜎𝑋2 2 = 𝐸(𝑋 − 𝐸(𝑋)) = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥 − 𝜇𝑋 2 −∞ 32 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplos 1.20 Si 𝑿 es una variable aleatoria continua, con función de densidad dada por: 𝑒 −𝑥 𝑓 (𝑥 ) = { 0 ;𝑥 ≥ 0 . ; 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠 El valor esperado de la variable aleatoria 𝑿, está dado por: 𝐸(𝑋) = 𝜇𝑋 = 1 Luego, la varianza de la variable aleatoria 𝑿, se calcula mediante ∞ 𝑉(𝑋) = 𝜎𝑋2 2 = 𝐸(𝑋 − 𝐸(𝑋)) = ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥 − 𝜇𝑋 2 −∞ Entonces, desarrollamos la primera integral, es decir: ∞ ∞ ∫ 𝑥 2 𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 2 𝑒−𝑥 𝑑𝑥 = 2 −∞ 0 Por lo tanto, la varianza de la variable aleatoria 𝑿 es: 𝑉(𝑋) = 𝜎𝑋2 = 2 − 12 = 1 FUNCIÓN DE UNA VARIABLE ALEATORIA CONTINUA Sea 𝑋 una variable aleatoria continua, con función de densidad 𝑓𝑋 : 𝑹 → [𝟎; ∞⟩, y sea una función 𝑔: 𝑅 → 𝑅, inyectiva, (estrictamente creciente) y diferenciable, tal que: 𝒈: 𝑅 → 𝑅 𝒙 ↦ 𝒈(𝒙) = 𝒚 Función de densidad de la función de una variable aleatoria Sea 𝑋 una variable aleatoria continua, con función de densidad 𝑓𝑋 : 𝑹 → [𝟎; ∞⟩, y sea una función 𝑔: 𝑅 → 𝑅, inyectiva y diferenciable, tal que 𝑌 = 𝒈(𝑿), entonces la función de densidad de la nueva variable aleatoria 𝑌 es: 𝒇𝒀 : 𝑅 → [0, ∞⟩ 𝑦 ↦ 𝑓𝑌 (𝑦) Definido como: 𝑑𝑔−1 (𝑦) 𝑓𝑋 (𝑔−1 (𝑦)) | | 𝑑𝑦 𝑓𝑌 (𝑦) = { . 0 Gráficamente tenemos: 33 𝑠𝑖 𝑦 ∈ 𝑅𝑌 𝑠𝑖 𝑦 ∉ 𝑅𝑌 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplos 1.21 Sea 𝑿 una variable aleatoria continua con función de densidad 𝜆𝑒 −𝜆𝑥 𝑓 (𝑥 ) = { 0 ;𝑥 ≥ 0 . ; 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠 Calcular la función de densidad de 𝒀 = 𝑿𝟐 Consideremos la función 𝒈: [0, ∞⟩ → 𝑅 𝒙 ↦ 𝒈(𝒙) = 𝒙𝟐 Gráficamente tenemos Consideremos la función 𝑔(𝑥) = 𝑥 2 inyectiva (estrictamente creciente) y diferenciable en el intervalo [0, ∞⟩ como se observa en la gráfica anterior entonces la función de densidad se calcula con la siguiente expresión: 𝑑𝑔−1 (𝑦) 𝑓𝑋 (𝑔−1 (𝑦)) | | 𝑑𝑦 𝑓𝑌 (𝑦) = { . 0 Luego: Como 𝑦 = 𝑔(𝑥) = 𝑥 2 , entonces 𝑥 = 𝑔−1 (𝑦) = √𝑦 Luego 34 𝑠𝑖 𝑦 ∈ 𝑅𝑌 𝑠𝑖 𝑦 ∉ 𝑅𝑌 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 𝑑𝑔−1 (𝑦) 𝑑𝑦 = 𝑑 √𝑦 𝑑𝑦 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 1 = 2 𝑦, √ Por lo tanto, la función de densidad será: 1 𝜆𝑒 −𝜆√𝑦 ;𝑦 ≥ 0 2 √𝑦 𝑓𝑌 (𝑦) = { . 0 ; 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠 Valor esperado o esperanza matemática de una función de una variable aleatoria Sea 𝑿 una variable aleatoria continúa con función de densidad 𝒇𝑿 , con valor esperado 𝐸(𝑋). Entonces si se define una nueva variable aleatoria 𝑌, mediante la función ℎ(𝑋) = 𝑌, entonces el valor esperado o esperanza matemática de la variable aleatoria 𝒀, denotado por 𝐸(𝑌) = 𝐸(ℎ(𝑋)) se define como: ∞ 𝐸(ℎ(𝑋)) = 𝜇𝑌 = ∫ ℎ(𝑥)𝑓(𝑥)𝑑𝑥 −∞ Varianza de una función de una variable aleatoria Sea 𝑿 una variable aleatoria continúa con función de densidad 𝒇𝑿 , con valor esperado 𝐸(𝑋). Entonces si se define una nueva variable aleatoria 𝑌, mediante la función ℎ(𝑋) = 𝑌, con valor esperado o esperanza matemática de la variable aleatoria 𝒀, denotado por 𝐸(𝑌) = 𝐸(ℎ(𝑋)), entonces se define la varianza de la variable aleatoria ℎ(𝑋) = 𝑌 , denotado por 𝑉(𝑌) como: ∞ 𝑉(𝑌) = 𝑉(ℎ(𝑋)) = 𝜎𝑌2 2 2 = 𝐸(𝑌 − 𝐸(𝑌)) = ∫ (ℎ(𝑋) − 𝐸(ℎ(𝑋))) 𝑓(𝑥)𝑑𝑥 −∞ Otra forma alternativa que se utiliza esta dada por la siguiente expresión: ∞ 2 2 2 𝑉(𝑌) = 𝑉(ℎ(𝑋)) = 𝜎𝑌2 = 𝐸 [(ℎ(𝑋)) ] − [𝐸(ℎ(𝑋))] = ∫ (ℎ(𝑋)) 𝑓(𝑥)𝑑𝑥 − [𝐸(ℎ(𝑋))] −∞ 35 2 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán RELACION DE PROBLEMAS N 2 VARIABLES ALEATORIAS CONTINUAS 1. Las marcas obtenidas por un lanzador de peso sigue una variable aleatoria con densidad Donde las distancias, X, se miden en decámetros. (a) Calcula el valor de k. (b) Calcula la probabilidad de que la distancia conseguida por el lanzador sea mayor que 20 metros. (c) Calcula la probabilidad condicionada de que la marca sea superior a 25 metros sabiendo que es superior a 20 metros. (d) Calcula la distancia media esperada así como una medida de la dispersión de la variable. 2. Una variable aleatoria X que representa la duración en minutos de las llamadas realizadas en un locutorio público tiene por función de distribución (a) (b) (c) (d) (e) Calcula la probabilidad de que una llamada dure tres minutos. Calcula la probabilidad de que una llamada dure menos de tres minutos. Calcula la función de densidad de la variable. Calcula la duración esperada de una llamada. Calcula la probabilidad de que una llamada dure menos de 4 minutos sabiendo que ha durado más de tres. 3. El tiempo de vida, en miles de horas, de una lámpara es una variable aleatoria con densidad: Halle la probabilidad de que una de tales lámparas, que está colocada en un equipo, tenga que cambiarse durante las primeras 1.200 horas de operación. Rpta:0,104 4. La demanda diaria de combustible, en miles de litros, en una estación de servicio es una variable aleatoria con función de densidad: Al comenzar cada día se completan los tanques hasta alcanzar los 2.000 litros. Cada litro vendido produce una utilidad de 20 centavos mientras que, cada litro no vendido produce una pérdida de 1,5 centavos (debido a costos de almacenamiento). Halle la utilidad diaria esperada. Rta:Ayuda:U=0,2x-(2000-x)0,015; E(X)=1,066..;E(U)=199,33 36 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 5. El tiempo de reparar una máquina en horas tiene una función de distribución: a) Dibujar la función de distribución. b) Obtener la función de densidad. c) Si el tiempo de reparación es superior a 1 hora, cuál es la probabilidad de que sea superior a 3.5 horas?. 6. El tiempo de culminación 𝑿 de cierto producto financiero tiene una función de distribución acumulada 𝑭, dada por: a) Obtenga la función de densidad de X y construya su gráfica b) Calcule la probabilidad de que el tiempo de culminación de cierto proyecto financiero se encuentre entre 0.5 y 2. c) Calcule el tiempo esperado de culminación de cierto proyecto financiero. 7. La empresa MORDISCON, administradora de un servicio de telefonía celular, factura sus servicios de acuerdo a la duración de las llamadas. Se sabe que la duración de una llamada (medida en minutos) se puede modelar aproximadamente por medio de una variable aleatoria. X con función de densidad: Se pide: a) ¿Qué significado tiene λ en este problema? b) Si el precio de cada minuto es de $3 (más IVA), ¿Cuál es el costo esperado por llamado? c) Si la empresa cambia su modo de facturar, pasando a cobrar el número de minutos que dura una llamada por exceso (o sea si dura 2.3 minutos cobra 3, si dura 3.5 cobra 4). Hallar el costo esperado por llamado (Considerar λ = 1/10, 1/2, 1, 2, 10). d) Calcular el beneficio medio suplementario obtenido por modificar el sistema de cobro (Utilizar los mismos valores de λ del punto anterior). 8. La función de densidad de la variable aleatoria X es Se pide: a) Calcular el valor de la constante k. b) Determinar media y desviación típica de la variable aleatoria X. c) Determinar la mediana de la variable aleatoria X. d) Determinar la media de la variable aleatoria Y = X 2 + 1 sin utilizar la función de densidad ni la función generatriz de Y. e) Determinar la función de densidad de la variable Y = X 2 + 1. f) Verificar el valor obtenido para la media de la variable aleatoria Y (en la parte d) utilizando la función de densidad de la variable aleatoria Y. 37 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 9. Un ingeniero observa la variable aleatoria (Y) resistencia a la flexión de un material normal de acero sometido a la tensión. Los datos experimentales permitieron construir la figura que aparece adelante, con base en ella encontrar: 𝑎) 𝑏) 𝑐) 𝑑) 𝑒) 𝑓 (𝑦 ) 𝐹 (𝑦 ) 𝑃(𝑌 < 37) 𝑃(𝑌 > 45) 𝑃(37 < 𝑌 < 52) 10. Sea X la variable aleatoria continua que denota el diámetro de un orificio perforado en una pieza de un componente metálico. Los datos históricos muestran que la distribución de X (en mm) puede ser modelada por la siguiente función de densidad: Si una pieza con un diámetro superior a 12.6 mm se desecha, ¿Cuál es la probabilidad de que una pieza sea desechada? 11. La proporción de cierto aditivo en la gasolina determina su peso específico, lo que, a su vez, determina el precio. Suponga que en la producción de gasolina la proporción de aditivo es una variable aleatoria X con función de densidad: Si X < 0,5 se tendrá gasolina del tipo I a $1800 el litro, si 0,5 ≤ X ≤ 0,8 se tendrá gasolina de tipo II a $2000 el litro; y, si X > 0,8 se tendrá gasolina de tipo III a $2200 el litro. a) Calcule el valor esperado y la varianza de la proporción de aditivo. b) Cuál es el porcentaje de producción de cada tipo de gasolina. c) Calcular el precio medio por litro 12. La Resistencia de una muestra de un determinado material viene dado por una variable aleatoria X, con función de densidad a. Una muestra de material se encuentra en estado ideal de resistencia si ésta se encuentra entre 0.5 y 1.5. ¿Cuál es la probabilidad de que una muestra se encuentre en estado ideal? b. Si se consideran 10 muestras de materiales. ¿Cuál es la probabilidad de que al menos el 70% de ellos tenga resistencia ideal? 38 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán MODELOS DE DISTRIBUCIÓN DE PROBABILIDADES DE VARIABLES ALEATORIAS DISCRETAS Los modelos de probabilidad describen el comportamiento probabilístico de una o más variables aleatorias. También se puede definir como una función de probabilidad utilizada para resolver cierto tipo de experimentos. Los modelos de probabilidad pueden ser discretos o continuos dependiendo de la(s) variable (s) aleatoria(s) involucradas. Las principales y más utilizadas son las siguientes: BINOMIIAL MULTINOMIAL BINOMIAL NEGATIVO GEOMÉTRICO TIPO DISCRETO HIPERGEOMETRICO POISSON Muchas variables aleatorias dan origen a la misma distribución de probabilidad, como por ejemplo: • • • • Inspeccionar 10 objetos para ver si son o no defectuosos. Preguntar a 5 personas si tienen o no tienen trabajo La llegada de un cliente al negocio durante una hora Las llamadas telefónicas que se reciben en un día. 39 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIABLE ALEATORIA CON DISTRIBUCIÓN BINOMIAL Un modelo probabilístico de aplicación generalizada es el binomial, que aparece cuando al efectuar observaciones reiteradas analizamos en cuántos casos se han presentado determinados resultados, habitualmente denominados “éxitos” La siguiente tabla ilustra varias situaciones en las que un modelo binomial describe adecuadamente los resultados que nos interesan: EXPERIMENTOS BINOMIAL Si consideramos un experimento donde las propiedades son las mismas que las que se indican para un experimento binomial, con la excepción de que las pruebas se repetirán hasta que ocurra el primer éxito. Por tanto, en lugar de encontrar la probabilidad de x éxitos en n pruebas (caso binomial), nos interesamos ahora en la probabilidad de que ocurra el primer éxito en la x-ésima prueba. Los experimentos de este tipo se llaman Experimentos Binomial. CARACTERÍSTICAS Este Experimento consta de varias condiciones: 1. Hay un número fijo, n, de pruebas idénticas. 2. Para cada prueba, solo hay dos resultados posibles (éxito / fracaso). 3. La probabilidad de éxito, p, sigue siendo la misma para cada prueba. 4. Las pruebas son independientes entre sí. 5. La variable aleatoria Y = el número de éxitos observados para los n ensayos. Ejemplos 1.22 VARIABLE ALEATORIA CON DISTRIBUCIÓN BINOMIAL(X): Número de éxitos obtenidos en un número de ensayos o pruebas de un experimento aleatorio. FUNCIÓN DE PROBABILIDAD (MASA) GRÁFICA DE UNA FUNCIÓN DE PROBABILIDAD: 𝒏 = 𝟐𝟎 , 𝒑 = 𝟎. 𝟕 Donde: 𝒏: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑟𝑢𝑒𝑏𝑎𝑠 𝑜 𝑒𝑛𝑠𝑎𝑦𝑜𝑠 𝑝: 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 É𝑥𝑖𝑡𝑜 𝑞: 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝐹𝑟𝑎𝑐𝑎𝑠𝑜 𝑥: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 É𝑥𝑖𝑡𝑜𝑠 Condiciones: 40 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán PARÁMETROS 𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 Desviación Estándar FUNCIÓN DE DISTRIBUCIÓN (ACUMULADA) GRÁFICA DE UNA FUNCIÓN DE DISTRIBUCIÓN: 𝒏 = 𝟐𝟎 , 𝒑 = 𝟎. 𝟕 NOTACIÓN: 𝑿 ~ 𝓑(𝒏; 𝒑) 𝒃(𝒙; 𝒏; 𝒑) = 𝒇(𝒙) = (𝒏𝒙)𝒑𝒙 (𝟏 − 𝒑)𝒏−𝒙 𝒙 𝑩(𝒙; 𝒏; 𝒑) = 𝑭(𝒙) = ∑ 𝒃(𝒙; 𝒏; 𝒑) ; 𝒙 = 𝟎, 𝟏, . . . , 𝒏 𝒌=𝟎 PROPIEDADES: (𝒆) 𝑺𝒊 𝒑 = 𝟎. 𝟓𝟎 𝒆𝒏𝒕𝒐𝒏𝒄𝒆𝒔 𝒃(𝒙; 𝒏; 𝟎. 𝟓𝟎) = 𝒃(𝒏 − 𝒙; 𝒏; 𝟎. 𝟓𝟎) Ejemplo 1.23 Sea X una variable aleatoria con distribución binomial, con parámetros 𝑛 = 20 y 𝑝 = 0,40 a. Determinar la función de probabilidad b. Calcular 𝑃(𝑋 = 8) c. Calcular 𝑃(𝑋 ≤ 4) d. Calcular 𝑃(𝑋 ≥ 12) e. Calcular 𝑃(5 < 𝑋 < 10) f. g. Calcular el valor esperado de X Calcular la desviación estándar o típica de X 41 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán SOLUCIÓN Datos 𝒏 = 20 (Número de ensayos o pruebas) 𝒑 = 0.40 (Probabilidad de éxito) 𝒒 = 1 − 𝑝 = 0.60 (Probabilidad de fracaso) X: “Número de éxitos en las 20 pruebas o ensayos”. Así la variable aleatoria puede asumir los siguientes valores, Donde: 𝒙 = 0 ; 1 ; 2 ; 4 ; . . . ; 20 (a) Luego, la función de probabilidad está dada por: (b) 𝑃(𝑋 = 8) = (20 ) (0,40)8 (0,60)12 8 = 𝟎, 𝟏𝟕𝟗𝟕 CÁLCULO DE PROBABILIDADES USANDO TABLAS Usando la tabla de distribución acumulada: 𝑃(𝑋 = 8) = 𝑃(𝑋 ≤ 8) − 𝑃(𝑋 ≤ 7) = 0,5956 − 0,4159 = 0,5956 − 0,4159 = 𝟎, 𝟏𝟕𝟗𝟕 = 0,000037 + 0,000487 + 0,003087 + 0,0123496 + 0,034991 = 𝟎, 𝟎𝟓𝟏𝟎 (Aproximando a cuatro decimales) Usando la tabla de distribución acumulada: 𝑃(𝑋 ≤ 4) = 𝟎, 𝟎𝟓𝟏𝟎 (d) 𝑃(𝑋 ≥ 12) = 1 − 𝑃(𝑋 ≤ 11) = Usando la tabla de distribución acumulada: 𝑃(𝑋 ≥ 12) = 1 − 𝑃(𝑋 ≤ 11) = = 1 − 0,9435 = 𝟎, 𝟎𝟓𝟔𝟓 42 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán (e) 𝑃(5 < 𝑋 < 10) = 𝑃(𝑋 < 10) − 𝑃(𝑋 < 5) = 𝑃(𝑋 ≤ 9) − 𝑃(𝑋 ≤ 5) = 𝑓(6) + 𝑓(7) + 𝑓(8) + 𝑓(9) Usando la tabla de distribución acumulada: 𝑃(5 < 𝑋 < 10) = 𝑃(𝑋 ≤ 9) − 𝑃(𝑋 ≤ 5) = 0,7553 − 0,1256 = 0,6297 f. El valor esperado de X está dado por: 𝐸 [𝑋] = 𝑛𝑝 𝐸 [𝑋] = (20)(0,40) = 8 INTERPRETACIÓN: Se espera que los valores que asume la variable aleatoria Binomial X se encuentren en promedio alrededor de 8 g. La desviación estándar o típica de X está dado por: 𝜎[𝑋] = √𝑉𝑎𝑟[𝑋] = √𝑛𝑝𝑞 𝜎[𝑋] = √(20)(0,40)(0,60) 𝜎[𝑋] = √4,8 = 2,19 INTERPRETACIÓN: Se espera que los valores que asume la variable aleatoria Binomial X tengan en promedio una dispersión de 2,19 con respecto a su valor esperado. Ejemplo 1.24 Si la probabilidad de que se desplome una estructura después de 30 años es de 0.01 obtenga la probabilidad de que de 10 estructuras de esta clase: a) Ninguna se derrumbe después de 30 años. b) Una exactamente se derrumbe después de 30 años. c) No más de una se derrumbe después de 30 años. d) Más de una se derrumbe después de 30 años. e) Por lo menos una se derrumbe después de 30 años. SOLUCIÓN Datos 𝒏 = 10 (Número de ensayos o pruebas) 𝒑 = 0.01 (Probabilidad de éxito) 𝒒 = 1 − 𝑝 = 0.99 (Probabilidad de fracaso) X: “Número de éxitos en las 10 pruebas o ensayos”. Así la variable aleatoria puede asumir los siguientes valores, Donde: 𝒙 = 0 ; 1 ; 2 ; 4 ; . . . ; 10 )0.01𝑥 (0.99)10−𝑥 Luego, la función de probabilidad está dada por: 𝑓(𝑥 ) = (10 𝑥 (a) 𝑃(𝑥 = 0) (b) 𝑃(𝑥 = 1) (c) 𝑃(𝑥 ≤ 1) (d) 𝑃(𝑥 > 1) (e) 𝑃(𝑥 ≥ 1) 43 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán RELACION DE PROBLEMAS N 3 MODELOS DE PROBABILIDAD DISCRETO BINOMIAL EJERCICIOS DE COMPRENSIÓN 1. ¿Qué condiciones para la distribución binomial, si hay alguna, no se cumple en las siguientes situaciones? a) Para cada una de las ocho instalaciones de producción de una compañía, registre si la semana pasada hubo un accidente o no. La instalación más grande tiene tres veces el número de trabajadores de producción que la instalación más pequeña. b) Para cada uno de tres turnos, el número de unidades producidas se comparará con el promedio a largo plazo de 560 y se determinará si la producción supera las 560 unidades o no. El segundo turno conocerá el resultado del primero antes de comenzar a trabajar, y el tercer turno iniciará con el conocimiento de cómo se desempeñaron los primeros dos turnos. 2. ¿Qué condiciones para la distribución binomial, si hay alguna, no se cumplen en las siguientes situaciones? a) E l número de individuos que tienen un resfriado en una reunión familiar a la que asisten 30 personas. b) Entre los 8 proyectores del departamento, 2 no funcionan de manera adecuada pero no están marcados como defectuosos. Se seleccionan dos y se registra el número de los que no funcionan adecuadamente. EJERCICIOS DE APLICACIÓN 3. Si 6 de 18 nuevos edificios en una ciudad contravienen el código de construcción, ¿cuál es la probabilidad de que un inspector de edificios, que selecciona al azar 4 de los nuevos edificios para inspección, elegirá a) ninguno de los edificios que contraviene el código de construcción? a) 1 de los nuevos edificios que contraviene el código de construcción? b) 2 de los nuevos edificios que contravienen el código de construcción? c) al menos 3 de los nuevos edificios que contravienen el código de construcción? 4. El error humano se da como la razón del 75% de todos los accidentes en una planta. Use la fórmula para la distribución binomial y determine la probabilidad de que el error humano se dará como la razón para dos de los siguientes cuatro accidentes. 5. En un rio adyacente a una zona industrial, la probabilidad de que al tomar una muestra de agua ésta exceda el límite de cromo que es de 10 mg/L, es de 0.10. Si se toman n=18 muestras de agua del rio y se supone que las muestras de agua son independientes con respecto a la presencia de cromo, entonces: a) Encontrar la probabilidad de que de dos de las muestras excedan el límite de 10 mg/L de cromo. b) Hallar la probabilidad de que, al menos 4 muestras excedan el límite. c) Determinar la probabilidad de que, cuando menos 3 muestras, pero menos de 7 excedan el límite estipulado. d) Encontrar la probabilidad de que de 3 muestras, pero menos de 7 excedan el límite estipulado de cromo. 6. En estudios de ingeniería civil, si la probabilidad de que cierta columna de ala ancha bajo una carga axial de 0.05, calcular la probabilidad de que entre 16 columnas de ese tipo: a) ¿Caigan cuando más dos? b) ¿Caigan al menos cuatro? 7. En una investigación de higiene y seguridad industrial, el ingeniero encargado del departamento de seguridad afirma que sólo 40% de todos los trabajadores usan cascos de seguridad cuando almuerzan en el lugar del trabajo. Suponiendo que esta afirmación sea correcta, hallar la probabilidad de que 4 de las siguientes 6 trabajadores de la industria, elegidos aleatoriamente, usen los cascos de seguridad, mientras comen en el lugar del trabajo. 8. En una fábrica se va a evaluar la efectividad de un programa de seguridad que requiere que algunos trabajadores seleccionados al azar usen zapato de seguridad. Durante el período de prueba se encuentra que el 2% de los trabajadores usó zapatos de seguridad y sufrió lesiones en los pies. También encontró que el 46% no usó zapatos de seguridad ni tuvo lesiones en los pies; además de aquellos que usaron zapatos de seguridad el 5% tuvo lesiones en los pies. a. Si se escogen 5 trabajadores al azar ¿Cuál es la probabilidad de que todos hayan usado zapatos de seguridad? b. Si se elige una muestra de 400 trabajadores ¿Cuál es la probabilidad de que a lo menos 3 hayan usado zapatos de seguridad y sufrido lesiones en los pies? c. De aquellos que tuvieron lesiones se escogen 10 al azar ¿qué probabilidad hay de que al menos 2 hayan usado zapatos de seguridad? 44 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIABLE ALEATORIA CON DISTRIBUCIÓN GEOMETRICA EXPERIMENTOS GEOMÉTRICO Si consideramos un experimento donde las propiedades son las mismas que las que se indican para un experimento binomial, con la excepción de que las pruebas se repetirán hasta que ocurra el primer éxito. Por tanto, en lugar de encontrar la probabilidad de x éxitos en n pruebas (caso binomial), nos interesamos ahora en la probabilidad de que ocurra el primer éxito en la xésima prueba. Los experimentos de este tipo se llaman Experimentos Geométricos. CARACTERÍSTICAS Este Experimento consta de varias condiciones: 1. 2. 3. 4. 2. El Experimento consta de un número indefinido de pruebas (variable) y este concluirá cuando se tenga el primer ‘éxito (resultado favorable). Los ensayos o pruebas pueden dar dos resultados posibles y excluyentes a su vez, es decir, E (Éxito) y F (Fracaso). La probabilidad de obtener un resultado E en las pruebas es p, y la de conseguir F es 1 − 𝑝 = 𝑞, de forma que 𝑝 + 𝑞 = 1. p y q son constantes en cada prueba y a su vez estas son independientes. Si la variable aleatoria X es "el número de pruebas necesarias para conseguir el primer éxito "; entonces X seguirá una distribución Geométrica con parámetro 𝑝. VARIABLE ALEATORIA CON DISTRIBUCIÓN GEOMÉTRICA X: Número de pruebas necesarias hasta la obtención del primer éxito en un Experimento Aleatorio. FUNCIÓN DE PROBABILIDAD (MASA) GRÁFICA DE UNA FUNCIÓN DE PROBABILIDAD: 𝒑 = 𝟎. 𝟏 Donde: 𝑝: 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 É𝑥𝑖𝑡𝑜 𝑞 = 1 − 𝑝: 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝐹𝑟𝑎𝑐𝑎𝑠𝑜 𝑥: 𝐿𝑎 x 𝑢𝑛𝑖𝑑𝑎𝑑 𝑞𝑢𝑒 𝑠𝑒 𝑖𝑛𝑠𝑝𝑒𝑐𝑐𝑖𝑜𝑛𝑎 𝑠𝑒𝑎 𝑙𝑎 𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑑𝑒 é𝑥𝑖𝑡𝑜. PARÁMETROS 𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 FUNCIÓN DE DISTRIBUCIÓN (ACUMULADA) GRÁFICA DE UNA FUNCIÓN DE DISTRIBUCIÓN: 𝒑 = 𝟎. 𝟏 Donde [𝑥] denota la parte entera de 𝑥. NOTACIÓN: 𝑿 ~ 𝔾(𝒑) En forma alternativa también podemos expresar la variable aleatoria geométrica considerando el número de pruebas o ensayos previos antes de encontrar el primer éxito. Entonces: VARIABLE ALEATORIA CON DISTRIBUCIÓN GEOMÉTRICA X: Número de pruebas o ensayos necesarias antes de la obtención del primer éxito en un Experimento Aleatorio Geométrico. El rango o Recorrido es: 𝑋 = 0, 1, 2, 3, … 45 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán FUNCIÓN DE PROBABILIDAD O MASA DISTRIBUCIONES GEOMÉTRICAS PARA TRES VALORES DE 𝒑 Ejemplo 1.25 Se sabe que en cierto proceso de fabricación, en promedio, uno de 100 artículos está defectuoso. ¿Cuál es la probabilidad de que el quinto artículo que se inspecciona sea el primer defectuoso que se encuentra? SOLUCIÓN Si consideremos X: “Número de inspecciones que se requieren para encontrar el primer artículo defectuoso”. Así la variable aleatoria X puede asumir los siguientes valores, donde: 𝑿 = 1 ; 2 ; 3 ; 4 ; . . . Datos 𝒑 = 0.01 (Probabilidad de que al artículo inspeccionado sea defectuoso) 𝒒 = 1 − 𝑝 = 0.99 (Probabilidad de que al artículo inspeccionado no sea defectuoso) Entonces la probabilidad de que el quinto artículo que se inspecciona sea el primer defectuoso que se encuentra es: 𝑃(𝑋 = 5) Utilizando la función de distribución geométrica: 𝑃(𝑋 = 𝑥) = 𝑝(1 − 𝑝)𝑥−1 tenemos: 𝑃(𝑋 = 5) = 0.01(1 − 0.01)5−1 𝑃(𝑋 = 5) = 0.01(0.99)4 = 0.0096 Si consideremos X: “Número de inspecciones previas que se requieren antes de encontrar el primer artículo defectuoso”. Así la variable aleatoria X puede asumir los siguientes valores, donde: 𝑿 = 0; 1 ; 2 ; 3 ; 4 ; . . . Entonces la probabilidad de que el quinto artículo que se inspecciona sea el primer defectuoso que se encuentra es: 𝑃(𝑋 = 4) Utilizando la función de distribución geométrica alternativa: 𝑃(𝑋 = 𝑥) = 𝑝(1 − 𝑝)𝑥 tenemos: 𝑃(𝑋 = 4) = 0.01(1 − 0.01)4 𝑃(𝑋 = 4) = 0.01(0.99)4 = 0.0096 Ejemplo 1.26 La probabilidad de un alineamiento óptico exitoso en el ensamblado de un producto de almacenamiento óptico de datos es 0,8. Suponga que los ensayos son independientes.. 46 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán a) ¿Cuál es la probabilidad de que el primer alineamiento exitoso requiera exactamente 4 ensayos? b) ¿Cuál es la probabilidad de que el primer alineamiento exitoso requiera como máximo cuatro ensayos? 0.9984 c) ¿Cuál es la probabilidad de que el primer alineamiento exitoso requiera al menos cuatro ensayos? SOLUCIÓN Si consideremos X: “Número de productos ensamblados previos que se requieren antes de encontrar el alineamiento óptico sea exitoso”. Así la variable aleatoria X puede asumir los siguientes valores, donde: 𝑿 = 0; 1 ; 2 ; 3 ; 4 ; . . . Datos 𝒑 = 0.8 (Probabilidad de que el producto ensamblado tenga el alineamiento óptico exitoso) 𝒒 = 1 − 𝑝 = 0.2 (Probabilidad de que el producto ensamblado tenga el alineamiento óptico no sea exitoso ) a) La probabilidad de que el primer alineamiento exitoso requiera exactamente 4 ensayos es: 𝑃(𝑋 = 3) Utilizando la distribución geométrica: 𝑃(𝑋 = 𝑥) = 𝑝(1 − 𝑝)𝑥 Consideremos: 𝑋 = 3 y 𝑝 = 0.8 reemplazando tenemos: 𝑃(𝑋 = 3) = 0.80(1 − 0.80)3 𝑃(𝑋 = 3) = 0.80(0.20)3 = 0.0064 b) La probabilidad de que el primer alineamiento exitoso requiera como máximo cuatro ensayos es 𝑃(𝑋 ≤ 3) Consideremos: 𝑥 = 3 y 𝑝 = 0.8 reemplazando tenemos: 𝑃(𝑋 ≤ 3) = 0.9984 c) La probabilidad de que el primer alineamiento exitoso requiera al menos cuatro ensayos es 𝑃(𝑋 ≥ 3) Consideremos: 𝑥 = 4 y 𝑝 = 0.8 reemplazando tenemos: 𝑃(𝑋 ≥ 3) = 1 − 𝑃(𝑋 ≤ 2) = 1 − 0.9920 = 0.0080 CÁLCULO DE PROBABILIDADES CON EL USO DE LA TABLA DE PROBABILIDADES La tabla asume 𝑥 = k = 0, 1, 2, 3, . . . 0.10, 0.20, 0.30, 0.40, 0.50, 0.60, 0.70, 0.80, 0.90 y algunas probabilidades de éxito p= El cálculo de probabilidades puntuales de una distribución geométrica con uso de la tabla, utiliza la función de probabilidad siguiente: FUNCIÓN DE PROBABILIDAD O MASA X: Número de pruebas o ensayos necesarias antes de la obtención del primer éxito en un Experimento Aleatorio Geométrico. 𝐗 = 0, 1, 2, 3, … a) 𝑃(𝑋 = 3), k = 3; p = 0.8 𝑃(𝑋 = 3) = 0.0064 47 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán El cálculo de probabilidades Acumuladas de una distribución geométrica con uso de la tabla, utiliza la función de probabilidad siguiente: FUNCIÓN DE DISTRIBUCIÓN (ACUMULADA) DE PROBABILIDAD X: Número de pruebas o ensayos necesarias antes de la obtención del primer éxito en un Experimento Aleatorio Geométrico. 𝐗 = 0, 1, 2, 3, … 𝑥 𝑥 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∑ 𝑓(𝑖) = ∑(1 − 𝑝)𝑖 𝑝 𝑖=0 b) 𝑃(𝑋 ≤ 3), k = 3; p = 0.8 𝑃(𝑋 ≤ 3) = 0.9984 c) 𝑃(𝑋 ≥ 3), k = 3; p = 0.8 𝑃(𝑋 ≥ 3) = 1 − 𝑃(𝑋 < 3) = 1 − 𝑃(𝑋 ≤ 2) 𝑃(𝑋 ≥ 3) = 1 − 0.9920 = 0.0080 48 𝑖=0 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán RELACIÓN DE PROBLEMAS N 4 TEMA: VARIABLES ALEATORIAS CON DISTRIBUCIONES GEOMÉTRICAS 1. Suponga que la variable aleatoria X tiene una distribución geométrica con una media de 2.5. Determine las siguientes probabilidades: a) b) c) d) P(X=1) P(X=4) P(X=5) P(X≤3) e) P(X>3) 2. La probabilidad de que una llamada a una línea de servicios sea contestada en menos de 30 segundos es de 0.75. Suponga que las llamadas son independientes. a) Cuál es la probabilidad de que tengan que hacerse cuatro llamadas para obtener la primera contestación en menos de 30 segundos. 0.0117 b) Cuál es el número promedio de llamadas hasta obtener una contestación en menos de 30 segundos. 1.3333 3. Suponga que cada llamada telefónica a una popular radiodifusora tiene una probabilidad de 0.02 de conseguir una conexión, es decir, de no obtener una señal de ocupado. Suponga que las llamadas son independientes. a) ¿Cuál es la probabilidad de que la primera llamada que consiga una conexión sea la décima? b) ¿Cuál es la probabilidad de que se requieran más de cinco llamadas para conseguir una conexión? c) ¿Cuál es el número promedio de las llamadas necesarias para conseguir una conexión? 4. En la selección de personal de una empresa se sabe que sólo el 20% de los aspirantes a un puesto de trabajo cumplen los requisitos exigidos. Se seleccionan al azar los aspirantes y se les entrevista uno a uno. Calcula la probabilidad de que el primer aspirante que cumple los requisitos sea el cuarto entrevistado. 5. Una maquina detecta fallas en los productos que elabora una fábrica. Si los productos tienen una probabilidad de falla del 5%, calcular la probabilidad de que la maquina encuentre su primer producto defectuoso en la octava ocasión que selecciona un producto para su inspección. Respuesta:0.0349 6. La probabilidad de que un estudiante para piloto apruebe el examen escrito para una licencia de piloto privado es 0,7. Encuentre la probabilidad de que el estudiante apruebe el examen a) En el tercer intento b) Antes del cuarto intento. 7. Cuando se graba cierto anuncio de televisión, la probabilidad es de 0,3 de que cierto actor diga sus líneas de corrido en una toma cualquiera. ¿Cuál es la probabilidad de que recite sus líneas de corrido por primera vez en sexta toma? 8. Demuestre que la función de densidad de probabilidad de una variable aleatoria binomial negativa es igual a la función de densidad de probabilidad de una variable aleatoria geométrica cuando r=1. Demuestre que la fórmula de la media y la varianza de una variable binomial negativa es igual a los resultados correspondientes para una variable aleatoria geométrica cuando k=1. 49 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIABLE ALEATORIA CON DISTRIBUCIÓN BINOMIAL NEGATIVA EXPERIMENTOS BINOMIALES NEGATIVOS Si consideramos un experimento donde las propiedades son las mismas que las que se indican para un experimento binomial, con la excepción de que las pruebas se repetirán hasta que ocurra un número fijo de éxitos. Por tanto, en lugar de encontrar la probabilidad de x éxitos en n pruebas (caso binomial), nos interesamos ahora en la probabilidad de que ocurra el k ésimo éxito en la x-ésima prueba. Los experimentos de este tipo se llaman Experimentos Binomiales Negativos. CARACTERÍSTICAS Este Experimento consta de varias condiciones: 3. El Experimento consta de un número indefinido de pruebas y este concluirá cuando se tenga un número determinado de resultados favorables k. 4. Los ensayos o pruebas pueden dar dos resultados posibles y excluyentes a su vez, es decir, E (Éxito) y F (Fracaso). 5. La probabilidad de obtener un resultado E en las pruebas es p, y la de conseguir F es 1-p=q, de forma que p+q=1. 6. p y q son constantes en cada prueba y a su vez estas son independientes. 7. Si la variable aleatoria x es "el número de pruebas necesarias para conseguir K éxitos o resultados A " ; entonces x seguirá una distribución binomial negativa con parámetros p y k. VARIABLE ALEATORIA CON DISTRIBUCIÓN BINOMIAL NEGATIVA (X): Número de pruebas necesarias hasta la obtención de k éxitos en un Experimento Aleatorio. El rango o Recorrido es: 𝑋 = 𝑘, 𝑘 + 1, 𝑘 + 2, 𝑘 + 3, … FUNCIÓN DE PROBABILIDAD (MASA) GRÁFICA DE UNA FUNCIÓN DE PROBABILIDAD: 𝒑 = 𝟎. 𝟑 , 𝒌 = 𝟑 PARÁMETROS 𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 FUNCIÓN DE DISTRIBUCIÓN (ACUMULADA) GRÁFICA DE UNA FUNCIÓN DE DISTRIBUCIÓN: 𝒑 = 𝟎. 𝟕𝟓 , 𝒌 = 𝟏𝟎 50 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán DISTRIBUCIONES BINOMIALES NEGATIVAS PARA TRES VALORES DE K: 𝒑 = 𝟎. 𝟓 𝒚 𝒌 = 𝟐; 𝒌 = 𝟓; 𝒌 = 𝟏𝟎 En forma alternativa también podemos expresar la variable aleatoria binomial negativa considerando el número de pruebas o ensayos previos (fracasos) hasta que se obtenga (aparezcan) “k” éxitos. Entonces: VARIABLE ALEATORIA CON DISTRIBUCIÓN BINOMIAL NEGATIVA X: Número de pruebas o ensayos necesarias (fracasos) obtenidas antes de la aparición de “k” éxitos en un Experimento Aleatorio Binomial Negativo. 𝑋 = 0, 1, 2, 3, … FUNCIÓN DE PROBABILIDAD O MASA 𝒇(𝒙) = 𝑷(𝑿 = 𝒙) = 𝒙+𝒌−𝟏 𝒌 𝒑 (𝟏 − 𝒑)𝒙 , 𝒙 𝒙 = 𝟎, 𝟏, 𝟐, 𝟑, . . . OBSERVACIONES Nótese que cuando 𝒌 = 𝟏, la distribución de probabilidad geométrica es un caso especial de la distribución de probabilidad binomial negativa. Ejemplo 1.27 En un departamento de control de calidad se inspeccionan las unidades terminadas que provienen de una línea de ensamble. Si la proporción de unidades defectuosas es de 0.03. ¿Cuál es la probabilidad de que la vigésima unidad inspeccionada sea la tercera que se encuentra defectuosa? SOLUCIÓN Sea X: Número de unidades que es necesario inspeccionar hasta obtener exactamente tres unidades defectuosas. 𝑿 = 𝟑, 𝟒, 𝟓, 𝟔, . . . Por lo tanto, 𝒙 = 𝟐𝟎 𝒌=𝟑 𝒑 = 𝟎. 𝟎𝟑 Vigésima unidad inspeccionada La tercera que se encuentra defectuosa La proporción de unidades defectuosa La probabilidad de que la vigésima unidad inspeccionada sea la tercera que se encuentra defectuosa es 𝑃(𝑋 = 20) 51 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán )0.033 (1 − 0.03)20−3 𝑃(𝑋 = 20) = (20−1 3−1 )0.033 (0.97)17 = 2.7509 × 10−3 𝑃(𝑋 = 20) = (19 2 ¿Cuál es la probabilidad de que de veinte unidades inspeccionadas, la última inspeccionada sea la tercera unidad defectuosa? SOLUCIÓN Sea X: Número de unidades no defectuosas que es necesario inspeccionar antes de obtener tres unidades defectuosas cuando son veinte el total de unidades inspeccionadas. 𝑿 = 𝟎, 𝟏, 𝟐, 𝟑, . . . Por lo tanto, 𝒙 = 𝟏𝟕 𝒌=𝟑 𝒑 = 𝟎. 𝟎𝟑 Diecisiete unidad inspeccionada no defectuosas de las veinte en total. La tercera que se encuentra defectuosa La proporción de unidades defectuosa La probabilidad de que la vigésima unidad inspeccionada sea la tercera que se encuentra defectuosa es 𝑃(𝑋 = 20) )0.033 (1 − 0.03)17 𝑃(𝑋 = 17) = (17+3−1 17 )0.033 (0.97)17 = 2.7509 × 10−3 𝑃(𝑋 = 17) = (19 17 RELACIÓN ENTRE LAS DISTRIBUCIONES DE PROBABILIDAD BINOMIAL Y BINOMIAL NEGATIVA Existe una relación entre la distribución Binomial Negativa y la distribución Binomial: Sea X: Número de fracasos (ensayos o pruebas) hasta el “k-ésimo” éxito, entonces X sigue una distribución Binomial Negativo, es decir: 𝑋 ~ 𝐵𝑁(𝑘; 𝑝). Si 𝑋 = 𝑥 hay 𝑥 fracasos y 𝑘 éxitos, luego se ha realizado el experimento 𝑥 + 𝑘 veces. Si definimos la variable aleatoria Y: Número de éxitos (ensayos o pruebas) en las 𝑥 + 𝑘 pruebas totales (éxitos y fracasos), entonces 𝑌 ~ 𝐵(𝑥 + 𝑘; 𝑝) y 𝑃(𝑋 ≤ 𝑥) = 𝑃(𝑌 ≥ 𝑘) Esta también es un caso especial de la distribución Binomial, ya que en este caso se trata de que al llevar a efecto varias veces un experimento binomial, se desea determinar la probabilidad de que ocurran x-1 éxitos, en (n-1) ensayo o pruebas, solo que el último de ellos debe ocurrir repetición del experimento que es el último. Si la variable aleatoria 𝑋 tiene distribución Binomial negativa con parámetros 𝑘 𝑦 𝑝 entonces: 𝑃(𝑋 = 𝑥) = 𝑏(𝑥 − 1, 𝑛 − 1, 𝑝)𝑝 Esta relación permite obtener los valores de la probabilidad de la binomial negativa, utilizando los cálculos de la probabilidad binomial. Ejemplo 1.28 Se sabe que 10% de los empleados de una industria padecen de una enfermedad degenerativa. Para el estudio de la enfermedad, se requiere de 3 pacientes que tengan la enfermedad por lo que se analiza sucesivamente al azar a los empleados de la industria hasta tener a los 3 pacientes que den positivo en los análisis. Encontrar la probabilidad de que: 52 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán a) Se tenga que analizar exactamente 5 empleados para tener a los 3 con la enfermedad. b) Se tengan que hacer más de 7 análisis. c) Se tengan que hacer exactamente 3 análisis. SOLUCIÓN Calculando con la función de probabilidad de la variable aleatoria Binomial Negativa Si consideramos la variable aleatoria con distribución Binomial Negativa X que indica el número de análisis previos (pruebas) que es necesario hacer para encontrar los tres positivos (tengan la enfermedad), entonces X se distribuye con parámetros 𝑘 = 3 𝑦 𝑝 = 0.10 a) La probabilidad de que se tenga que analizar exactamente 5 empleados para tener a los 3 con la enfermedad es 𝑃 (𝑋 = 2) 𝑃 (𝑋 = 2 ) = = 2+3−1 0.103 (1 − 0.10)2 = 2 4 0.103 (1 − 0.10)2 = 0.00486 2 Si consideramos la variable aleatoria con distribución Binomial Negativa X que indica el número de análisis totales (éxitos y fracasos) para encontrar los tres positivos (tengan la enfermedad, éxitos), entonces X se distribuye con parámetros 𝑘 = 3 𝑦 𝑝 = 0.10 𝑃 (𝑋 = 5) = = 5−1 0.103 (1 − 0.10)2 = 2 4 0.103 (1 − 0.10)2 = 0.00486 2 Calculando con la función de probabilidad de la variable aleatoria Binomial Si consideramos la variable aleatoria con distribución Binomial X: Número de éxitos (ensayos o pruebas) en las 𝑥 + 𝑘 pruebas totales (éxitos y fracasos),, entonces X se distribuye con parámetros 𝑥 = 3 , 𝑛 = 5 𝑦 𝑝 = 0.10 𝑏(𝑥 − 1, 𝑛 − 1, 𝑝)𝑝 = 𝑏(2,4,0.10) 4 𝑃(𝑋 = 2)𝑝 = [(2) (0,10)2 (0,90)2 ] (0.10) 𝑃 (𝑋 = 2)𝑝 = (0.0486001)(0.10) = 0.00486001 b) La probabilidad de que se tengan que hacer más de 7 análisis es 𝑃(𝑋 > 7) 𝑃(𝑋 > 7) = 0.97431 c) La probabilidad de se tengan que hacer exactamente 3 análisis 𝑃(𝑋 = 3) 𝑃 (𝑋 = 3) = 0.001 53 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplo 1.29 La probabilidad de que una persona fallezca en un accidente de tránsito en una Ciudad es del 25%. Si en la ciudad se presentan aproximadamente 60 accidentes diarios y el vehículo de la Fiscalía requiere llenar por completo su cupo de 5 cadáveres antes de regresar a la Fiscalía. ¿Cuál es la probabilidad de que el vehículo de la Fiscalía realice 4 viajes con el cupo lleno en un día? SOLUCIÓN Sea X: Número de vehículos que es necesario verificar hasta obtener exactamente cuatro vehículos con el cupo lleno. Por lo tanto, dnbinom(x=15-5, 5, prob=.25) Resultado: 0,05504866 = 5.504866% 54 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán RELACIÓN DE PROBLEMAS N 5 TEMA: VARIABLES ALEATORIAS DISCRETAS CON DISTRIBUCIÓN BINOMIAL NEGATIVA 1. Calcule las siguientes probabilidades binomiales directamente de la fórmula para b(x; n, p). a. b(3; 8, 0.6) b. b(5; 8, 0.6) c. P(3 ≤ X ≤ 5) cuando n = 8 y p = 0.6 d. P(1 ≤ X) cuando n = 12 y p = 0.1 2. Utilice una tabla para obtener las siguientes probabilidades: a. B(4; 10, 0.3) b. b(4; 10, 0.3) c. b(6; 10, 0.7) d. P(2 ≤ X ≤ 4) cuando X Bin(10, 0.3) e. P(2 ≤ X) cuando X Bin(10, 0.3) f. P(X ≤ 1) cuando X Bin(10, 0.7) g. P(2 < X < 6) cuando X Bin( 10, 0.3) 3. La probabilidad de que un submarino hunda un barco enemigo con un disparo de sus torpedos es 0.8. Si los disparos son independientes, determine la probabilidad de un hundimiento dentro de los primeros dos disparos, y dentro de los primeros tres. 4. De acuerdo con la revista Chess Life, 40% de los grandes maestros de ajedrez del mundo consideran que Garry Kaspárov es el mejor ajedrecista de todos los tiempos. Si se les pregunta a varios grandes maestros su opinión a este respecto, encuentre la probabilidad de que le octavo a quien se le planteó la pregunta sea el cuarto que considera a Kaspárov el mejor ajedrecista de todos los tiempos. 55 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIABLE ALEATORIA CON DISTRIBUCIÓN HIPERGEOMETRICA EXPERIMENTOS HIPERGEOMÉTRICOS CARACTERÍSTICAS Si consideramos un experimento donde las propiedades son las mismas que las que se indican para un experimento binomial, con la excepción de que las pruebas se repetirán hasta que ocurra un número fijo de éxitos. Por tanto, en lugar de. Los experimentos de este tipo se llaman Experimentos Hipergeométricos Los experimentos que tienen este tipo de distribución tienen las siguientes características: a) Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados. b) Las probabilidades asociadas a cada uno de los resultados no son constantes. c) Cada ensayo o repetición del experimento no es independiente de los demás. d) El número de repeticiones del experimento (n) es constante VARIABLE ALEATORIA CON DISTRIBUCIÓN HIPERGEOMÉTRICA (X): Número de éxitos en una muestra de un Experimento Aleatorio. FUNCIÓN DE PROBABILIDAD GRÁFICA DE UNA FUNCIÓN DE PROBABILIDAD: Donde: 𝑁: 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑟: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑒𝑥𝑖𝑡𝑜𝑠𝑜𝑠 𝑒𝑛 𝑙𝑜𝑠 𝑁 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑛: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑥𝑡𝑟𝑎í𝑑𝑜𝑠 𝑥: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑥𝑖𝑡𝑜𝑠𝑜𝑠 𝑒𝑛 𝑙𝑜𝑠 𝑛 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 Dado que x no puede ser mayor que n, ni mayor que r, entonces: 𝑥 ≤ 𝑀í𝑛 (𝑟, 𝑛) De manera similar el número de fracasos será: De donde, Luego, Por lo tanto, 𝑛 − 𝑥 ≤ 𝑀í𝑛 (𝑛, 𝑁 − 𝑟) 𝑥 ≥ 𝑛 − 𝑀í𝑛 (𝑛, 𝑁 − 𝑟) 𝑥 ≥ 𝑀á𝑥 (0, 𝑛 − 𝑁 + 𝑟) 𝑀á𝑥 (0, 𝑛 − 𝑁 + 𝑟) ≤ 𝑥 ≤ 𝑀í𝑛 (𝑟, 𝑛) El rango o Recorrido es: 𝑋 = 𝑀á𝑥 (0, 𝑛 − 𝑁 + 𝑟) ≤ 𝑥 ≤ 𝑀í𝑛 (𝑟, 𝑛) PARÁMETROS 𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 NOTACIÓN: 𝑿 ~ 𝑯(𝑵; 𝒏; 𝒓) FUNCIÓN DE DISTRIBUCIÓN 56 GRÁFICA DE UNA FUNCIÓN DE DISTRIBUCIÓN: Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán DISTRIBUCIONES HIPERGEOMÉTRICAS PARA TRES VALORES DIFERENTES OBSERVACIONES 𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑘 𝑁 Podemos observar de los valores que asume el valor esperado y la varianza presenta un factor ( ) que se puede interpretar como la proporción de los éxitos de la población, es decir que: 𝑘 =𝑝 𝑛 Reemplazando este valor en las fórmulas del valor esperado y la varianza tenemos: 𝑘 = 𝑛𝑝 𝑁 𝑁−𝑘 𝑁−𝑛 𝑘 𝑁−𝑛 = 𝑛𝑝 1 − = 𝑛𝑝(1 − 𝑝) 𝑁 𝑁−1 𝑁 𝑁−1 𝐸(𝑋) = 𝑛 𝑉(𝑋) = 𝑛 𝑘 𝑁−𝑛 𝑁 𝑁−1 RELACIÓN ENTRE LA DISTRIBUCIÓN BINOMIAL Y LA DISTRIBUCIÓN HIPERGEOMÉTRICA CONCLUSIONES De acuerdo a los anteriores resultados tenemos: Valor esperado de la variable binomial y la variable hipergeométrica son iguales. 𝑁−𝑛 Las varianzas de las dos variables difieren pro el factor (𝑁−1 ) que se conoce como FACTOR DE CORRECCIÓN POR POBLACIÓN FINITA. 𝑁−𝑛 Como Cuando la población tiene un tamaño grande 𝑁 ⟶ ∞ este coeficiente es aproximadamente 1. Es decir: 𝑁−1 < 1 entonces la variable hipergeométrica tiene menor varianza que la variable binomial. Si 𝑁 ⟶ ∞ entonces 𝑁−𝑛 𝑁−1 ⟶1 Una regla de uso frecuente establece que: Si 𝑛 𝑁 ≤ 0.05 entonces 𝑁−𝑛 𝑁−1 ≅ 1, es decir si la muestra contiene menos del 5% de los elementos de la población entonces la distribución de la variable hipergeométrica puede ser reemplazada por la distribución de la variable binomial. 𝑯(𝑵; 𝒏; 𝒓) ⟶ 𝒃 (𝒏; 57 𝑟 = 𝑝) 𝑛 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplo 1.30 De un grupo de 20 productos, 10 se seleccionan al azar para la prueba. ¿Cuál es la probabilidad de que 10 productos seleccionados contengan 5 productos buenos?. Loa productos defectuosos son 5 en el lote. Solución Datos 𝑵 = 20 (Número total de productos) 𝒏 = 10 (Número de productos seleccionados) 𝒓 = 5 (Número de productos buenos) X: “Número de productos buenos del total de los 10 productos seleccionados”. Así la variable aleatoria puede asumir los siguientes valores: 𝒙 = 0 ; 1 ; 2 ; 4 ; 10 Luego, la función de probabilidad está dada por: 𝑃(𝑋 = 5) = (55)(20−5 ) 10−5 (20 ) 10 = 0.01625387 Ejemplo 1.31 En una localidad muy alejada de la capital, se impugnaron los resultados de un proceso electoral. Por ello el Jurado Nacional de Elecciones procedió a examinar 10 mesas con un total de 1450 votos. De acuerdo a las actas del escrutinio, se tenía 48 votos impugnados. a. b. c. d. ¿Cuál es la probabilidad de que al elegir 5 votos del total de las 10 mesas, se encuentren por lo menos dos votos impugnados? ¿Cuál es la probabilidad de que al elegir 5 votos del total de las 10 mesas, se encuentren como máximo tres votos impugnados? ¿Cuál es la probabilidad de que al elegir 5 votos del total de las 10 mesas, se encuentren cuatro votos impugnados? ¿Cuál es la probabilidad de que al elegir 5 votos del total de las 10 mesas, se encuentren comprendidos entre dos y cuatro votos impugnados? Solución Datos 𝑵 = 1450 (Número total de votos) 𝒏 = 5 (Número de votos de las 10 mesas) 𝒓 = 48 (Número de votos impugnados del total) X: “Número de votos impugnados al elegir de 5 votos del total de las 10 mesas”. Así la variable aleatoria puede asumir los siguientes valores: 58 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 𝒙 = 0 ;1 ;2 ; 4 ; 5 Luego, la función de probabilidad está dada por: (a) La probabilidad de que al elegir 5 votos de las 10 mesas, se encuentren por lo menos 2 votos impugnados está dado por: 𝑷(𝑿 ≥ 𝟐). Aplicando la función de distribución Hipergeométrica (fórmula) tenemos: 𝑷(𝑿 ≥ 𝟐) = 𝟏 − 𝑷(𝑿 < 𝟐) = 𝟏 − 𝑷(𝑿 ≤ 𝟏) = 𝟏 − [𝑷(𝑿 = 𝟎) + 𝑷(𝑿 = 𝟏)] =𝟏− 𝟏𝟒𝟎𝟐 (𝟒𝟖 𝟎 )( 𝟓 ) (𝟏𝟒𝟓𝟎 𝟓 ) + 𝟏𝟒𝟎𝟐 (𝟒𝟖 𝟏 )( 𝟒 ) (𝟏𝟒𝟓𝟎 𝟓 ) = 𝟏 − (𝟎, 𝟖𝟒𝟒𝟖𝟖 + 𝟎, 𝟏𝟒𝟓𝟎) = 𝟎, 𝟎𝟏𝟎𝟎𝟕𝟓 (b) La probabilidad de que al elegir 5 votos del total de las 10 mesas, se encuentren como máximo tres votos impugnados es: 𝑷(𝑿 ≤ 𝟑). Aplicando la función de distribución de Hipergeométrica (fórmula) tenemos: 𝑷(𝑿 ≤ 𝟑) = 𝑷(𝑿 = 𝟎) + 𝑷(𝑿 = 𝟏) + 𝑷(𝑿 = 𝟐) + 𝑷(𝑿 = 𝟑) = 𝟏𝟒𝟎𝟐 (𝟒𝟖 𝟎 )( 𝟓 ) (𝟏𝟒𝟓𝟎 𝟓 ) + 𝟏𝟒𝟎𝟐 (𝟒𝟖 𝟏 )( 𝟒 ) (𝟏𝟒𝟓𝟎 𝟓 ) + 𝟏𝟒𝟎𝟐 (𝟒𝟖 𝟐 )( 𝟑 ) (𝟏𝟒𝟓𝟎 𝟓 ) + 𝟏𝟒𝟎𝟐 (𝟒𝟖 𝟑 )( 𝟐 ) (𝟏𝟒𝟓𝟎 𝟓 ) = 𝟎, 𝟖𝟒𝟒𝟖𝟖 + 𝟎, 𝟏𝟒𝟓𝟎 + 𝟎, 𝟎𝟎𝟗𝟕𝟓 + 𝟎, 𝟎𝟎𝟎𝟑𝟐𝟎𝟐 = 𝟎, 𝟗𝟗𝟗𝟗𝟓 (c) La probabilidad de que al elegir 5 votos del total de las 10 mesas, se encuentren cuatro votos impugnados es : 𝑷(𝑿 = 𝟒) Aplicando la función de distribución de Hipergeométrica (fórmula) tenemos: 𝑷(𝑿 = 𝟐) = 𝟏𝟒𝟎𝟐 (𝟒𝟖 𝟐 )( 𝟑 ) (𝟏𝟒𝟓𝟎 𝟓 ) = 𝟎, 𝟎𝟎𝟗𝟕𝟓 Ejemplo 1.32 María Inés, encargada de la elaboración de la planilla de su empresa, debe confeccionar para 11 trabajadores. Debido a su estado emocional de ese día, confecciona 7 nóminas con errores. Puesto que esta no es la única vez que comete ese tipo de error, el Gerente de la empresa se encuentra descontento. Con la intención de tomar decisiones elige 5 nóminas aleatoriamente y encuentra errores en tres de ellas. La señorita María Inés se defiende argumentando que el porcentaje de error es muy bajo para ser tomado en cuenta. ¿Cree usted que este es un buen argumento? Solución Datos 𝑵 = 11 (Número total de nóminas para los trabajadores) 𝒏 = 5 (Número de nóminas elegidas al azar) 𝒓 = 7 (Número de nóminas con errores) X: “Número de nóminas confeccionadas con errores de las 5 nóminas elegidas al azar”. Así la variable aleatoria puede asumir los siguientes valores: 𝒙 = 0 ;1 ;2 ; 3 ; 4 ; 5 59 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Luego, la función de probabilidad está dada por: 𝑷(𝑿 = 𝟑) = Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán (𝟕𝟑)(𝟒𝟐) (𝟏𝟏 𝟓) = 𝟎, 𝟒𝟓𝟒𝟓𝟓𝟓 Luego, el argumento de la señorita María Inés no es válido. EJEMPLO Consideremos el ejemplo de una población de 100 personas de las cuales 10 tienen miopía. Calcular la probabilidad de que haya a lo sumo dos personas miopes en un grupo de 10 escogidos al azar y sin reemplazo. Datos: 𝑵 = 100 (Número total de personas) 𝒏 = 10 (Número de personas escogidas al azar) 𝒓 = 10 (Número de personas con miopía en la población) X: “Número de personas miopes en un grupo de 10 escogidos al azar”. Así la variable aleatoria puede asumir los siguientes valores: 𝒙 = 0 ; 1 ; 2 ; . . .10 Así, la probabilidad de que haya a lo sumo dos personas miopes en un grupo de 10 escogidos al azar y sin reemplazo está dado por: 𝑃(𝑋 ≤ 2) 60 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad RELACIÓN DE PROBLEMAS N 6 1. Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán TEMA: VARIABLES ALEATORIAS DISCRETAS CON DISTRIBUCIÓN HIPERGEOMÉTRICA Una compañía manufacturera utiliza un esquema para la aceptación de los artículos producidos antes de ser embarcados. El plan es de dos etapas. Se preparan cajas de 25 para embarque y se selecciona una muestra de tres para verificar si tienen algún artículo defectuoso. Si se encuentra uno, la caja se regresa para verificarla al 100%. Si no se encuentra ningún artículo defectuoso, la caja se embarca. a) ¿Cuál es la probabilidad de que se embarque una caja que tiene tres artículos defectuosos? b) ¿Cuál es la probabilidad de que una caja que contiene solo un artículo defectuoso se regrese para verificación? c) ¿Cuál es la probabilidad de que se embarque una caja que tiene a lo sumo dos artículos defectuosos? 2. Una empresa constructora tiene en marcha dos obras en la misma ciudad. En una de las obras dispone de veinte trabajadores, de los cuales dos son encargados y el resto peones. Debido a un imprevisto, es necesario trasladar tres trabajadores a la segunda parte. Si se eligen los trabajadores al azar, probabilidad de que dos de ellos sean peones. 3. Suponga que se sabe que un envío de 100 Videograbadoras tiene 10 defectuosas. Un inspector elige 12 para la inspección. Le in teresa determinar la probabilidad de que, entre los 12: b. Como mínimo 2 sean defectuosos. c. Como máximo sean 4 defectuosos d. Más de 3 defectuosos pero menos de 8 defectuosos 5. Una línea de ensamblaje produce productos que colocan en cajas de 50. El inspector luego escoge aleatoriamente 3 artículos dentro de una caja para probar si están defectuosos. En una caja que contiene 4 defectuosos, están interesados en la probabilidad de que al menos uno de los tres elementos muestreados sea defectuoso. 6. Una empresa tiene un grupo de 15 solicitantes (10 hombres, 5 mujeres) para un puesto en particular que tiene 3 vacantes actuales. Están interesados en la probabilidad de que ninguna de las posiciones sea ocupada por mujeres. 7. Suponga que un envío de 100 cajas de fruta tiene 11 cajas en las que la fruta muestra signos de deterioro. Una inspección de control de calidad selecciona 8 cajas al azar, abre estas cajas seleccionadas y luego cuenta el número (de 8) en el que la fruta mues tra signos de deterioro. ¿Cuál es la probabilidad de que exactamente dos cajas en la muestra muestren signos de deterioro? 8. Suponga que se está formando un grupo de trabajo de tecnología para estudiar la conciencia tecnológica entre los instructores. Suponga que diez personas serán elegidas al azar para formar parte del comité de un grupo de 28 voluntarios, 20 que son técnicamente competentes y ocho que no lo son. Estamos interesados en el número del comité que no es técnicamente competente. a. Encuentre la probabilidad de que al menos cinco en el comité no sean técnicamente competentes. b. Encuentre la probabilidad de que a lo sumo tres en el comité no sean técnicamente competentes. 9. En uno de sus catálogos de Spring, LL Bean® publicitó calzado en 29 de sus 192 páginas de catálogo. Supongamos que encuestamos aleatoriamente 20 páginas. Estamos interesados en la cantidad de páginas que anuncian calzado. Cada página puede seleccionarse como máximo una vez. a. ¿Cuántas páginas esperas anunciar calzado en ellas? b. Calcule la desviación estándar. 10. Suponga que un grupo de estudiantes de estadística se divide en dos grupos: especializaciones empresariales y especializaciones no empresariales. Hay 16 especializaciones comerciales en el grupo y siete especializaciones no comerciales en el grupo. Se toma una muestra aleatoria de nueve estudiantes. Estamos interesados en la cantidad de especialidades comerciales en la muestra. En promedio, ¿cuántos esperarías que sean grandes empresas? 61 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIABLES ALEATORIAS CON DISTRIBUCIÓN DE POISSON En su origen, Poisson determinó esta distribución de probabilidad como límite de la distribución 𝑿 ~ 𝓑(𝒏; 𝒑) en el caso que 𝒏 → ∞ y 𝒑 → 𝟎, pero luego se vio que podía aplicarse a fenómenos aleatorios concretos. Ejemplos: Entrada de usuarios que llegan a un punto de servicio y van formando cola. Cantidad de siniestros que se presentan en una cartera de una Compañía de Seguros: Fallecimientos por accidentes de circulación, incendios de inmuebles, etc. Número de llamadas que se reciben, en un intervalo de tiempo dado en una central de teléfonos, etc. VARIABLE ALEATORIA CON DISTRIBUCIÓN GEOMÉTRICA X: Número de éxitos que se desea que ocurra por unidad de tiempo, espacio, área o producto. FUNCIÓN DE PROBABILIDAD (MASA) 𝒇(𝒙) GRÁFICA DE UNA FUNCIÓN DE PROBABILIDAD 𝝀 = 𝟏𝟎 Donde: 𝝀: 𝒎𝒆𝒅𝒊𝒂 𝒐 𝒑𝒓𝒐𝒎𝒆𝒅𝒊𝒐 𝒅𝒆 é𝒙𝒊𝒕𝒐𝒔 𝒑𝒐𝒓 𝒖𝒏𝒊𝒅𝒂𝒅 𝒅𝒆 𝒕𝒊𝒆𝒎𝒑𝒐 , á𝒓𝒆𝒂 𝒐 𝒑𝒓𝒐𝒅𝒖𝒄𝒕𝒐. 𝒆: 𝟐, 𝟕𝟏𝟖 𝑿: 𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 é𝒙𝒊𝒕𝒐𝒔 𝒒𝒖𝒆 𝒔𝒆 𝒅𝒆𝒔𝒆𝒂 𝒒𝒖𝒆 𝒐𝒄𝒖𝒓𝒓𝒂 𝒑𝒐𝒓 𝒖𝒏𝒊𝒅𝒂𝒅 𝒅𝒆 𝒕𝒊𝒆𝒎𝒑𝒐 , á𝒓𝒆𝒂 𝒐 𝒑𝒓𝒐𝒅𝒖𝒄𝒕𝒐. PARÁMETROS 𝑽𝒂𝒍𝒐𝒓 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒐 𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 FUNCIÓN DE DISTRIBUCIÓN 𝑭(𝒙) GRÁFICA DE UNA FUNCIÓN DE DISTRIBUCIÓN 𝝀 = 𝟏𝟎 NOTACIÓN: 𝒏 𝑷(𝝀) = 𝒇(𝒙) = ( ) 𝒑𝒙 (𝟏 − 𝒑)𝒏−𝒙 𝒙 𝑩(𝒙; 𝒏; 𝒑) = 𝑭(𝒙) 𝒙 = ∑ 𝒃(𝒙; 𝒏; 𝒑) ; 𝒙 = 𝟎, 𝟏, . . . , 𝒏 𝒌=𝟎 62 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán GRÁFICAS DE FUNCIONES DE PROBABILIDAD DE POISSON Aunque teóricamente los valores de una variable aleatoria con distribución de Poisson pueden ser iguales a cualquier número natural, las probabilidades de que la variable tome valores cada vez mayores decrecen de manera muy acelerada, pudiéndose comprobar que sólo entre muy pocos valores, dependiendo de 𝝀 se acumula la mayoría de la probabilidad, lo que tiene como consecuencia el que la probabilidad de que la variable tome un valor no muy alto sea relativamente despreciable, hecho que indica que este esquema describe los sucesos que, aun siendo probables, son pocos probables cuando se tiene que presentar un número repetido de veces relativamente alto. Poe esta razón, a esta distribución también se la conoce como de los sucesos raros[1] . Ejemplo 1.33 Si un banco recibe en promedio 𝜆 = 6 cheques sin fondos por día, ¿cuál es la probabilidad de que reciba cuatro cheques sin fondos en un día determinado? a. b. c. d. e. Determinar la función de probabilidad ¿cuál es la probabilidad de que reciba cuatro cheques sin fondos en un día determinado? ¿cuál es la probabilidad de que reciba como máximo dos cheques sin fondos en un día determinado? ¿cuál es la probabilidad de que reciba como mínimo tres cheques sin fondos en un día determinado? ¿cuál es la probabilidad de que reciba más de cuatro cheques pero menos de siete cheques sin fondo? SOLUCIÓN Datos 𝝀 = 𝟔: Promedio de cheques sin fondo por día 𝑿: Número de cheques sin fondos en un día determinado 𝒙 = 𝟎 ; 𝟏; 𝟐 ; 𝟑 ; 𝟒 ; . . . (a) Luego, la función de probabilidad está dada por: 𝑓(𝑥) = 6𝑥 𝑥! 𝑒 −𝜆 ; 𝑥 = 0 ; 1; 2 ; 3 ; 4 ; . . . (b) La probabilidad de que reciba cuatro cheques sin fondos en un día determinado está dado por: 𝑃(𝑋 = 4) = 𝑓(4) 63 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Aplicando la función de probabilidad (fórmula) tenemos: 𝑓(4) = 64 4! 𝑒 −6 = 1296 24 (0,002478) = 𝟎, 𝟏𝟑𝟒 Usando la tabla de distribución acumulada: 𝑃(𝑋 = 4) = 𝑃(𝑋 ≤ 4) − 𝑃(𝑋 ≤ 3) = 0,2851 − 0,1512 = 𝟎, 𝟏𝟑𝟒 (c) La probabilidad de que reciba como máximo dos cheques sin fondos en dos días determinados, está dado por: 𝑃(𝑋 ≤ 2) = 𝐹(2) Aplicando la función de probabilidad (fórmula) tenemos: 𝑃(𝑋 ≤ 2) = 𝐹(2) = 𝑓(0) + 𝑓(1) + 𝑓(2) = 60 0! 𝑒 −6 + 61 1! 𝑒 −6 + 62 2! 𝑒 −6 = 0,00248 + 0,01487 + 0,044618 = 0,00248 + 0,01487 + 0,044618 = 𝟎, 𝟎𝟔𝟐 Usando la tabla de distribución acumulada de Poisson: 𝑃(𝑋 ≤ 2) = 0,0620 (d) La probabilidad de que reciba como mínimo cuatro cheques sin fondos en un día determinado está dado por: 𝑃(𝑋 ≥ 4) Aplicando la función de probabilidad (fórmula) tenemos: 𝑃(𝑋 ≥ 4) = 1 − 𝑃(𝑋 ≤ 3) = 1 − 𝐹(3) = 1 − [𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3)] 60 −6 61 −6 62 −6 63 −6 = 1− [ 𝑒 + 𝑒 + 𝑒 + 𝑒 ] 0! 1! 2! 3! = 1 − [0,00248 + 0,01487 + 0,044618 + 0,089235] = 1 − [0,151203] = 𝟎, 𝟖𝟒𝟖𝟖 64 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Usando la tabla de distribución acumulada de Poisson: 𝑃(𝑋 ≥ 4) = 1 − 𝑃(𝑋 ≤ 3) = 1 − 𝑃(𝑋 ≤ 3) = 1 − 0,1512 = 𝟎, 𝟖𝟒𝟖𝟖 (e) La probabilidad de que reciba más de cuatro cheques pero menos de siete cheques sin fondo 𝑃(4 < 𝑋 < 7) Aplicando la función de probabilidad (fórmula) tenemos: 𝑃(4 < 𝑋 < 7) = 𝑃(𝑋 ≤ 6) − 𝑃(𝑋 ≤ 4) = 𝑓(5) + 𝑓(6) = 65 5! 𝑒−6 + = 0,16062 + 0,16062 = 𝟎, 𝟑𝟐𝟏𝟐 66 6! 𝑒−6 Usando la tabla de distribución acumulada de Poisson: 𝑃(4 < 𝑋 < 7) = 𝑃(𝑋 ≤ 6) − 𝑃(𝑋 ≤ 4) = 0,6063 − 0,2851 = 𝟎, 𝟑𝟐𝟏𝟐 65 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad RELACIÓN DE PROBLEMAS N 7 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán TEMA: VARIABLES ALEATORIAS DISCRETAS: MODELOS DE PROBABILIDAD POISSON EJERCICIOS DE CÁLCULO CON TABLAS DE PROBABILIDAD DE POISSON 1. Utilice la tabla de probabilidad de Poisson simple y acumulada para calcular: DEMOSTRACIONES 2. Comprobar que en la distribución de Poisson EJERCICIOS DE APLICACIÓN 3. Un estudio de higiene y seguridad industrial que se realizó a largo plazo llevó a la gerencia a concluir que el número de accidentes por trabajador, durante un año (X), sigue una distribución Poisson. Si el promedio anual de accidentes por trabajador fue de 0.3, estimar lo siguiente: a) ¿Cuál es la probabilidad de que un trabajador seleccionado aleatoriamente, no tenga un accidente durante el año siguiente? b) ¿Cuál es la probabilidad de que un empleado seleccionado aleatoriamente, tenga cuando menos 1 accidente durante el siguiente año? c) ¿Cuál es la probabilidad de que un trabajador tenga, exactamente 1 accidente? d) ¿Cuál es la probabilidad de que un trabajador seleccionado al azar de la fábrica tenga entre 2 y 4 accidentes, inclusivamente el próximo año? 4. En un estudio de higiene industrial una población de trabajadores de un grupo de industrias que manejan procesos muy ruidosos tienen 5% de problemas emocionales que interfieren con su trabajo. Si se saca una muestra aleatoria de 60 trabajadores, utilice la distribución Poisson para dar una aproximación a las probabilidades binomial y calcule: a) Si más de 2 trabajadores sufren de disturbios emocionales. b) Cuando menos 4. c) 5 o más. 5. Supongamos que la razón de neumáticos defectuosos en una fábrica es 4 en un millón de neumáticos fabricados en un mes. a. Si los neumáticos se fabrican independientemente y mensualmente se producen 500000 neumáticos: i. Determine la probabilidad de que a lo más 4 neumáticos resulten defectuosos en un mes. ii. Determine la probabilidad de que en un año al menos en 2 meses resulten más de 4 neumáticos defectuosos. b. Si se observa la producción de neumáticos mes a mes hasta que en 4 meses resultan a lo más 4 neumáticos defectuosos. Determine la probabilidad de tener que observar la producción de a lo menos 6 meses. 6. La llegada de camiones a una estación recolectora es un proceso de Poisson con una tasa media de arribo de 2 por hora. a) Encuentre la probabilidad de que exactamente 5 camiones lleguen en un periodo de dos horas. b) Encuentre la probabilidad de que 8 o más camiones lleguen en un periodo de dos horas. c) Encuentre la probabilidad de que exactamente 2 camiones lleguen en un periodo de una hora y exactamente 3 camiones lleguen en el siguiente periodo de una hora. 7. Un ingeniero consultor recibe, en promedio, 0.7 solicitudes por semana. Si el número de solicitudes sigue un proceso de Poisson, encuentre la probabilidad de que a) en una semana dada, habrá al menos 1 solicitud; b) en un periodo dado de 4 semanas, habrá al menos 3 solicitudes. 8. EI número de accidentes graves en una planita industrial es de diez por ano, de manera tal que el gerente instituye un plan que considera efectivo para reducir el número de accidentes en la planta. Un año después de ponerlo en marcha, solo han ocurrido cuatro accidentes. a) ¿Qué probabilidad hay de cuatro 0 menos accidentes por ano, si la frecuencia promedio aun es diez? b) Después de lo anterior, ¿.puede concluirse que, luego de un año, el número de accidentes promedio ha disminuido? 9. Los baches en ciertas carreteras pueden ser un problema grave y requieren reparación constantemente. Con un tipo específico de terreno y mezcla de concreto la experiencia sugiere que hay, en promedio, 2 baches por milla después de cierta cantidad de uso. Se supone que el proceso de Poisson se aplica a la variable aleatoria “numero de baches”. a) ¿Cuál es la probabilidad de que no aparezca más de un bache en un tramo de una milla? b) ¿.Cual es la probabilidad de que no aparezcan más de 4 baches en un tramo determinado de 5 millas? 66 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán APROXIMACIÓN DE LA DISTRIBUCIÓN DE POISSON COMO APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL Considérese ahora cualquiera de los dos ejemplos: “Número de visitas a una página web por hora” o “Número de defectos en el tejido de determinada tela por 𝑚2 ”. Supóngase el tiempo o el espacio según el caso, dividido en un gran número de pequeñas porciones (milésimas de segundo, milímetros cuadrados), de tal forma que en cada una de ellas, puede haber una visita o no, puede haber un defecto o no. Si las porciones son suficientemente pequeñas, pueden asumirse aproximadamente ciertas las siguientes hipótesis: a) En una porción o sea un suceso o ninguno. b) El que en una porción determinada se dé o no un suceso es independiente de lo que ocurra en las otras porciones. Por lo tanto, el número de sucesos en la unidad de tiempo o espacio se distribuye aproximadamente binomial, con parámetros n: número de porciones consideradas y p: probabilidad de éxito en cada porción. Pero n es muy grande (ejemplo, 60 000 primer caso y 1 000 000 segundo caso), y en un intervalo tan pequeño es poco probable que se dé un suceso, luego p es muy pequeño. Las mayores precauciones que deben tomarse son las siguientes: En general utilizaremos la distribución de Poisson como aproximación de experimentos binomiales donde el número de pruebas es muy alto, pero la probabilidad de éxito muy baja. Es buena si 𝑛 ≥ 50 y 𝑝 ≤ 0.1 y 𝜆 = 𝑛𝑝 permanece constante. Es excelente si 𝑛 ≥ 100 ; 𝑝 ≤ 0.01 y 𝑛𝑝 ≤ 10 y 𝜆 = 𝑛𝑝 permanece constante. Será tanto mejor cuanto mayor sea 𝑛 y menor sea 𝑝. Es decir: FUNCIÓN DE PROBABILIDAD (MASA) BINOMIAL FUNCIÓN DE PROBABILIDAD (MASA) DE POISSON 67 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplo 1.34 Dada una variable aleatoria X ~ 𝐵(10000, 0.0003), obtener la probabilidad de que tome el valor 4. Es decir: 𝑃(𝑥 = 4 ) SOLUCIÓN Datos 𝒏 = 10 000 (Número de ensayos o pruebas) 𝒑 = 0.0003 (Probabilidad de éxito) 𝒒 = 1 − 𝑝 = 0.9997 (Probabilidad de fracaso) X: “Número de éxitos en las 10 000 pruebas o ensayos”. Así la variable aleatoria puede asumir los siguientes valores, 𝒙 = 0 ; 1 ; 2 ; 4 ; . . . ; 10 000 Como 𝒏 es grande y 𝒑 pequeño, considerando 𝑛 = 10 000 ≥ 50 y 𝑝 = 0.0003 ≤ 0.1 y 𝜆 = 𝑛𝑝 = (10 000)(0.0003) = 3, el cálculo de probabilidades del modelo binomial se puede aproximar por el modelo de poisson,l es decir: 𝐵 (10000, 0.0003) ~ 𝑃(𝜆 = 3 ) Luego, 𝑃(𝑥 = 4 ) ≈ 34 𝑒 −3 = 0.168 4! Ejemplo 1.35 La probabilidad de que se produzca un producto defectuoso en una cadena de producción es 0.005. Seleccionada una muestra de 800 productos, determinar: a) La probabilidad de encontrar tres productos defectuosos. b) La probabilidad de encontrar más de dos productos defectuosos. c) Sabiendo que se han encontrado dos productos defectuosos, la probabilidad de que el número de productos defectuosos sea como máximo cuatro. SOLUCIÓN Sea la variable aleatoria X: “Número de productos defectuosos (éxitos) de un grupo de 800 (pruebas o ensayos)” 𝒏 = 800 (Número de ensayos o pruebas) 𝒑 = 0.005 (Probabilidad de éxito o ser producto defectuoso) Como 𝒏 es grande y 𝒑 pequeño, es decir 𝑛 = 800 ≥ 50 y 𝑝 = 0.005 ≤ 0.1 y 𝜆 = 𝑛𝑝 = (800)(0.005) = 4, el cálculo de probabilidades del modelo binomial se puede aproximar por el modelo de poisson,l es decir: 𝐵(800, 0.005) ~ 𝑃(𝜆 = 4 ) Luego, a) b) La probabilidad de encontrar tres productos defectuosos. 𝑒 −4 𝑃(𝑥 = 3 ) ≈ 43 = 0.195 3! La probabilidad de encontrar más de dos productos defectuosos. 𝑃(𝑥 > 2 ) = 1 − 𝑃(𝑥 ≤ 2 ) c) Sabiendo que se han encontrado dos productos defectuosos, la probabilidad de que el número de productos defectuosos sea como máximo cuatro. 68 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplo 1.36 EJEMPLO 3 El 5% de vehículos que transitan por la calles de la ciudad de Arequipa tienen tubos de escape defectuosos. Si un día determinado se seleccionan al azar a 20 automóviles y se les examina el tubo de escape. ¿Cuál será la probabilidad de que menos de 5 de estos vehículos presenten un tubo de escape defectuoso? Si definimos X: “Número de automóviles cuyo tubo de escape es defectuoso” con probabilidad de éxito 𝑝 = 0,05 (5% de vehículos defectuosos) y 𝑛 = 20 entonces: La probabilidad de que menos de 5 de estos vehículos presenten un tubo de escape defectuoso será: 𝑃(𝑋 < 5) Aplicando la función de distribución y probabilidad Binomial (fórmula) tenemos: Usando la tabla de distribución acumulada Binomial: 𝑃(𝑋 < 5) = 𝑃(𝑋 ≤ 4) = 𝟎, 𝟗𝟗𝟕𝟒 Esto ocurre cuando la probabilidad de éxito “𝒑” es pequeño y 𝒏 es lo suficientemente grande. Una forma de obtener un resultado más aceptable es aproximar la solución mediante la distribución de Poisson. Aplicando la función de distribución y probabilidad de Poisson (fórmula) tenemos: 𝜆 = 𝑛𝑝 = (20)(0,05) = 1 𝑃(𝑋 < 5) = 𝑃(𝑋 ≤ 4) = 𝐹(4) = 𝑓(0) + 𝑓(1) + 𝑓(2) + 𝑓(3) + 𝑓(4) = 10 0! 𝑒 −1 + 11 1! 𝑒 −1 + 12 2! 𝑒 −1 + 13 −1 14 −1 𝑒 + 𝑒 3! 4! Usando la tabla de distribución acumulada de Poisson: 𝑃(𝑋 < 5) = 𝑃(𝑋 ≤ 4) = 𝟎, 𝟗𝟗𝟔𝟑 69 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplo 1.37 Una compañçia de seguros ha descubierto que sólo alrededor del 0,1% de la población tiene ciertp tipo de accidente cada año. Si 10000 asegurados fueran seleccionados aleatoriamente de la población ¿cuál será la probabilidad de que no más de 5 tengan un accidente de este tipo el próximo año? SOLUCIÓN Sea X la variable aleatoria binomial definida como número de clientes de dicha compañía de seguros que tiene ese tipo de accidentes al año” con probabilidad de éxito 𝒑 = 𝟎, 𝟎𝟎𝟏. Cómo 𝒏 = 𝟏𝟎𝟎𝟎𝟎 > 𝟏𝟎𝟎 y 𝒏𝒑 = (𝟏𝟎𝟎𝟎𝟎)(𝟎, 𝟎𝟎𝟏) = 𝟏𝟎 ≤ 𝟏𝟎 emtonces la distribución de Poisson es adecuada 𝝀 = 𝒏𝒑 = (𝟏𝟎𝟎𝟎𝟎)(𝟎, 𝟎𝟎𝟏) = 𝟏𝟎 Aplicando la función de distribución de Poisson (fórmula) tenemos: Usando la tabla de distribución acumulada de Poisson: 𝑷(𝑿 ≤ 𝟓) = 𝟎, 𝟎𝟔𝟕𝟏 70 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad RELACIÓN DE PROBLEMAS N 8 1. Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán TEMA: VARIABLES ALEATORIAS DISCRETAS: APROXIMACIÓN DE BINOMIAL A POISSON En un proceso de manufactura, en el cual se producen piezas de vidrio, ocurren defectos o burbujas, ocasionando que la pieza sea indeseable para la venta. Se sabe que en promedio 1 de cada 1000 piezas tiene una o más burbujas. ¿Cuál es la probabilidad de que en una muestra aleatoria de 8000 piezas, menos de 3 de ellas tengan burbujas? 2. Las piezas de un proceso de fabricación pueden ser aceptables o defectuosas. Cuando el proceso está bajo control, el porcentaje de piezas defectuosas fabricadas es 3%. De la producción de cada hora se toma una muestra de 200 piezas al azar. 1. El ingeniero de calidad decide que si el número de defectuosas en la muestra es 8 o más, se detenga el proceso y se analice si está bajo control. ¿Cuál es la probabilidad de parar el proceso de manera injustificada? 2. Calcular la probabilidad de parar el proceso, cuando está fabricando con un porcentaje de defectuosas del 5%. 3. Calcular la probabilidad de no detener el proceso si está fabricando un 6% de piezas defectuosas. 4. Repetir el cálculo del apartado 3 para p (porcentaje de defectuosas) entre 1% y 10%. Dibujar las probabilidades en función de p. 71 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán MODELOS DE DISTRIBUCIÓN DE PROBABILIDADES DE VARIABLES ALEATORIAS CONTINUAS Los modelos de probabilidad describen el comportamiento probabilístico de una o más variables aleatorias. También se puede definir como una función de probabilidad utilizada para resolver cierto tipo de experimentos. Los modelos de probabilidad pueden ser discretos o continuos dependiendo de la(s) variable (s) aleatoria(s) involucradas. Las principales y más utilizadas son las siguientes: Distribuciones Aleatorias Continuas Univariantes La distribución normal multivariante es una de las distribuciones más importantes utilizadas en estádistica, la mayor parte de los métodos estadísticos univariantes indican que los datos se deben distribuir de forma normal; además su uso en procesos inferenciales: estimación mediante Intervalos de confianza y Contrastes de hipótesis. A continuación presentaremos su marco teórico como sus propiedades fundamentales, también de algunas de las distribuciones de variable aleatoria continuas relacionadas (Chi Cuadrado, t-student, F); que servirán como generalización en las distribuciones multivariantes (Normal multivariante, Wishart, 𝑡 2 de Hotelling) del cual trata el presente trabajo. UNIFORME BETA GAMMA EXPONENCIAL TIPO CONTINUO NORMAL LOG NORMAL 72 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIABLE ALEATORIA CONTINUA CON DISTRIBUCIÓN NORMAL La distribución normal es un ejemplo de las distribuciones continuas, y aparece en multitud de fenómenos sociales. Fue estudiada, entre otros, por el alemán, Karl Friedrich Gauss, matemático precoz, aprendió a leer y a utilizar la aritmética a los tres años, Gauss fue astrónomo, físico e inventor. En el año 1801 predijo la estimación de una medida usando el método de mínimos cuadrados, óptima cuando los errores en las mediciones siguen una curva que él llamó “de errores” más conocida como la gráfica de la distribución normal en forma de campana, también se denomina Campana de Gauss. (Alemania, 1777-1855) CARACTERÍSTICAS La distribución normal es la más importante de todas las distribuciones de probabilidad. Gran número de fenómenos reales se pueden modelizar con esta distribución. Esta distribución es la piedra angular en la aplicación de la Inferencia Estadística en el análisis de datos, puesto que las distribuciones de muchos estadísticos muestrales tienden a la distribución normal cuando el tamaño de la muestra crece. Además, la distribución normal proporciona una adecuada representación de las distribuciones de una gran cantidad de variables físicas. Algunos ejemplos son: - Datos meteorológicos como la temperatura, lluvias, etc. - Mediciones efectuadas en organismos vivos: altura, peso, etc. - Medidas físicas de productos manufacturados, etc. - Muchos fenómenos, tales como la resistencia de piezas, tienen una distribución normal. VARIABLE ALEATORIA CON DISTRIBUCIÓN NORMAL X Una variable aleatoria continua X, se dice que sigue una distribución normal si su función de densidad es FUNCIÓN DE DENSIDAD GRÁFICA DE LA FUNCIÓN DE DENSIDAD La gráfica de la función de densidad de la variable aleatoria continua X con distribución normal es Donde: PARÁMETROS 𝐸(𝑥) = 𝜇 𝑉𝑎𝑟(𝑥) = 𝜎 2 𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 NOTACIÓN: 𝑿 ~ 𝑵(𝜇; 𝜎2 ) La variable aleatoria continua X tiene distribución normal con media 𝜇 y varianza 𝜎 2 . FUNCIÓN DE DISTRIBUCIÓN (ACUMULADA) GRÁFICA DE UNA FUNCIÓN DE DISTRIBUCIÓN 73 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán PROPIEDADES Algunas de las propiedades de dicha función, son: De acuerdo a los parámetros 𝐸(𝑥) = 𝜇; 𝑉𝑎𝑟(𝑥) = 𝜎 2 , que asuma la distribución normal, tendrá diferentes posiciones y forma la gráfica de la función de densidad 𝑓𝑋 , a continuación mostramos algunos de ellos: a) b) 𝑋 ~ 𝑁(50; 102 ) 𝑋 ~ 𝑁(80; 102 ) c) 𝑋 ~ 𝑁(80; 52 ) Veamos otros casos, además la representación gráfica de las funciones de distribución. 74 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán CÁLCULO DE PROBABILIDADES PARA UNA VARIABLE ALEATORIA CON DISTRIBUCIÓN NORMAL Pero calcular probabilidades, tratándose de variables continuas se debe hacerlo en intervalos, es decir se debe utilizar la función de distribución 𝐹𝑋 , así tenemos: Ejemplos 1.38 La resistencia a la compresión de muestras de cemento puede ser modelada por una distribución normal con media de 6000 𝐾𝑔⁄𝑐𝑚2 y una desviación estándar de 100 𝐾𝑔⁄𝑐𝑚2 . ¿Cuál es la probabilidad de que la resistencia a la compresión de una muestra sea inferior a 6250 𝐾𝑔⁄𝑐𝑚2 ? Donde: 𝐸(𝑥) = 𝜇 = 6000 𝑉𝑎𝑟(𝑥) = 𝜎 2 = 1002 𝜎 = 100 La función de densidad 𝑓𝑋 está dada por: 𝑓(𝑥) = 1 100√2𝜋 𝑒 1 (𝑥−6000)2 − 2(100)2 Luego, la probabilidad de que la resistencia a la compresión de una muestra sea inferior a 6250 𝐾𝑔⁄𝑐𝑚2 está dado por: 6250 𝑷(𝑿 < 𝟔𝟐𝟓𝟎) = 𝑭(6250) = ∫ −∞ 1 100√2𝜋 𝑒 − 1 (𝑥−6000)2 2(100)2 𝑑𝑥 Calcular esta probabilidad, es resolver esta integral, la cual no se puede realizar por métodos de integración conocido, sino requiere uso de métodos numéricos complejos para encontrar la solución. En vez, de usar algún método numérico, vamos a transformar la variable aleatoria continua normal 𝑿 en una nueva variable aleatoria continua normal estándar 𝒁, mediante la siguiente transformación: 𝑋−𝜇 𝜎 De tal manera que, la nueva variable aleatoria normal estándar 𝒁, tiene una distribución normal con media cero y desviación estándar uno, es decir: 𝑍= 𝒁 ~ 𝑵(𝜇 = 0; 𝜎2 = 1) 75 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIABLE ALEATORIA Z CON DISTRIBUCIÓN NORMAL ESTÁNDAR Una variable aleatoria continúa normal Z, se dice que sigue una distribución normal estándar si su función de densidad es FUNCIÓN DE DENSIDAD GRÁFICA DE LA FUNCIÓN DE DENSIDAD Donde: PARÁMETROS 𝐸(𝑍) = 0 𝑉𝑎𝑟(𝑍) = 1 𝑉𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 FUNCIÓN DE DISTRIBUCIÓN NORMAL ESTANDARIZADA Es decir, las funciones de densidad para las variables aleatorias 𝑿 e 𝒁, se pueden ver en la siguiente gráfica: Así, para el cálculo de probabilidades para la valores de la variable 𝑿, es decir, 𝑃(𝑋 < 𝑥), se puede calcular usando el valor correspondiente de la variable 𝒁, es decir, 𝑃(𝑍 < 𝑧). 𝑃(𝑋 < 𝑥) = 𝑃 (𝑍 < 𝑥−𝜇 ) = 𝑃(𝑍 < 𝑧) 𝜎 76 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Gráficamente, se puede observar USO DE LA TABLA DE LA DISTRIBUCION NORMAL ESTANDARIZADA PARA EL CÁLCULO DE PROBABILIDADES Para el cálculo de probabilidades de una variable normal estandarizada Z, se tiene que utilizar una tabla de probabilidades, como se muestra a continuación, en la cual se establece la relación siguiente: 𝒛 𝑷(𝒁 < 𝒛) = 𝑷(𝒁 ≤ 𝒛) = 𝑭(𝒛) = ∫ 𝟏 −∞ √𝟐𝝅 𝒘𝟐 𝒆− 𝟐 𝒅𝒘 EJEMPLO: Calcular la siguiente probabilidad: 𝑃(𝑍 < 1.25) SOLUCIÓN: Según la tabla mostramos: 𝑃(𝑍 < 1.25) = 𝑃(𝑍 ≤ 1.25) = 0.8044 RESPUESTA: La probabilidad de 𝑃(𝑍 < 1.25) = 0.8044 77 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán ALGUNAS PROBABILIDADES IMPORTANTES DE UNA DISTRIBUCIÓN NORMAL Es posible calcular algunos resultados importantes para el uso de la distribución normal, por ejemplo vamos a calcular las siguientes probabilidades: 𝑃(−1 < 𝑍 < 1) = 0.6827 (68.27%) 𝑃(−2 < 𝑍 < 2) = 0.9545 (95.45%) 𝑃(−3 < 𝑍 < 3) = 0.9973 (95.73%) Es decir, para cualquier distribución Normal N , se cumple que: 1) 68,3% de las observaciones se encontrarán a una desviación estándar de la media, es decir dentro del intervalo: (𝜇 − 𝜎; 𝜇 + 𝜎). 2) 95,5% de las observaciones se encontrarán a dos desviaciones estándar de la media, es decir dentro del intervalo: (𝜇 − 2𝜎; 𝜇 + 2𝜎). 3) 99,7% de las observaciones se encontrarán a tres desviaciones estándar de la media, es decir dentro del intervalo: (𝜇 − 3𝜎; 𝜇 + 3𝜎). RELACIÓN PARA EL CÁLCULO DE PROBABILIDADES DE UNA DISTRIBUCIÓN NORMAL A continuación presentaremos algunos de los casos más frecuentes de relación para el cálculo de probabilidades, utilizando las propiedades de la distribución normal estándar Z. 78 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán EJERCICIOS DE CÁLCULO DE PROBABILIDADES USO DE LA TABLA DE PROBABILIDADES NORMAL ESTÁNDAR ACUMULADA 𝑷[𝒁 ≤ 𝒛] Ejemplos 1.39 Considere una variable aleatoria normal estándar Z con media 𝜇 = 0 y desviación estándar (típica) 𝜎 = 1. Por ejemplo, vamos a calcular para los valores de Z mayores que 2.33, es decir: 𝑷[𝒁 > 𝟐. 𝟑𝟑] 𝑷[𝒁 > 𝟐. 𝟑𝟑] = 𝟏 − 𝑷[𝒁 ≤ 𝟐. 𝟑𝟑] = 𝟏 − 𝟎. 𝟗𝟗𝟎𝟏 = 𝟎. 𝟎𝟎𝟗𝟗 Ejemplos 1.40 En una distribución normal con media 𝝁 = 𝟏𝟖 y desviación estándar (típica) 𝝈 = 𝟒, es decir 𝑵(𝟏𝟖; 𝟒) vamos a calcular la siguiente probabilidad: 𝑷[𝑿 < 𝟏𝟗] Como X tiene una distribución Normal, para poder calcular la probabilidad solicitada se tiene que estandarizar la variable, mediante el cambio a la variable Z (normal estándar) con la siguiente fórmula: 𝑍= Así tenemos, 𝑃[𝑋 < 19] = 𝑃 [𝑍 < 𝑋−𝜇 𝜎 19−18 ] 4 = 𝑃[𝑍 < 0.25] = 0.5987 79 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplos 1.41 En la distribución normal estandarizada, hallar el valor de 𝒛𝟎 , en cada caso por ejemplo, 𝑷[𝒁 < 𝒛𝟎 ] = 𝟎. 𝟔𝟎 Se puede observar en la siguiente gráfica Utilizamos la tabla de distribución normal estandarizada acumulada, para ubicar la probabilidad dada sino está se utiliza el valor más cercano a él. El valor más próximo de la probabilidad 0.60 según la tabla es 0.5987, el cual corresponde al valor de 0.25. Luego, el valor de 𝑧0 = 0.25. PROBLEMAS DE APLICACIÓN Ejemplos 1.42 Para los deudores con buenas calificaciones de crédito, la deuda media de las cuentas revolventes y a plazos es de $15 015. Suponga que la desviación estándar es de $3 540 y que los montos de la deuda se distribuyen de manera normal. ¿Cuál es la probabilidad de que la deuda para un deudor con un buen crédito sea mayor de $18 000? SOLUCIÓN Datos: X: Deuda de las cuentas revolventes y a plazos para los deudores con buenas calificaciones 𝝁 = 𝟏𝟓 𝟎𝟏𝟓 Deuda media de las cuentas revolventes y a plazos 𝝈 = 𝟑 𝟓𝟒𝟎 Desviación estándar de las deudas de las cuentas revolventes y a plazos a. La probabilidad de que la deuda para un deudor con un buen crédito sea mayor de $18 000? Su formalización es: 𝑷(𝑿 > 𝟏𝟖 𝟎𝟎𝟎) y su gráfica correspondiente: Para calcular la probabilidad, es necesario si vamos a utilizar una tabla de probabilidades expresarlo usando su complemento, es decir, 𝑷(𝑿 > 𝟏𝟖 𝟎𝟎𝟎) = 𝟏 − 𝑷(𝑿 ≤ 𝟏𝟖 𝟎𝟎𝟎) 80 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Luego, es necesario transformar la variable X a una variable Z, mediante la fórmula: Así tenemos, 𝑷(𝑿 > 𝟏𝟖 𝟎𝟎𝟎) = 𝟏 − 𝑷 𝒁 ≤ 𝟏𝟖 𝟎𝟎𝟎 − 𝟏𝟓 𝟎𝟏𝟓 𝟑 𝟓𝟒𝟎 = 𝟏 − 𝑷(𝒁 ≤ 𝟎. 𝟖𝟒) Para su cálculo utilizamos la tabla de probabilidades acumulada, ubicamos el valor de 𝒛 = 𝟎. 𝟖𝟒 Por lo tanto, 𝑷(𝑿 > 𝟏𝟖 𝟎𝟎𝟎) = 𝟏 − 𝑷(𝒁 ≤ 𝟎. 𝟖𝟒) = 𝟏 − 𝟎, 𝟕𝟗𝟗𝟓 = 𝟏 − 𝟎, 𝟕𝟗𝟗𝟓 = 𝟎, 𝟐𝟎𝟎𝟓 RESPUESTA: La probabilidad de que la deuda para un deudor con un buen crédito sea mayor de $18 000? es de 0.2005 (20.05%). Ejemplos 1.43 La resistencia a la compresión de muestras de cemento puede ser modelada por una distribución normal con media de 6000 𝐾𝑔⁄𝑐𝑚2 y una desviación estándar de 100 𝐾𝑔⁄𝑐𝑚2 . a) ¿Cuál es la probabilidad de que la resistencia a la compresión de una muestra sea inferior a 6250 𝐾𝑔⁄𝑐𝑚2 ? b) ¿Cuál es la probabilidad de que la resistencia a la compresión de una muestra sea superior a 5800 𝐾𝑔⁄𝑐𝑚2 ? c) ¿Cuál es la probabilidad de que la resistencia a la compresión de una muestra este comprendida entre 5850 𝑦 6220 𝐾𝑔⁄𝑐𝑚2 ? d) ¿Cuál es la resistencia mínima, para valores iguales o superiores que tengan una probabilidad de ocurrencia del 25%? Donde: 𝐸 (𝑥 ) = 𝜇 = 6000 𝑉𝑎𝑟(𝑥 ) = 𝜎 2 = 1002 𝜎 = 100 81 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad a) Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán La probabilidad de que la resistencia a la compresión de una muestra sea inferior a 6250 𝐾𝑔⁄𝑐𝑚2 , esta dada por: 𝑷(𝑿 < 𝟔𝟐𝟓𝟎) = 𝑷 𝒁 < 6250 − 6000 = 𝑃 (𝑍 < 2.5) = 0.99379 100 Respuesta La probabilidad de que la resistencia a la compresión de una muestra sea inferior a 6250 𝐾𝑔⁄𝑐𝑚2 , es de 0.99379 (99.379%). b) La probabilidad de que la resistencia a la compresión de una muestra sea superior a 5800 𝐾𝑔⁄𝑐𝑚2 , esta dada por: 𝑷(𝑿 > 𝟓𝟖𝟎𝟎) Para el cálculo, transformamos la variable X a la variable Z, es decir 𝑷(𝑿 > 𝟓𝟖𝟎𝟎) = 𝑷 𝒁 > 5800 − 6000 = 𝑷(𝒁 > −𝟐) = 𝑷(𝒁 < 𝟐) = 𝟎. 𝟗𝟕𝟕𝟐𝟓 100 El resultado lo podemos obtener utilizando la tabla de probabilidades de la distribución normal estándar Z 82 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán c) La probabilidad de que la resistencia a la compresión de una muestra este comprendida entre 5850 𝑦 6220 𝐾𝑔⁄𝑐𝑚2 , esta dada por: 𝑷(𝟓𝟖𝟓𝟎 < 𝑿 > 𝟔𝟐𝟐𝟎) = 𝑷 5800 − 6000 6220 − 6000 <𝒁< 100 100 = 𝑷(−𝟐 < 𝒁 < 𝟐. 𝟐) = 𝑷(𝟎 < 𝒁 < 𝟐) + 𝑷(𝟎 < 𝒁 < 𝟐. 𝟐) = 𝟎. 𝟒𝟕𝟕𝟐𝟓 + 𝟎. 𝟒𝟖𝟔𝟏𝟎 = 𝟎. 𝟗𝟓𝟖𝟐𝟓 El resultado lo podemos obtener utilizando la tabla de probabilidades de la distribución normal estándar Z d) La resistencia mínima, para valores iguales o superiores que tengan una probabilidad de ocurrencia del 25% En la distribución normal, hallar el valor de 𝒂, tal que: 𝑷[𝑿 > 𝒂] = 𝟎. 𝟐𝟓 En la distribución normal estandarizada, hallar el valor de 𝒛𝟎 , que tenga la misma probabilidad, es decir 𝑷[𝒁 > 𝒛𝟎 ] = 𝟎. 𝟐𝟓 Se puede observar en las siguientes gráficas Utilizamos la tabla de distribución normal estandarizada acumulada, para ubicar la probabilidad dada sino está se utiliza el valor más cercano a él. 83 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 0,67 𝑎 0,68 Realizando interpolación sea 𝑷[𝒁 > 𝒛𝟎 ] = 𝟎. 𝟐𝟓 entonces 𝑧0 − 0.67 0.68 − 0.67 = 0,25143 − 0,25 0,25143 − 0.24825 𝑧0 = 0.67 + 0,25143 0,25 0,24825 (0,68 − 0.67)(0,25143 − 0,25) 0,25143 − 0.24825 𝑧0 = 0,674 Con el valor de 𝑧0 = 0,674, Se puede encontrar el valor de la resistencia mínima, mediante la transformación: 𝑋−𝜇 𝜎 𝑍= Reemplazando tenemos: 0,674 = 𝑎 − 6000 100 Donde, 𝑎 = 6000 + (0,674 × 100) = 6067.4 Respuesta La resistencia mínima a la compresión, para valores iguales o superiores del 25% de muestras es de 𝑎 = 6067.4 𝐾𝑔⁄𝑐𝑚2 , 84 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad RELACION DE PROBLEMAS N 9 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán TEMA: VARIABLES ALEATORIAS CON DISTRIBUCIÓN NORMAL 1. Calcular “k” si: 𝑎) 𝑃(𝑍 ≤ 𝑘) = 0.8078 𝑏) 𝑃(𝑍 ≥ 𝑘) = 0.0028 c) Calcular 𝑘 si 𝑃(𝑍 ≤ 𝑘) = 0.6141 y X sigue una distribución normal, es, decir 0.835 9.99 𝑋~𝑁(15; 4). 2. De una variable normal 𝑋~𝑁(𝜇; 𝜎) se sabe que 𝑃(𝑋 ≤ 7) = 0.9772 y 𝑃(𝑋 ≤ 6.5) = 0.8413. Calcular: a) 𝜇; 𝜎 b) 𝑃(5.65 ≤ 𝑋 ≤ 6.25) c) El número 𝑘 tal que 𝑃(𝑋 > 𝑘) = 0.3 3. La duración en días de ciertos componentes mecánicos de una planta industrial sigue un modelo 𝑋~𝑁(250; 55). Obtenga a) Probabilidad de que no duren más de 200 días b) Probabilidad de que a lo sumo dure 200 días c) Probabilidad de que superen los 500 días de duración d) Proporción de componentes que duran entre 250 ± 110 4. Una fábrica de tornillos produce un tipo de tornillo con un diámetro promedio de 6.5 mm. Y una desviación estándar de 1.5 mm. Suponiendo que la distribución es normal, calcule la probabilidad de encontrar tornillos con diámetro a) Mayor que 7 mm. b) Entre 6 y 7 mm. 5. Suponga que en una determinada empresa se analiza el tiempo que lleva a los trabajadores la instalación de una determinada pieza del producto que fabrica, concluyendo que se distribuye como una normal con una media de 30 minutos y una desviación estándar de 5 minutos. Con estos datos conteste preguntas como: a) ¿Cuál es la probabilidad de que un trabajador aleatoriamente seleccionado pueda montar la pieza en menos de 30 minutos? 0.50 b) ¿Cuántos minutos tienen que pasar antes de que el 10 por ciento de los trabajadores monten la pieza? 23,6 minutos. 6. La tolerancia especificada para aceptar los ejes producidos por una fábrica es que el diámetro sea 0.45±0.005 cm. Si los ejes producidos por la fábrica tienen distribución normal con media 0.452 y desviación estándar 0,003 cm, determine cuántos ejes serán rechazados de cada lote de 500 ejes producidos? 7. La resistencia a la tensión de cierto componente de metal se distribuye normalmente con una media de 10,000 kilogramos por centímetro cuadrado y una desviación estándar de 100 kilogramos por centímetro cuadrado. Las mediciones se redondean a los 50 kilogramos por centímetro cuadrado más cercanos. a) ¿Qué proporción de estos componentes excede a 10,150 kilogramos por centímetro cuadrado de resistencia a la tensión? b) Si las especificaciones requieren que todos los componentes tengan una resistencia a la tensión de entre 9800 y 10,200 kilogramos por centímetro cuadrado, ¿qué proporción de piezas esperaría que se descartara? 8. La dureza Rockwell de un metal se determina hincando una punta endurecida en la superficie del metal y luego midiendo la profundidad de penetración de la punta. Suponga que la dureza Rockwell de una aleación particular está normalmente distribuida con media de 70 y desviación estándar de 3. (La dureza Rockwell se mide en una escala continua.) a. Una probeta es aceptable sólo si su dureza oscila entre 67 y 75, ¿cuál es la probabilidad de que una probeta seleccionada al azar tenga una dureza aceptable? b. Si el rango de dureza aceptable es (70 c, 70 c), ¿con qué valor de c tendría 95% de todas las probetas una dureza aceptable? 85 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán c. Si el rango de dureza aceptable es como el del inciso a) y la dureza de cada una de diez probetas seleccionadas al azar se determina de forma independiente, ¿cuál es el valor esperado de probetas aceptables entre las diez? d. ¿Cuál es la probabilidad de que cuando mucho ocho de diez probetas independientemente seleccionadas tengan una dureza de menos de 73.84? [Sugerencia: Y el nú- mero de entre las diez probetas con dureza de menos de 73.84 es una variable binomial; ¿cuál es p?] 9. Un abogado viaja todos los días de su casa en los suburbios a su oficina en el centro de la ciudad. El tiempo promedio para un viaje sólo de ida es de 24 minutos, con una desviación estándar de 3.8 minutos. Si se supone que la distribución de los tiempos de viaje está distribuida normalmente. a) ¿Cuál es la probabilidad de que un viaje tome al menos 1/2 hora? b) Si la oficina abre a las 9:00 a.m. y él sale diario de su casa a las 8:45 a.m., ¿qué porcentaje de las veces llegará tarde al trabajo? 10. Una compañía telefónica ha determinado que el tiempo total de duración de las llamadas realizadas mensualmente por sus clientes menores de 35 años, medidos en minutos, sigue una distribución normal de media 100 y desviación típica 25. (a) Calcula la probabilidad de que un cliente facture menos de 2 horas en llamadas. 0.7881 (b) ¿Cuál es la probabilidad de que un cliente facture entre 80 y 110 minutos? 0.4435 (c) La empresa decide iniciar una campaña para premiar a aquellos clientes que acumulen en llamadas más del doble de los minutos esperados. ¿Qué porcentaje de los usuarios se beneficiaran en dicha campaña? 0.00317% (d) Para los clientes que facturan poco, se piensa en incentivarlos por medio de un sistema de retribuciones en especie. Si se quiere incluir en ese programa al 1% de los clientes, ¿cuál es la duración total en minutos que debe acumular como máximo un cliente para ser incluido en la promoción? 41.835 minutos 11. El tiempo de reparación de unas máquinas de escribir tiene una distribución aproximadamente exponencial, con media de 22 minutos. a) Hallar la probabilidad de que el tiempo de reparación sea menor que diez minutos. b) Si el costo de reparación es de 2000 pts. por cada media hora o fracción. ¿Cuál es la probabilidad de que una reparación cueste 4000 pts.? c) Para efectuar una programación, cuánto tiempo se debe asignar a cada reparación para que la probabilidad de que cualquier tiempo de reparación mayor que el tiempo asignado sea sólo de 0.1? 12. Una compañía paga a sus empleados un salario promedio de $ 9,25 por hora, con una desviación estándar de 60 centavos. Si los salarios están distribuidos aproximadamente en forma normal y los montos se cierran a centavos. a) ¿Qué porcentaje de los trabajadores reciben salarios entre $ 8,75 y $ 9,69 por hora inclusive? 56,99% b) ¿El 5 % más alto de los salarios por hora de empleados es mayor a qué cantidad? $10,23 13. Una agencia de renta de autos, la cantidad de reclamaciones mensuales por mal servicio es una variable aleatoria distribuida normalmente con parámetros 𝝁 = 𝟒𝟓, 𝟖 y 𝝈 = 𝟑, 𝟕𝟓. Calcular la probabilidad de que en un mes cualquiera haya: a) Más de 50 reclamaciones 0,1056 b) Entre 40 y 50 reclamaciones, inclusive 0,8151 14. Suponga que el tiempo que tarda cierta cajera de un banco en atender a cualquier cliente (desde el instante en que éste llega a la ventanilla hasta el momento en que se retira de ella) tiene una distribución normal con una media de 3,7 minutos y una desviación estándar de 1,4 minutos. Encuentre la probabilidad de que un cliente elegido al azar: a) b) Haya esperado menos de dos minutos en la ventanilla. Haya esperado más de seis minutos en la ventanilla. 86 0,1131 0,0505 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 15. Los obreros que trabajan en la planta filial de la empresa automotriz alemán Wolkswagen, ganan en promedio $1,86 la hora, con una desviación estándar de $0,25. Si se supone una distribución normal, calcule el salario a partir del cual están 10% de los obreros que más ganan $2,18 la hora 16. El tiempo que se requiere para reparar un cierto tipo de avería mecánica en un automóvil tiene una distribución tipo normal con 𝝁 = 𝟒𝟓 minutos y 𝝈 = 𝟖 minutos. El gerente tiene planificado que se inicien las reparaciones a los 10 minutos de recibir el vehículo y que el propietario pueda retirar su automóvil reparado en una hora. a) ¿Cuál es la probabilidad de que el gerente se equivoque? 0,2650 b) ¿Cuál debería ser el tiempo medio de reparación se lleve a cabo dentro de ese tiempo? 50,396 minutos 17. El tiempo que una persona sana invierte en recorrer 10 km está normalmente distribuido con una media de 60 minutos y una desviación típica de 9 minutos. a) Calcula la probabilidad de que una persona sana invierta menos de 50 minutos. b) Calcula la probabilidad de que una persona sana invierta menos de 55 minutos o más de 65 minutos. c) En una fiesta de animación al deporte participan 500 personas sanas. Calcula cuántas de ellas invertirán en hacer el recorrido entre 50 y 60 minutos. 18. El número de libros prestados semanalmente en la biblioteca de un centro escolar sigue una distribución normal de media 25 y desviación típica 1,5. Calcula la probabilidad de que en una semana se presten entre 25 y 30 libros. 19. En un estudio realizado por una empresa hotelera, la distribución del tiempo de estancia del viajero en el hotel fue normal, con una media de 3,7 días y una desviación típica de 1,1 días. a) ¿Qué probabilidad habrá de que un viajero permanezca en el hotel entre 2 y 5 días? b) De 500 viajeros, ¿cuántos habrán permanecido entre 4 y 7 días? 20. La edad de una población se ajusta a una normal de media 27 años y una desviación estándar de 1,8 años. Si se toman aleatoriamente 230 personas, ¿cuántas estarán comprendidas entre los 25 y los 30 años? 21. El estudio de un cuestionario sobre el grado de satisfacción de los usuarios de servicios públicos revela que la satisfacción sigue una distribución normal, con una nota media de 5,7 puntos y con una desviación típica de 0,5 puntos. a) Calcula la probabilidad de que la calificación de un usuario esté entre 6 y 7 puntos. b) De 1 000 usuarios, ¿cuántos habrán otorgado una nota entre 4 y 6 puntos? 22. El tiempo T requerido para completar una solicitud de asistencia económica tiene una distribución normal de media 45 minutos y desviación estándar de 5 minutos. Encuentra la probabilidad de que una persona rellene la instancia: a) en menos de 40 minutos. b) en 35 a 55 minutos. 23. Un ejecutivo de televisión está estudiando propuestas para nuevas series. A su juicio, la probabilidad de que una serie tenga audiencia mayor que 17,35 es 0,25; además la probabilidad de que la serie tenga audiencia mayor que 19,2 es 0,15. Si la incertidumbre de este ejecutivo puede representarse mediante una v.a. normal, ¿cuál es la media y la desviación típica de esta distribución? 𝝁 = 𝟏𝟒 y 𝝈 = 𝟓 24. Supongamos que el número de horas que un auxiliar administrativo necesita para aprender el nuevo programa de facturación es una variable aleatoria. X con distribución normal. Si el 84.13% de los auxiliares emplean más de tres horas y sólo el 22.96% más de nueve, ¿cuánto valen 𝝁𝑿 (media) y 𝝈𝟐𝑿 (varianza)? 𝝁𝑿 = 𝟔, 𝟒𝟒𝟖𝟑 y y 𝝈𝟐𝑿 = 𝟏𝟏, 𝟖𝟗𝟎𝟔 25. La compra media que realiza un cliente en un determinado comercio, es de 82 euros, siendo la desviación estándar 5 euros. Todos los clientes que compran entre 88 y 94 euros son clientes clasificados como preferentes. Si las compras 87 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán están distribuidas aproximadamente como una normal y 8 clientes son preferentes, ¿cuántos clientes tiene este comercio? Sol.: 75 26. Las ausencias por enfermedad de los empleados de una empresa en un mes tienen una distribución aproximadamente N(200horas, 20 horas). (a) Calcule la probabilidad de que el próximo mes el ausentismo total por enfermedad sea menor que 150 horas. 0,0062 (b) Para planear el programa del mes próximo ¿Cuánto tiempo debe suponer darse al ausentismo por enfermedad, si aquella cantidad sólo se debe superar con una probabilidad de tan sólo 10%? 225,8 27. El costo de un producto terminado se considera una variable aleatoria con distribución normal, con media igual a $1000 y dispersión igual a $ 100. a) Si se extrae al azar un producto terminado ¿cuál es la probabilidad de que su costo sea inferior a $ 1200? 0,97725 b) Si se toma una muestra de 10 productos terminados, calcular la probabilidad de que: i) menos de 8 de ellos tengan un costo inferior a $ 1200. 0,0008 ii) por lo menos 7 tengan un costo inferior a $1200. 1 iii) Hallar la cantidad esperada de productos terminados con un costo inferior a $ 1200. 9,7725 28. Una empresa dedicada a la fabricación de vestidos de señora los fabrica con longitudes comprendidas entre 110 y 170 cm y con tallas que se diferencian entre sí en 10 cm y una talla extra de 200 cm. La empresa sabe que las alturas de las mujeres potenciales clientes medidas desde el hombro hasta los pies se distribuyen normalmente con media 135 y con desviación típica 15 y que la clienta cuya altura no coincide exactamente con una de las tallas se comprará la inmediatamente mayor. Si la empresa proyecta fabricar para la próxima temporada 50.000 vestidos ¿cuántas debería razonablemente hacer de cada una de las siete tallas previstas? 29. En un quiosco se supone que el número de ventas diarias de periódicos sigue una distribución Normal con media 30 y desviación típica 2. Determinar: a) Probabilidad de que en un día se vendan entre 25 y 35 periódicos. 0,988 b) Determinar el número de periódicos vendidos que no será superado en el 90% de las ocasiones 31,632 c) Supongamos que en una ciudad hay 10 quioscos independientes del mismo tipo y con las mismas características. Determinar la probabilidad de que en al menos nueve quioscos vendan entre 25 y 35 periódicos. 0,993 d) Cuantos quioscos cabe esperar que tendremos que inspeccionar para encontrarnos con el primero que venda más de 35 periódicos 166,666 30. La división de cuentas por cobrar de los pacientes del Hospital General ha recopilado datos sobre la antigüedad de las cuentas por cobrar. Los datos recolectados indican que la antigüedad de las cuentas sigue una distribución normal con media = 28 días y desviación estándar = 8 días. a. Qué porción de las cuentas tienen entre 10 y 40 días de antigüedad; es decir, P(10 ≤ x ≤ 40)? b. El administrador del hospital está interesado en enviar cartas de recordatorio a los clientes más atrasados (el 10% más antiguo). ¿Cuántos días de antigüedad debe tener una cuenta antes de que se envíe una carta recordatorio? c. El administrador del hospital desea dar un descuento a aquellas cuentas que paguen su saldo para el 21o. Día. ¿Qué porcentaje de las cuentas recibirá el descuento? 31. El Webster National Bank está revisando sus políticas de cargos por servicios y pago de intereses en cuentas de cheques. El saldo diario promedio en cuentas de cheques personales es $550, con una desviación estándar de $150. Además, los saldos diarios promedio están distribuidos en forma normal. a. Qué porcentaje de los clientes de cuentas de cheques personales tiene saldos diarios promedio mayores de $800? 4.78% b. Qué porcentaje tiene saldos diarios promedio menores que $200? 79,36% c. Qué porcentaje tiene saldos diarios promedio entre $300 y $700? 0,8413 88 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán d. El banco está considerando pagar intereses a los clientes que tengan saldos diarios promedio mayores de una cierta cantidad. Si el banco no desea pagar intereses a más de 5% de sus clientes, ¿cuál es el saldo diario promedio mínimo al que debería estar dispuesto a pagar intereses? 32. Un auditor encontró que los errores en las cuentas de crédito de una empresa que realiza ventas por correo, tienen una distribución normal con media $ 0 y desviación estándar $ 1. Suponga que se elige una cuenta de crédito al azar de los registros de la empresa. Encuentre la probabilidad de que tenga un error: a) entre $ 0 y $ 1,50 ; b) entre $ -2,00 y $ 0 c) al menos de $ 1,75; d) a favor del cliente; e) entre $ -1,50 y $ 1,25 ; f) entre $ -2,00 y $ -1,00. 33. En número de días entre la facturación y el pago de las cuentas corrientes de crédito en una tienda de departamentos grande, tiene una distribución aproximadamente normal con una media de 18 días y una desviación estándar de 4 días. ¿Qué proporción de las facturas será pagada: a) entre 12 y 18 días ? b) entre 20 y 23 días?; c) En 12 o más días ?; d) en menos de 8 días ? ; y e) dentro de cuantos días estará pagado el 99,5 % de la facturas ?. 34. Un abogado viaja todos los días de su casa en los suburbios a su oficina en el centro de la ciudad. El tiempo promedio para un viaje solo de ida es de 24 minutos, con una desviación estándar de 3.8 minutos. Si se supone que la distribución de los tiempos de viaje está distribuida normalmente. a) .Cual es la probabilidad de que un viaje tome al menos 1/2 hora? b) Si la oficina abre a las 9:00 a.m. y el sale diario de su casa a las 8:45 a.m., .qué porcentaje de las veces llegara tarde al trabajo? c) Si sale de su casa a las 8:35 a.m. y el café se sirve en la oficina de 8:50 a.m. a 9:00 a.m., .cual es la probabilidad de que se pierda el café? d) Calcule la duración mayor en la que se encuentra el 15% de los viajes más lentos. e) Calcule la probabilidad de que 2 de los siguientes 3 viajes tomen al menos 1/2 hora. 35. La cantidad real de café instantáneo que vierte una máquina en jarras de 4 onzas varía de una jarra a otra, y se puede fijar como una variable aleatoria que tiene una distribución normal con 𝜎 = 0,04 onzas. Si sólo el 2% de las jarras va a contener menos de 4 onzas de café. ¿Cuál debe ser el contenido medio de estas jarras? Sol: = 4,082 onzas. 36. Los gastos mensuales en alimentación para familias de cuatro miembros en una ciudad grande son en promedio de $420 con una desviación estándar de $80. Si los gastos mensuales en alimentación siguen una distribución normal: a) ¿Qué porcentaje de estos gastos es menor de $350? Sol:18,94% b) ¿Qué porcentaje de estos gastos está entre $250 y $300? Sol: 5,02% c) ¿Qué porcentaje de estos gastos es menor de $250 o mayor de $450? Sol: 36,86% d) ¿Cuál es el gasto mayor en dólares que hace una familia que está entre el 25% de la familia que menos gastos realizan en alimentación? Sol: 366,4 dólares 89 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 37. Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Los salarios de los trabajadores en cierta industria son en promedio $11,9 por hora y la desviación estándar de $0,4. Si los salarios tienen una distribución normal. ¿Cuál es la probabilidad de que un trabajador seleccionado al azar: a) Reciba salarios entre $10,9 y $11,9? Sol: 0,4938 b) Reciba salarios inferiores a $11? Sol: 0,0122 c) Reciba salarios superiores a $12,95? Sol: 0,0043 d) ¿Cuál debe ser el salario menor que gana un trabajador que se encuentra entre el 10% de los trabajadores que más ganan? Sol: $12,412 e) Si el dueño de la industria va a aumentarle el salario al 15% de los trabajadores que menos ganan. ¿Cuál será el salario máximo que deberá ganar un trabajador para ser beneficiado con el aumento? Sol: $11,484 38. El volumen de acciones negociadas en la Bolsa es normal con una media de 646 millones de acciones y una desviación de 100 millones de acciones. a) ¿Cuál es la probabilidad de que el volumen negociado sea menor de 400 millones? Sol: 0,0069 b) ¿Cuál es la probabilidad de que el volumen negociado de acciones oscile entre las 400 y las 600 acciones? Sol: 0,3159 c) Si la Bolsa quiere emitir un boletín de prensa sobre el 5% de los días más activos ¿Qué volumen publicará la prensa? Sol: 810,5 millones 39. Un panadero fabrica barras de pan cuyos pesos se distribuyen normalmente según una normal de media 250 gramos. El 5% de las barras pesa menos de 240 gramos. ¿Cuánto vales su desviación estándar? Solución 6,08 40. Una gran empresa debe reponer las batas de sus 1000 operarios. Se sabe que la talla media es de 170 cm, con una desviación estándar de 3 cm. Las batas se confeccionan en tres tallas válidas para estaturas entre 155 y 165 cm, 165 y 175 cm y, finalmente entre 175 y 185 cm. ¿Cuántas batas de cada talla ha de adquirir? Solución: Deberá adquirir 48 batas de talla pequeña, 905 de talla media y 48 de talla grande. 41. Suponga que la cantidad de dinero que gastan los estudiantes en libros en un año es una variable aleatoria con una distribución normal que tiene una media de $380,000 pesos y una desviación estándar de $50,000. a) ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste menos de $400.000 pesos en libros en un año? b) ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste más de $360.000 pesos en libros en un año? c) Explique gráficamente por qué la respuestas de los dos literales anteriores son iguales. d) ¿Cuál es la probabilidad de que un estudiante elegido aleatoriamente gaste entre $250.000 y $380.000 pesos en libros en un año? 42. a) b) c) Un estudiante viaja diariamente desde su hogar hasta la universidad. En promedio, el viaje le toma 24 minutos con una desviación estándar de 3.8 minutos. Suponga que la distribución del tiempo del viaje es normal ¿cuál es la probabilidad de que un viaje requiera de por lo menos media hora? Si la primera clase la tiene todos los días a las 6:00 pm y el estudiante siempre sale a las 5:45 pm de su casa, ¿qué porcentaje de veces llega tarde? ¿A qué hora máximo debe salir el estudiante de su casa si no quiere llegar a más del 15 % de las clases tarde? 43. La empresa informática DEPALE, S.A. lanza al mercado un nuevo producto cuya vida útil se estima en 4.6 años, en promedio, con una desviación típica de 1.6 años. La empresa decide realizar una promoción inicial con objeto de estimular las ventas. La promoción consiste en ofertar una garantía de sustitución del producto, sin coste adicional, si se detectase algún defecto durante el primer año de vida. Suponiendo que la duración de este producto sigue una distribución normal, determine la probabilidad de tener que reclamar su sustitución después de adquirirlo 44. Los salarios de los trabajadores de un país puede suponerse que siguen una distribución normal de media 2000 euros y desviación típica desconocida. a) Si la probabilidad de ganar más de 2100 euros es de 0.33, ¿cuál es la desviación típica? 90 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán b) Los salarios en euros de los trabajadores en un segundo país también puede suponerse que siguen una distribución normal con la misma media y con varianza de 40000 euros 2. ¿Es más fácil ganar más de 2100 euros en este segundo país que en el país del apartado anterior? 45. Una variable aleatoria X sigue una distribución normal de media 4 y varianza 9: a) Calcula p(3,4 X 4,6) b) Encuentra un valor a tal que p(4 6a X 4 6a) 0,75 46. El gerente de personal de una gran compañía requiere que los solicitantes a un puesto efectúen cierta prueba y alcancen una calificación de 500. Si las calificaciones de la prueba se distribuyen normalmente con media 485 y varianza 900, ¿qué porcentaje de los solicitantes pasará la prueba? 30,85% 47. Las ventas de una determinada revista en un kiosko tienen de media 190 y una desviación típica de 25. ¿Cuántos ejemplares de la revista deben encargar para atender al 80 % de los clientes? 211,25 rev 48. El personal de la compañía Onda S.L. usa una terminal para realizar sus pedidos internacionales. Si el tiempo que cada comercial gasta en una sesión en la terminal tiene una distribución exponencial con media 36 minutos, encontrar: a) la probabilidad de que un comercial utilice la terminal 30 minutos o menos. 0.565 b) ¿cuál es la probabilidad de que pase al menos una hora en la terminal? c) El 90% de las sesiones terminan en menos de T minutos, ¿cuánto vale T? 82.9 49. Los puntajes de una prueba de aptitud, de quinientos alumnos, están normalmente distribuidos con una media de 600 y una varianza de 10 000. a) ¿Qué proporción de los encuestados tiene un puntaje por debajo de 450? 0.06681 b) Una persona va a presentar la prueba. ¿Qué probabilidad tiene de obtener un puntaje de 750 o más? 0.06681 c) ¿Qué proporción de puntajes estará entre 450 y 700? 0.77453 d) ¿Cuántos alumnos obtuvieron un puntaje de 680? 1 e) Hallar la nota mínima y el número de alumnos que se encuentran ubicados en el quinto superior. 684 y 100 f) El 10% de alumnos que no logró aprobar dicha prueba de aptitud, deberá seguir un curso de capacitación. José, obtuvo un puntaje de 430, ¿deberá entrar en la capacitación? Sí 471 50. El cociente intelectual (CI) de los alumnos de una universidad se distribuye normalmente con media 115 y varianza 144. Se consideran brillantes y superdotados a aquellos alumnos cuyo CI es igual o superior a 139 y 145 respectivamente. Calcular la probabilidad de que un alumno: a) Sea brillante. 0.0165 b) Sea superdotado. 0.0062 c) No sea brillante ni superdotado. 0.9773 d) Si en la universidad estudian 10000 alumnos, ¿cuántos brillantes y cuántos superdotados hay entre ellos? 165 y 62 51. El tiempo de visita (o permanencia) de los visitantes al sitio Web se puede modelar como una distribución normal con media de 7 minutos y varianza 4. En periodo de controles o solemnes el promedio aumenta a 10 pero la desviación estándar se mantiene. a) ¿Cuál es la probabilidad de que el tiempo de visita sea al menos 6 minutos en periodo normal? 0.6915 b) ¿Cuál es la probabilidad de que la visita dure entre 4 y 8 minutos en periodo normal? 0.6247 c) ¿Qué porcentaje de la gente se queda menos de 5 minutos y más de 10 en periodo de controles? 0.2255 d) Si un visitante visita el sitio por 5 minutos en periodo normal y otro lo hace por 8 minutos en periodo de controles, ¿cuál se quedó mayor tiempo comparativamente? 91 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 52. La media de los sueldos de 600 trabajadores de una compañía es S/430 y la desviación estándar S/40. Suponiendo que los sueldos se distribuyen normalmente; ¿cuál es la probabilidad que un empleado elegido al azar tenga un sueldo: a) Como máximo 400. 0.22663 b) De 500 y más. 0.0401 c) No más de 420. 0.40129 d) Al menos 380. 0.89435 e) No menos de 370. 0.93319 f) Entre 350 y 450. 0.66871 g) ¿Cuántos trabajadores tienen sueldos entre 360 y 400? 112 53. En una empresa que tiene cuatrocientos cincuenta trabajadores, se realiza una serie de pruebas psicotécnicas para determinar el coeficiente de inteligencia de los trabajadores, quedando establecido que dicha medida se distribuye según una distribución normal de parámetros media 115 y varianza 144. a) Calcular la probabilidad de que un trabajador seleccionado al azar tenga un coeficiente intelectual de al menos 120. 0.3385 b) Hallar el número de trabajadores cuyo coeficiente intelectual está comprendido entre 95 y 105. 70 c) ¿Qué porcentaje de trabajadores supera el CI 98? 92.17% d) ¿Qué valor del coeficiente intelectual verifica que sólo el 10% de los trabajadores tienen un coeficiente superior? 130.4 e) Se decide repetir las pruebas a aquellos trabajadores con un coeficiente demasiado alto, que resultan ser un 8% del total, y a aquellos con coeficiente demasiado bajo, que representan un 5%. Calcular los valores del coeficiente de inteligencia a partir de los cuales se repetirán las pruebas. 131.9 y 95.26 54. Supongamos que la demanda semanal de un artículo sigue una distribución normal de media 100 y desviación típica 20. a) Calcular la probabilidad de que la demanda semanal del artículo tome valores entre 85 y 115. 0.5467 b) ¿Qué existencias deben de tener al principio de la semana para poder satisfacer la demanda con una probabilidad de 0.95? 132.90 55. La cotización en Bolsa de un cierto título se considera una variable aleatoria normalmente distribuida con parámetros desconocidos, pero se dispone de la siguiente información: - Existe un porcentaje del 2.5% de que la cotización supere el índice 400. - Hay un 50% de porcentaje de que no llegue a superarse el índice 380. Según los datos anteriores, ¿cuál es la probabilidad de que en cierto momento la cotización se encuentre entre 385 y 395? 0.2413 56. Las primas de riesgos mensuales (en $) de una compañía de seguros siguen una distribución normal. Se quiere determinar el porcentaje de recibos mensuales que caen dentro del intervalo de $125 a $175, ya que esas cantidades son difíciles de manejar. Para determinar el porcentaje de cuentas en este rango, se calcula el promedio y la desviación estándar de los recibos mensuales de las primas, obteniéndose 100$ y 38$, respectivamente. a) ¿Qué porcentaje de recibos mensuales puede esperarse que caiga dentro del rango de 125 a $175? 0.2302 b) Se predice que dentro de dos años el promedio mensual de la prima se elevará a $150. Suponiendo que la desviación estándar permanece igual, ¿en qué cambiaría este hecho la respuesta al punto a? 0.4908 57. La hora de entrada al trabajo en una oficina está fijada para las ocho en punto de la mañana. Un empleado llega al trabajo conforme a una distribución normal con media 8 y desviación típica 0.5, a causa del tráfico que se encuentra en el camino desde su casa. a) Calcular la probabilidad de que llegue tarde. 0.5 b) Si su jefe lo observa durante cinco días, ¿cuál será la probabilidad de que llegue tarde al menos tres de ellos? 0.5 c) Si su jefe llega conforme una normal con media 7.9 y desviación típica 0.25, ¿cuál será la probabilidad de que el empleado llegue después que el jefe? (se supone independiente la hora de llegada de ambos). 0.5714 92 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 58. Pablo ha investigado el tiempo de vida de las cuentas de ahorro comunes que se tiene en uno de los bancos miembros de la corporación en la que se desempeña, concluyendo que la vida media de las mismas es de 30 meses, con una varianza de 35.8. Sus estudios también advierten que es posible aceptar que el modelo de la distribución normal explica muy bien el tiempo de vida de las cuentas mencionadas. a) Si un depositante abre una cuenta de ahorro común en un banco miembro de la corporación de Pablo, ¿cuál es la probabilidad de que todavía haya dinero en la cuenta después de cuatro años? b) ¿Cuál es el tiempo de vida del 5% de las cuentas que se cierran más rápidamente? 59. Una empresa desea realizar un reajuste entre sus empleados, teniendo en cuenta los resultados obtenidos por ellos en un test de aptitud. Se considera que las puntuaciones siguen aproximadamente una distribución normal de media 10 y desviación típica 5, y que los empleados deben ejercer de inspectores, jefes de sección u operarios, según tengan mejor o peor puntuación (nota: serán inspectores los que obtengan mejor resultado). El ritmo de producción exige que el 75% sean operarios, el 20% jefes de sección y el 5% inspectores. Calcula la puntuación mínima que debe obtenerse para pasar a ser jefe de sección, y la puntuación mínima para ser inspector. 13.4 y 18.2 60. Una psicóloga se presentó a una vacante para un trabajo y obtuvo una calificación de 32 puntos. Más tarde el Jefe de personal de dicha compañía informó que sólo el 3% de los postulantes sería contratado. La calificación media para los postulantes fue de 17.8 con una varianza de 25. a) ¿Será contratada dicha psicóloga? ¿Por qué? b) Los currículums del 5% siguiente, serán guardados y ante una emergencia podrían ser llamados. ¿Cuál será el puntaje mínimo para tener opción de ser llamado? c) Si se sabe que han postulado 95 profesionales, ¿cuántos de éstos fueron contratados? 61. La distribución de la demanda (en número de unidades por unidad de tiempo) de un producto a menudo puede aproximarse con una distribución de probabilidad Normal. Por ejemplo, una compañía de comunicación por cable ha determinado que el número de interruptores terminales de botón solicitados diariamente tiene una distribución Normal, con una media de 200 y una desviación estándar de 50. a) ¿En qué porcentaje de los días la demanda será de menos de 90 interruptores? 1.39% b) ¿En qué porcentaje de los días la demanda estará entre 225 y 275 interruptores? 24.17% c) Con base en consideraciones de costos, la compañía ha determinado que su mejor estrategia consiste en producir una cantidad de interruptores suficiente para atender plenamente la demanda en 94% de todos los días. ¿Cuántos interruptores terminales deberá producir la compañía cada día? 278 62. Cierta empresa de construcción estima que el costo (en miles de euros) del acondicionamiento de un edificio se comporta de forma normal de media 13 y varianza 4. Independientemente de este costo, al estar acogida al Plan de Ayudas a la Empresa, reciben una subvención que está sometida a ciertas variaciones, y se comporta como una normal de media 2 y desviación típica 0.2. ¿Cuál es la probabilidad de que el costo neto del acondicionamiento del edificio sea, a lo sumo, de 12 mil euros? 0.6914 93 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL Y POISSON A LA DISTRIBUCIÓN NORMAL En los temas anteriores se ha calculado las probabilidades asociadas a experimentos binomiales 𝓑(𝒏; 𝒑) usando la función de probabilidad 𝒇(𝒙) o la función de distribución 𝑭(𝒙) o el uso de las tablas de probabilidades respectivas. Sin embargo, el uso de la fórmula función tiene sus inconvenientes por ser tedioso el cálculo para grande valores del tamaño de muestra 𝒏 , también cuando el valor de 𝒏 o la probabilidad de éxito 𝒑 no se encuentra en la tabla, entonces bajo estas circunstancias se puede obtener otros métodos para obtener buenas aproximaciones de las probabilidades. Ejemplos 1.44 Calcular la probabilidad 𝑃(𝑋 ≤ 20) de una distribución binomial 𝓑(𝒏 = 𝟑𝟎; 𝒑 = 𝟎, 𝟔𝟓) 20 𝐹(20) = 𝑃(𝑋 ≤ 20) = ∑ 𝑖=0 30 0.65𝑖 ∙ 0.3530−𝑖 𝑖 lo que obliga a calcular 211 números bastante grandes, que además no vienen en las tablas y el cálculo sería tedioso con la fórmula de la función de distribución 𝑭(𝒙). Bajo ciertas condiciones se puede aproximar utilizando la distribución de poissson (esta aproximación se realizó en anteriores temas) o la distribución normal. 94 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Aproximación de la distribución binomial a la distribución normal En una distribución binomial 𝓑(𝒏; 𝒑) las funciones de probabilidad 𝒇(𝒙) y la función de distribución 𝐹(𝑥) son: con lo que, si n es grande, el cálculo, especialmente de la función de distribución es muy engorroso. Por ejemplo, en una distribución B (200, 0´2) sería 80 𝐹(80) = 𝑃(𝑋 ≤ 80) = ∑ 𝑖=0 80 0.40𝑖 ∙ 0.6080−𝑖 𝑖 lo que obliga a calcular 81 números bastante grandes, que además no vienen en las tablas. Sin embargo, al aumentar n la representación gráfica de la función de probabilidad se va pareciendo cada vez más a una campana de Gauss, lo que sugiere que pueda haber alguna relación entre las distribuciones binomial y normal. En la práctica la aproximación del cálculo de probabilidades de una distribución binomial se puede hacerse para un rango de valores de 𝒑 (no únicamente cuando 𝑝 = 0,5) y para valores bastante pequeños de 𝒏, y 𝑛𝑝 > 5 y 𝑛(1 − 𝑝) > 5 En general la aproximación es mejor cuanto mayor sea 𝒏 > 𝟑𝟎 y más próximo esté 𝒑 = 𝟎, 𝟓 Es decir, Si 𝒏 > 𝟑𝟎 y 𝑛𝑝 > 5; 𝑛(1 − 𝑝) > 5, entonces la distribución binomial 𝓑(𝒏; 𝒑)pueden aproximarse por los de una normal 𝑵(𝝁; 𝝈) siendo 𝝁 = 𝒏𝒑 y 𝝈 = √𝒏𝒑𝒒 ; es decir, con las mismas media y desviación típica que la binomial. 𝓑(𝒏; 𝒑) ⟶ 𝑵(𝝁 = 𝒏𝒑; 𝝈 = √𝒏𝒑𝒒) 95 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Corrección de Yates para la continuidad Al efectuar esta aproximación surge el problema de que mientras la distribución binomial es discreta con lo que las probabilidades a calcular son puntuales, la normal es continua y sus probabilidades se calculan midiendo áreas con lo que en ella las probabilidades puntuales son nulas: 𝑎 𝑃(𝑋 = 𝑎) = ∫ 𝑓(𝑥)𝑑𝑥 = 0 𝑎 Para resolver este problema se utiliza la corrección de Yates que consiste en considerar los valores de la variable aleatoria discreta como marcas de clase de intervalos de amplitud 1, es decir [𝑎 − 0,5; 𝑎 + 0,5⟩. Entonces será: 𝑃(𝑋 = 𝑎) = 𝑃(𝑎 − 0,5 ≤ 𝑋 ≤ 𝑎 + 0,5) En los otros casos tenemos: 𝑃 (𝑋 < 𝑎 ) 𝑃 (𝑋 ≤ 𝑎 ) 𝑃 (𝑋 > 𝑎 ) 𝑃 (𝑋 ≥ 𝑎 ) 𝑃 (𝑎 ≤ 𝑋 ≤ 𝑏 ) 𝑃 (𝑎 < 𝑋 < 𝑏 ) 𝑃 (𝑎 < 𝑋 ≤ 𝑏 ) 𝑃 (𝑎 ≤ 𝑋 < 𝑏 ) 𝑃(𝑋 ≤ 𝑎 − 0,5) 𝑃(𝑋 ≤ 𝑎 + 0,5) 𝑃(𝑋 ≥ 𝑎 + 0,5) 𝑃(𝑋 ≥ 𝑎 − 0,5) 𝑃(𝑎 − 0,5 ≤ 𝑋 ≤ 𝑏 + 0,5) 𝑃(𝑎 + 0,5 ≤ 𝑋 ≤ 𝑏 − 0,5) 𝑃(𝑎 + 0,5 ≤ 𝑋 ≤ 𝑏 + 0,5) 𝑃(𝑎 + 0,5 ≤ 𝑋 ≤ 𝑏 − 0,5) Ejemplos 1.45 En el experimento aleatorio consistente en lanzar 12 monedas consideramos la variable aleatoria X = número de caras obtenidas. Vamos a calcular la probabilidad de que aparezcan entre 5 y 8 caras (ambos inclusive) utilizando directamente la distribución binomial y su aproximación mediante la normal para ver que la aproximación es realmente buena. Binomial 𝓑(𝟏𝟐; 𝟎, 𝟓) 8 𝑃(5 ≤ 𝑋 ≤ 8) = ∑ 𝑖=5 Normal 𝑵(𝝁; 𝝈) 12 0.50𝑖 ∙ 0.512−𝑖 = 0,7322 𝑖 𝜇 = 𝑛𝑝 = (12)(0.5) = 6 y 𝜎 = √𝑛𝑝𝑞 = √(12)(0.5)(0.5) = 1,73 Al pasar de discreta a continua tenemos que aplicar la corrección de Yates por lo que calcularemos: 𝑃(5 − 0.5 ≤ 𝑋 < 8 + 0.5) = 𝑃(4.5 ≤ 𝑋 < 8.5) 96 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Resolviendo la probabilidad, realizando la tipificación, es decir: 𝑋−𝝁 𝝈 𝑍= Luego, 𝑃(4.5 ≤ 𝑋 < 8.5) = 𝑃 4.5 − 6 8.5 − 6 ≤𝑧< 1,73 1,73 = 𝑃(−0,87 ≤ 𝑧 < 1,45) = 0,7343 Ejemplos 1.46 Supongamos que se sabe que el 70% de las estudiantes que han tomado el curso de estadística eventualmente se casan. ¿Cuál es la probabilidad de que 24 o menos de una muestra aleatoria de 50 de estos estudiantes eventualmente se casen? Asumiendo las condiciones para una distribución binomial, tenemos 𝓑(𝟓𝟎; 𝟎, 𝟕). Calculando la probabilidad 𝑃(𝑋 ≤ 24) = 𝑝(0) + 𝑝(1)+ . . . +𝑝(24) Usando 𝑝(𝑥) = Como 𝑛𝑝 = (50)(0.7)35 > 5 y 50 0,7𝑥 0,350−𝑥 𝑥 𝑛(1 − 𝑝) = (50)(0.3) = 15 > 5, entonces podemos usar la aproximación normal, considerando: 𝜇 = 𝑛𝑝 = (50)(0,7) = 35 y 𝜎 = √𝑛𝑝𝑞 = √(50)(0.7)(0.3) = 3,24 97 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Al pasar de discreta a continua tenemos que aplicar la corrección de Yates por lo que calcularemos: 𝑃(𝑋 < 24 + 0.5) = 𝑃(𝑋 < 24.5) =𝑃 𝑧< 24.5 − 35 3,24 = 𝑃(𝑧 < −3,24)0 = ,0006 Aproximación de la distribución de Poisson a la distribución normal En los temas anteriores se ha calculado las probabilidades asociadas a experimentos de Poisson 𝑷(𝝀) usando la función de probabilidad 𝒇(𝒙) o la función de distribución 𝑭(𝒙) o el uso de las tablas de probabilidades respectivas. Sin embargo, el uso de la fórmula función tiene sus inconvenientes por ser tedioso el cálculo para grande valores del tamaño de muestra 𝒏 , también cuando el valor de 𝒏 o la probabilidad de éxito 𝒑 no se encuentra en la tabla, entonces bajo estas circunstancias se puede obtener otros métodos para obtener buenas aproximaciones de las probabilidades. Ejemplos 1.47 Las llamadas telefónicas llegan aleatoriamente a una centralita a una velocidad 1 por minuto en promedio. ¿Cuál es la probabilidad de que se reciban 40 o más llamadas en un período de 30 minutos?. El número de llamadas recibidas por 30 minutos será una distribución de Poisson (30). Podríamos calcular: 𝑃(𝑋 ≥ 40) = 1 − 𝑃(𝑋 ≤ 39) = 1 − 𝑝(0) − 𝑝(1) − 𝑝(2)− . . . −𝑝(39) Usando la fórmula de cálculo: 𝑝(𝑥) = 𝑒 −30 30𝑥 𝑥! Utilizando esta fórmula resulta el calculo muy tedioso. Además, las tablas de Poisson acumulativas para 𝜆 = 30 pueden no estar disponibles. Es decir, Si 𝜆 ≥ 10, entonces la distribución de Poisson 𝑷𝒐𝒊𝒔𝒔𝒐𝒏(𝜆) pueden aproximarse por los de una normal 𝑵(𝝁; 𝝈) siendo 𝝁 = 𝜆 y 𝝈 = √𝜆 ; es decir: 𝑷𝒐𝒊𝒔𝒔𝒐𝒏(𝜆) ⟶ 𝑵 (𝝁 = 𝜆; 𝝈 = √𝜆) 98 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Al igual que con la aproximación normal a la binomial, debemos aplicar una corrección de continuidad para permitir el hecho de que estamos usando una distribución continua como una aproximación de una distribución discreta. Corrección de continuidad Una distribución de Poisson es una distribución de probabilidad discreta y, por lo tanto, para usar la distribución normal como una aproximación a la distribución de Poisson, se debe aplicar una corrección de continuidad, de manera similar cuando se debe aplicar cuando se utiliza la distribución normal como una aproximación a una distribución binomial. 𝑃(𝑋 = 𝑎) = 𝑃(𝑎 − 0,5 ≤ 𝑋 ≤ 𝑎 + 0,5) ≈ 𝑃 𝑎 − 0,5 − 𝜆 √𝜆 ≤𝑍≤ 𝑎 + 0,5 − 𝜆 √𝜆 En los demás casos tenemos: 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 − 0,5 ≤ 𝑋 < 𝑏 + 0,5) ≈ 𝑃 𝑃(𝑎 < 𝑋 < 𝑏) = 𝑃(𝑎 + 0,5 ≤ 𝑋 ≤ 𝑏 − 0,5) ≈ 𝑃 𝑃 (𝑋 < 𝑎 ) 𝑃 (𝑋 ≤ 𝑎 ) 𝑃 (𝑋 > 𝑎 ) 𝑃 (𝑋 ≥ 𝑎 ) 𝑃 (𝑎 ≤ 𝑋 ≤ 𝑏 ) 𝑃 (𝑎 < 𝑋 < 𝑏 ) 𝑃 (𝑎 < 𝑋 ≤ 𝑏 ) 𝑃 (𝑎 ≤ 𝑋 < 𝑏 ) 𝑎 − 0,5 − 𝜆 √𝜆 𝑎 + 0,5 − 𝜆 √𝜆 ≤𝑍≤ ≤𝑍≤ 𝑏 + 0,5 − 𝜆 √𝜆 𝑏 − 0,5 − 𝜆 √𝜆 𝑃(𝑋 ≤ 𝑎 − 0,5) 𝑃(𝑋 ≤ 𝑎 + 0,5) 𝑃(𝑋 ≥ 𝑎 + 0,5) 𝑃(𝑋 ≥ 𝑎 − 0,5) 𝑃(𝑎 − 0,5 ≤ 𝑋 ≤ 𝑏 + 0,5) 𝑃(𝑎 + 0,5 ≤ 𝑋 ≤ 𝑏 − 0,5) 𝑃(𝑎 + 0,5 ≤ 𝑋 ≤ 𝑏 + 0,5) 𝑃(𝑎 + 0,5 ≤ 𝑋 ≤ 𝑏 − 0,5) Ejemplos 1.48 Suponga que manuela publica imágenes en su página de redes sociales en diferentes periodos de tiempo. Ella publica, en promedio, 24 fotos cada semana. Sea la variable aleatoria de Poisson, X, el número de imágenes publicadas cada semana. Calcular las siguientes probabilidades: a. 𝑃(𝑋 = 30) b. 𝑃(29 < 𝑋 < 31) c. 𝑃(24 ≤ 𝑋 ≤ 26) d. 𝑃(19 < 𝑋 ≤ 21) e. 𝑃(𝑋 < 32) f. 𝑃(𝑋 ≤ 28) 99 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán SOLUCIÓN Como el valor de 𝜆 = 24 > 10, es grande, se puede aproximar la distribución de Poisson a la distribución normal, es decir: 𝑷𝒐𝒊𝒔𝒔𝒐𝒏(𝜆) ⟶ 𝑵 (𝝁 = 𝜆 = 24; 𝝈 = √𝜆 = √24 ) Aplicando la corrección de continuidad cuando se usa la distribución normal, tenemos: 𝑃(𝑋 = 30) = 𝑃(30 − 0,5 ≤ 𝑋 ≤ 30 + 0,5) = 𝑃(29,5 ≤ 𝑋 ≤ 30,5) =𝑃 29,5 − 24 √24 ≤𝑍< 30,5 − 24 √24 = 𝑃(1,123 ≤ 𝑍 < 1,327) = 0,0385( 𝟑, 𝟖𝟓%) 𝑃(29 < 𝑋 < 31) = 𝑃(29 + 0,5 ≤ 𝑋 ≤ 31 − 0,5) = 𝑃(29,5 ≤ 𝑋 < 30,5) 29,5 − 24 =𝑃 √24 ≤𝑍≤ 30,5 − 24 √24 = = 𝑃(1,123 ≤ 𝑍 < 1,327) = 0,0385( 𝟑, 𝟖𝟓%) 𝑃(24 ≤ 𝑋 ≤ 26) = 𝑃(24 − 0,5 ≤ 𝑋 ≤ 26 + 0,5) = 𝑃(23,5 ≤ 𝑋 ≤ 26,5) 23,5 − 24 =𝑃 √24 ≤𝑍≤ 26,5 − 24 √24 = = 𝑃(−0,102 ≤ 𝑍 < 0,510) = 0,236( 𝟐𝟑, 𝟔𝟎%) 𝑃(19 < 𝑋 ≤ 21) = 𝑃(19 + 0,5 ≤ 𝑋 ≤ 21 + 0,5) = 𝑃(19,5 ≤ 𝑋 ≤ 21,5) =𝑃 19,5 − 24 √24 ≤𝑍≤ 21,5 − 24 √24 = 𝑃(−0,919 ≤ 𝑍 < −0,510) = 0,126( 𝟏𝟐, 𝟔𝟎%) 100 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán 𝑃(𝑋 < 32) = 𝑃(𝑋 ≤ 32 − 0,5) = 𝑃(𝑋 ≤ 31,5) =𝑃 𝑍≤ 31,5 − 24 √24 = 𝑃(𝑍 ≤ 1,531) = 0,93448( 𝟗𝟑, 𝟒𝟒𝟖%) 𝑃(𝑋 ≤ 28) = 𝑃(𝑋 ≤ 28 + 0,5) = 𝑃(𝑋 ≤ 28,5) =𝑃 𝑍≤ 28,5 − 24 √24 = 𝑃(𝑍 ≤ 0,919) = 0,82121( 𝟖𝟐, 𝟏𝟐𝟏%) Ejemplos 1.49 Las llamadas telefónicas llegan aleatoriamente a una centralita a una velocidad 1 por minuto en promedio. ¿Cuál es la probabilidad de que se reciban 40 o más llamadas en un período de 30 minutos?. El número de llamadas recibidas por 30 minutos será una distribución de Poisson (30). Podríamos calcular: 𝑃(𝑋 ≥ 40) = 1 − 𝑃(𝑋 ≤ 39) Sin embargo, dado que el valor de 𝜆 es mayor que 10 (𝜆 = 30), podemos usar el método de aproximación normal, es decir, una distribución normal con, 𝜇 = 𝜆 = 30 y 𝜎 = √𝜆 = √30 = 5,477. Aplicando corrección de continuidad tenenmos: 𝑃(𝑋 ≥ 40) = 𝑃(𝑋 ≥ 40 − 0,5) = 𝑃(𝑋 ≥ 39,5) =𝑃 𝑍≥ 39,5 − 30 √30 = 𝑃(𝑍 ≥ 1,734) = 0,04182( 𝟒, 𝟏𝟖𝟐%) 101 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán RELACION DE PROBLEMAS N 10 APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL Y POISSON A LA DISTRIBUCIÓN NORMAL 1. Suponga que los automóviles llegan a un estacionamiento a una velocidad de 50 por hora. Supongamos que el proceso es una variable aleatoria de Poisson con λ = 50. Calcule la probabilidad de que en la próxima hora el número de automóviles que lleguen a este estacionamiento esté entre 54 y 62. 2. La sobreventa de pasajeros en vuelos intercontinentales es una práctica común entre las aerolíneas. Las aeronaves que pueden transportar 300 pasajeros están reservadas para transportar 320 pasajeros. Si, en promedio, el 10% de los pasajeros que tienen una reserva no se presentan a sus vuelos, ¿cuál es la probabilidad de que al menos un pasajero que tenga una reserva termine sin un asiento en un vuelo en particular? 3. Una cadena de supermercados vende su café instantáneo con etiqueta de "marca propia" en paquetes que contienen 200 g de gránulos de café. Los paquetes son llenados por una máquina configurada para dispensar rellenos de 200 g. Si los rellenos se distribuyen normalmente, aproximadamente una media de 200 g. y con una desviación estándar de 7 g., encuentre el número de paquetes de un envío de 1,000 paquetes que: a. Contienen más de 215 g. b. Contienen menos de 195 g. c. Contener entre 190 y 210 g. 4. La cadena de supermercados decide retirar todos los paquetes con menos de un cierto peso de café. Como resultado, se retiran 40 paquetes que estaban en el envío de 1,000 paquetes. ¿Cuál es el peso con el que se ha dibujado la "línea"? 5. En una fábrica hay 45 accidentes por año y el número de accidentes por año sigue una distribución de Poisson. Use la aproximación normal para encontrar la probabilidad de que haya más de 50 accidentes en un año. 6. Un agente cosmético puerta a puerta realiza un promedio de 26 llamadas exitosas por semana. ¿Cuál es la probabilidad de que en una semana en particular haga menos de 20 llamadas exitosas? 7. El número medio de aviones que aterrizan en un aeropuerto por hora es 38. a. Use la fórmula de Poisson para encontrar la probabilidad de que 40 aviones aterricen en cualquier período de una hora. b. Use la aproximación normal para calcular la probabilidad de que 40 aviones aterricen en cualquier período de una hora. 8. La competencia de la Copa Mundial de la FIFA 2014 se celebró en Brasil. A pesar de ser una nación entusiasta, una encuesta previa a la competencia mostró que solo el 48% de los brasileños apoyaron la organización del evento.33 El apoyo en realidad cayó desde 2008, tal vez debido a sobrecostos, demoras en la construcción y accidentes. Suponga que 500 brasileños son seleccionados al azar. Use la aproximación normal a la distribución binomial para responder las siguientes preguntas. a. Encuentre la probabilidad de que al menos 255 de los brasileños seleccionados apoyen ser anfitriones de la Copa del Mundo. b. Encuentre la probabilidad de que exactamente 260 de los brasileños seleccionados apoyen la celebración de la Copa del Mundo. 9. Supongamos que 215 brasileños seleccionados prefieren organizar la Copa del Mundo. ¿Hay alguna evidencia que sugiera que la proporción que está a favor de organizar la Copa del Mundo ha disminuido (de 0,48)? Justifica tu respuesta. 10. Mercadeo y comportamiento del consumidor El "Viernes Negro" es el día después del Día de Acción de Gracias y el primer día tradicional de la temporada de compras navideñas. Suponga que una encuesta reciente sugirió que el 66% de los compradores del Black Friday en realidad están comprando para sí mismos. Se obtiene una muestra aleatoria de 130 compradores del Black Friday. Responda cada problema usando la aproximación normal a la distribución binomial. a. Encuentre la probabilidad aproximada de que menos de 76 compradores del Black Friday compren por sí mismos. 102 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán b. 11. 12. 13. 14. 15. 16. Encuentre la probabilidad aproximada de que entre 77 y 87 (inclusive) los compradores del Black Friday compren por sí mismos. Supongamos que 90 compradores del Black Friday compran para ellos mismos. ¿Hay alguna evidencia que sugiera que el reclamo es incorrecto, que la verdadera proporción de compradores del Black Friday que compran para sí mismos es mayor que 0.66? Justifica tu respuesta. Negocios y administración En enero de 2014, Sam’s Club anunció planes para recortar el 2% de su fuerza laboral.41 Se esperaba que los recortes afectaran tanto a los gerentes como a los empleados por hora. Supongamos que se obtiene una muestra aleatoria de 150 empleados de Sam’s Club. a. Use la distribución binomial para encontrar la probabilidad exacta de que a lo sumo 2 empleados pierdan sus trabajos. b. Use la aproximación normal a la distribución binomial para encontrar la probabilidad aproximada de que a lo sumo 2 empleados pierdan sus trabajos. Suponga que 7 de los empleados realmente pierden su trabajo. ¿Hay alguna evidencia que sugiera que el reclamo de Sam’s Club es incorrecto, que la verdadera proporción de empleados que pierden su trabajo es mayor que 0.02? Justifique su respuesta usando la distribución binomial y la aproximación normal. Economía y finanzas La banca en línea es rápida y conveniente, pero presenta algunos riesgos de seguridad. Para aquellas personas que tienen una cuenta bancaria en línea, el 47% usa su contraseña bancaria en línea para al menos otro sitio en línea. Supongamos que se selecciona una muestra aleatoria de 100 personas que tienen una cuenta bancaria en línea y se les pregunta si usan su contraseña bancaria para al menos otro sitio en línea. Responda cada problema usando la aproximación normal a la distribución binomial. a. Encuentre la probabilidad aproximada de que menos de 40 personas usen su contraseña bancaria en línea para al menos otro sitio en línea. b. Encuentre la probabilidad aproximada de que al menos 50 personas usen su contraseña bancaria en línea para al menos otro sitio en línea. Supongamos que se selecciona una segunda muestra aleatoria de 100 personas que tienen una cuenta bancaria en línea y también se les pregunta si usan su contraseña bancaria para al menos otro sitio en línea. Encuentre la probabilidad aproximada de que entre 42 y 52 personas (inclusive) usen su contraseña bancaria en línea para al menos otro sitio en línea en ambas muestras aleatorias Supongamos que necesita ir a trabajar al centro de la ciudad, existe la posibilidad de un atasco de tráfico. Hay un 30% de probabilidad de tráfico el lunes.20% de probabilidad de tráfico el martes. 60% de probabilidad de atasco en cualquier día. a) ¿Cuál es la probabilidad de un atasco tanto el lunes como el martes? b) ¿son los eventos de que hay un atasco el lunes, que hay un atasco el martes independiente? 103 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Distribución de la variable aleatoria Chi cuadrado 𝝌𝟐 Matemático británico y filósofo de la ciencia, nacido el 27 de marzo de 1857 en Londres y fallecido el 27 de abril de 1936 en la misma ciudad, fue uno de los fundadores de la moderna estadística y pionero en el establecimiento de su uso por parte de las ciencias biológicas. CARACTERÍSTICAS La distribución de χ2 se usa principalmente para analizar dispersiones. Definición Una variable aleatoria 𝑋 tiene distribución Chi Cuadrado (𝝌𝟐 ), con 𝒏 grados de libertad, si su función de densidad está dado por: FUNCIÓN DE DENSIDAD GRÁFICA DE LA FUNCIÓN DE DENSIDAD Donde: 𝑛 : Número de datos. 𝑣 = 𝑛 − 1: Grados de libertad. Γ(∙) : Función Gamma. 𝑥 : Valor que asume la variable aleatoria 𝑋. FUNCIÓN DE DISTRIBUCIÓN (ACUMULADA) GRÁFICA DE UNA FUNCIÓN DE DISTRIBUCIÓN Su función de distribución está dado por: Parámetros La media y la varianza están dadas por: 𝐸(𝑥) = 𝑣 𝑉(𝑥) = 2𝑣 Notación Se denota por 𝑋 ~ 𝜒𝑣2 104 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán PROPIEDADES Algunas de las propiedades de dicha función, son: - La distribución de Chi cuadrado no es simétrica, presenta un sesgo positivo a diferencia de la distribución normal o la distribución t. - Los valores de la chi cuadrado pueden ser de cero o positivos, pero no negativos. - La distribución de chi cuadrado es una familia de curvas y hay una distribución diferente para cada número de grados de libertad “v”. Pero, a medida que el número de grados de libertad aumenta, la distribución de la chi cuadrado se aproxima a la distribución normal. USO DE LAS TABLAS DE PROBABILIDADES DE LA DISTRIBUCIÓN CHI CUADRADO: 𝑃(𝝌𝟐 > 𝝌𝟐𝟎 ) Pero calcular probabilidades, tratándose de variables continuas se debe hacerlo en intervalos, es decir se debe utilizar la función de distribución 𝐹𝑋 (𝑥), así tenemos: 𝐹𝑋 (𝑥) = 1 𝑥 ∫ 𝒙𝟐 (𝒗/𝟐)−𝟏 − 𝒙 𝒆 2𝑣/2 Γ(𝑣/2) −∞ 𝟐 𝒅𝒙 Entonces, la tabla de probabilidades calcula las probabilidades con el complemento, 1 − 𝐹𝑋 (𝑥). Es decir: 𝟐 𝑃(𝝌 > 𝝌𝟐𝟎 ) = 1 − 𝐹𝑋 (𝑥) = 𝟏 ∞ ∫ 𝝌𝟐 𝒗 𝒗 𝟐𝟐 𝚪 (𝟐) 𝝌𝟐𝟎 105 𝒗 ( )−𝟏 −𝝌 𝟐 𝒆 𝟐 𝟐 𝒅𝝌𝟐 = 𝜶 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplo 1.44 Encuentre el valor correspondiente a la probabilidad indicada de una distribución Chi cuadrada X con ocho grados de libertad.. 𝑃(𝝌𝟐𝟖 > 𝒌) = 0.95 SOLUCIÓN Se busca en la tabla con 𝛼 = 0.95 y 𝑣 = 𝑛 − 1 = 8 (grados de libertad). Luego, el valor de 𝒌 = 𝟐, 𝟕𝟑𝟑 Ejemplo 1.45 Encuentre el valor correspondiente a la probabilidad indicada de una distribución Chi cuadrada X con 10 grados de libertad.. 𝑃(𝝌𝟐𝟏𝟎 < 𝒌) = 0.90 SOLUCIÓN Se busca en la tabla con el complemento, porque la tabla calcula con cola a la derecha, así entonces: 𝑃(𝝌𝟐𝟏𝟎 < 𝒌) = 1 − 𝑃(𝝌𝟐𝟏𝟎 ≥ 𝒌) = 0.90 𝑃(𝝌𝟐𝟏𝟎 ≥ 𝒌) = 0.10 Se busca en la tabla con 𝛼 = 0.10 y 𝑣 = 𝑛 − 1 = 10 (grados de libertad). Luego, el valor de 𝒌 = 𝟏𝟓, 𝟗𝟖𝟕 106 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán APLICACIONES DE LA DISTRIBUCIÓN CHI CUADRADO DE PEARSON PRIMER TEOREMA Sean 𝑍1 , 𝑍2 , . . . , 𝑍𝑛 variables aleatorias independientes con distribución normal estándar, es decir: 𝑍𝑖 ~ 𝑁(0,1) 𝑖 = 1,2, … , 𝑛 entonces la suma de los cuadrados de las variables normales estándar independientes tienen distribución chi - cuadrado 𝝌𝟐 , Es decir: 𝑀 Tiene distribución 𝝌𝟐 con 𝑛 grados de libertad Ejemplo 1.46 Tenemos siete variables aleatorias que se distribuyen como normales con media o y desviación estándar 1. Creamos una nueva variable como la suma de los cuadrados de las siete anteriores. a) b) c) d) ¿Qué distribución tiene? ¿Qué media y varianza tiene? ¿Qué número deja por debajo una probabilidad de 0.9? ¿Cuál es la probabilidad de que X tome valores menores de 16? SOLUCIÓN a) Tiene una distribución chi cuadrado con seis grados de libertad 𝑣 = 𝑛 − 1 = 7 − 1 = 6 b) La media y la varianza están dadas por: 𝐸 (𝑥 ) = 𝑣 = 6 𝑉 (𝑥 ) = 2𝑣 = 2(6) = 12 𝑐) 𝑃(𝜒2 < 𝑘) = 0.90 𝑃(𝜒2 < 𝑘) = 1 − 𝑃(𝜒2 ≥ 𝑘) = 1 − 0.90 = 0.10 Según la tabla, el valor es 𝑘 = 10.645 𝑑) 𝑃(𝜒2 < 16) SEGUNDO TEOREMA Si 𝒔𝟐 es la varianza de una muestra aleatoria de tamaño 𝑛 tomada de una población normal que tiene varianza 𝜎 2 , entonces. (𝒏 − 𝟏)𝒔𝟐 𝝌𝟐 = ~𝜒2(𝑛−1) 𝜎2 Es una valor de una variable aleatoria que tiene la distribución chi cuadrado con 𝑛 − 1 grados de libertad. 107 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán DISTRIBUCIÓN DE LA VARIANZA MUESTRAL La distribución chi-cuadrado permite conocer cómo se distribuye la varianza muestral s2. Luego, para el cálculo de la probabilidad de la varianza muestral se tiene: 𝑷(𝒔𝟐 < 𝒌) = 𝑷 ( (𝒏 − 𝟏)𝒔𝟐 (𝒏 − 𝟏) (𝒏 − 𝟏) < 𝒌) = 𝑷 𝝌𝟐 < 𝒌 = 𝜒02 𝜎2 𝜎2 𝜎2 Ejemplo 1.47 Encuentre la probabilidad de que una muestra aleatoria de 20 observaciones, de una población normal con varianza 𝜎 2 = 16 , tenga una varianza muestral menor que 12. SOLUCIÓN Encuentre el valor correspondiente a la probabilidad indicada de una distribución Chi cuadrada X con 19 grados de libertad, es decir debemos calcular: 𝑃(𝒔𝟐 < 𝟏𝟐) SOLUCIÓN 𝑃(𝒔𝟐 < 𝟏𝟐) = 𝑷( (𝒏−𝟏)𝒔𝟐 𝜎2 𝟏𝟗 < (16 ) 𝟏𝟐) = 𝑷(𝝌𝟐 < 𝟏𝟒. 𝟐𝟓) Como no se encuentra el valor exacto, se encuentra comprendido entre dos valores. Vamos a interpolar: Denominemos por "𝑎" el valor a encontrar, entonces: 𝑎 = 0.80 − Luego: (0.80 − 0.75)(14.25 − 13.716) = 0.7684 (14.562 − 13.716) 𝑷(𝝌𝟐 < 𝟏𝟒. 𝟐𝟓) = 𝟎. 𝟕𝟔𝟖𝟒 Por lo tanto: 𝑃(𝒔𝟐 < 𝟏𝟐) = 0.7684. EJEMPLO DE APLICACIÓN Para un gerente de planta es muy importante controlar la variación en el espesor de un material plástico. Se sabe que la distribución del espesor del material es normal con una desviación estándar de 0.01 cm. Una muestra aleatoria de 25 piezas de este material da como resultado una desviación estándar muestral de 0.015 cm. Si la varianza de la población es 0.012 𝑐𝑚2 . ¿cuál es la probabilidad de que la varianza muestral sea igual o mayor que 0.00152 𝑐𝑚2 ? Por lo tanto ¿qué puede usted concluir con respecto a la variación de este proceso? 108 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán RELACION DE PROBLEMAS N 11 DISTRIBUCIÓN DE PROBABILIDADES DE UNA VARIABLE ALEATORIA CHI CUADRADO 1. Sea 𝑋 una variable aleatoria con distribución chi cuadrado con ocho grados de libertad, calcule el valor de k, tal que 𝑃(𝑋 > 𝑘) = 0.02 2. Sea 𝑋 una variable aleatoria con distribución chi cuadrado con diez grados de libertad, calcule el valor de k, tal que 𝑃(𝑋 < 𝑘) = 0.10 3. Calcule la mediana de una variable aleatoria chi cuadrado con dos grados de libertad. Sugerencia; La mediana es el valor medio, es decir, el valor m en el que 𝑃(𝑋 > 𝑚) = 𝑃(𝑋 < 𝑚). 4. Para una distribución chi cuadrado encontrar: 5. Para una distribución chi cuadrado encontrar 𝜒𝛼2 tal que: 6. La variable X se distribuye según 𝝌𝟐 con 10 grados de libertad a) Si se extrae el valor de X tal que la probabilidad de que no supere el valor 9,342 b) Calcule el valor de X tal que la probabilidad de obtener como máximo ese valor sea 0,70 c) Calcule el valor de observar valores en la variable X esté entre 3,94 y 13,442. d) Calcule la puntuación X que corresponde al centil 80. e) Calcule la probabilidad de que la variable X adopte como mínimo el valor 15,987. f) Calcule la puntuación X que corresponde a la probabilidad acumulada de 0.99. 7. Calcular la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con desviación estándar √6, tenga una varianza muestral 𝑠2 . 8. Si 𝑥1 , 𝑥2 , . . . , 𝑥10 es una muestra aleatoria de tamaño 10 de una población distribuida normalmente con media 8 y varianza 9, calculador la probabilidad de que la varianza muestral sea mayor que 3,753 R: 0,9 9. De acuerdo con la variación del nivel de ruido en decibeles en distintas partes de cierta empresa, se decidirá si usar una estrategia general o una por área, para protección contra el ruido. En particular, si en una muestra de 14 puntos seleccionados aleatoriamente se observa una variación estándar superior a 4 decibeles, se usará una estrategia por área, y en caso contrario, una estrategia general. Suponga que la desviación estándar poblacional es de 3 decibeles y que la variable de la población de origen se distribuye normalmente. ¿Cuál es la probabilidad de llegar a usar una estrategia general? R. Existe una probabilidad superior al 95% de llegar a usar una estrategia general, de acuerdo a las condiciones del experimento 10. La autoridad sanitaria de un país decide llevar a cabo una investigación sobre los residuos que producen las empresas de un determinado sector. Seleccionada una muestra aleatoria simple de 9 empresas y suponiendo que los residuos se distribuyen normalmente con media 23 Tm y desviación típica de 6 Tm., calcular: a) Probabilidad de que el residuo medio muestral se mantenga entre 18,72 y 25,76 Tm. b) Probabilidad de que la varianza muestral sea superior a 60,12. c) Calcular un valor de k tal que 𝑃(𝑆 2 > 𝑘) = 0.95 109 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIABLE ALEATORIA CONTINUA CON DISTRIBUCIÓN T DE STUDENT Una variable aleatoria continua X tiene una distribución de probabilidad t student, su distribución se asemeja a la distribución normal. Es simétrica y tiene forma de campana. La diferencia entre la distribución normal y la de t student, reside en que esta última a menos grados de libertad tiene colas más pesadas que de la normal, por consiguiente, a menos grados de libertad la distribución t student es más chata que la normal WILLIAM GOSSET William Sealy Gosset (13 de junio de 1876 - 16 de octubre de 1937) fue un estadístico inglés. Una generalización de la distribución de Cauchy es la distribución t-Student, llamada así por William Gosset, el estadístico de principios del siglo XX, que publicó bajo el nombre de "Student" porque su empleador, Guinness Breweries, le exigió usar un seudónimo. VARIABLE ALEATORIA X CON DISTRIBUCIÓN T DE STUDENT Definición Una variable aleatoria 𝑋 tiene distribución 𝑡 − 𝑠𝑡𝑢𝑑𝑒𝑛𝑡 (𝒕), con 𝒏 grados de libertad, si su función de densidad está dado por: FUNCIÓN DE DENSIDAD GRÁFICA DE LA FUNCIÓN DE DENSIDAD Donde: 𝑛 : Número de datos. 𝑣 = 𝑛 − 1: Grados de libertad. Γ(∙) : Función Gamma. 𝑥 : Valor que asume la variable aleatoria 𝑋. FUNCIÓN DE DISTRIBUCIÓN (ACUMULADA) GRÁFICA DE UNA FUNCIÓN DE DISTRIBUCIÓN Su función de distribución está dado por: Donde La función hipergeométrica está definida para |𝑧| < 1 por la serie de potencias: 110 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Parámetros La media y la varianza están dadas por: 𝐸(𝑥) = 0 Cuando 𝑣 > 1 𝑉(𝑥) = 𝑣/𝑣 − 2 Cuando 𝑣 > 2 Notación Se denota por 𝑋 ~ 𝑡𝑣 CARACTERÍSTICAS La distribución t de student es simétrica como la normal y depende de los grados de libertad de la varianza muestral, es decir, hay muchas distribuciones, una para cada tamaño de muestra. Conforme más grande es la muestra (mayor número de grados de libertad), más se aproxima la distribución t de student a la distribución normal estándar. Tiene las siguientes características: 𝑥−𝜇 𝑠 1) La variable 𝑡 = tiene distribución t de student si la población de donde proviene la muestra tiene distribución 2) 3) 4) 5) normal. Los valores que asume la variable t de student compenden a todos los números reales, es decir: 𝑅𝑡 = 𝑅 La distribución es unimodal y simétrica respecto a 0. Es más achatada que la distribución normal estándar, como se observa en el siguiente gráfico. Cuando el tamaño de la muestra aumenta, se aproxima a la distribución normal estándar. USO DE LAS TABLAS PARA EL CÁLCULO DE PROBABILIDADES DE LA DISTRIBUCIÓN T STUDENT: 𝑃(𝑻 > 𝑡𝑛−1 ) Pero calcular probabilidades, tratándose de variables continuas se debe hacerlo en intervalos, es decir se debe utilizar la función de distribución 𝐹𝑋 (𝑥), así tenemos: 𝑥 𝐹𝑋 (𝑥) = ∫ −∞ Γ[(𝑣 + 1)/2] √𝑣𝜋Γ[𝑣/2] 𝟐 −(𝒗+𝟏)⁄𝟐 (𝟏 + 𝒔 ⁄𝒗) 𝑑𝑠 Entonces, la tabla de probabilidades calcula las probabilidades con el complemento, 1 − 𝐹𝑋 (𝑥). Es decir: 𝑥 𝑃(𝑻 > 𝑡𝑛−1 ) = 1 − 𝐹𝑋 (𝑥) = 1 − ∫ −∞ Γ[(𝑣 + 1)/2] √𝑣𝜋Γ[𝑣/2] 111 𝟐 (𝟏 + 𝒔 ⁄𝒗) −(𝒗+𝟏)⁄𝟐 𝑑𝑠 = 𝜶 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplo 1.48 Encuentre el valor correspondiente a la probabilidad indicada de una distribución t student, X con 15 grados de libertad.. 𝑃(𝑋15 < 𝒌) = 0.075 SOLUCIÓN Se busca en la tabla con el complemento, es decir 𝛼 = 0.025 y 𝑣 = 𝑛 − 1 = 15 (grados de libertad). 𝑃(𝑋15 < 𝑘) = 1 − 𝑃(𝑋15 ≥ 𝑘) = 0.075 Entonces 𝑃(𝑋15 ≥ 𝑘) = 0.025 Según la tabla, el valor es 𝑘 = 2.131 Ejemplo 1.49 Encuentre el valor correspondiente a la probabilidad indicada de una distribución t student, X con 10 grados de libertad.. 𝑃(𝑋10 > 𝒌) = 0.32 SOLUCIÓN Como no se encuentra el valor exacto, se encuentra comprendido entre dos valores. Vamos a interpolar: Denominemos por "𝑎" el valor a encontrar, entonces: 𝑘 = 0.542 − (0.542 − 0.260)(0.32 − 0.30) = 0.4856 (0.40 − 0.30) 112 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Luego el valor de 𝑘 = 0.4856 EJEMPLO DE APLICACIÓN El resultado de un proceso químico se mide. El resultado debe ser μ = 500 g / ml (supuesta expectativa de población). El resultado se midió en n = 25 lotes, cuando la media de la muestra fue 𝑥̅ = 518 g / ml y la desviación estándar s = 40 g / ml. Vamos a calcular la probabilidad de la media muestral supere 𝑥̅ = 518 g / ml?. SOLUCIÓN Vamos a calcular la siguiente probabilidad: 𝑃(𝑥̅ ≥ 518) EJEMPLO DE APLICACIÓN Si la demanda semanal de un artículo es una variable aleatoria cuya distribución puede considerarse aproximadamente normal de media 150 unidades. Calcule la probabilidad de que una muestra de 5 semanas de lugar a una media muestral superior a 158 sabiendo que la cuasivarianza muestral es 64. SOLUCIÓN TEOREMA Sea 𝑍 una variable aleatoria normal estándar, 𝑍~ 𝑁(0,1) y sea 𝑊 una variable con distribución chi-cuadrado "𝝌𝟐 " con 𝑣 grados de libertas. Entonces, si 𝑊 y 𝑍 son independientes, 𝑇= 𝑍 √𝑊 ⁄𝑣 𝑇 Tiene distribución 𝑡 − 𝑠𝑡𝑢𝑑𝑒𝑛𝑡 con 𝑣 grados de libertad 113 ~ 𝑡𝑣 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad RELACION DE PROBLEMAS N 12 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán DISTRIBUCIÓN DE PROBABILIDADES DE UNA VARIABLE ALEATORIA T DE STUDENT 1. Para una distribución 𝑡, calcular: a) 𝑃(𝑇 < 2.365) cuando 𝑣 = 7 b) 𝑃(𝑇 > 1.318) cuando 𝑣 = 24 c) 𝑃(−1,356 < 𝑇 < 2.179) cuando 𝑣 = 12 d) 𝑃(𝑇 > −2.567) cuando 𝑣 = 17 2. Dada una muestra aleatoria de tamaño 24 de una distribución normal, calcular k, tal que a) 𝑃(−2.069 < 𝑇 < 𝑘) = 0.965 b) 𝑃(𝑘 < 𝑇 < 2.807) = 0.095 c) 𝑃(−𝑘 < 𝑇 < 𝑘) = 0.90 3. Para una distribución 𝑡, calcular: a). Con v = 15, hállese el valor t, tal que P ( T > t ) = 0.10 b). Con v = 15, hállese el valor t, tal que P ( T < t ) = 0.10 c). Con v = 24, hállese el valor t, tal que P ( T > t ) = 0.05 d). Con v = 24, hállese el valor t, tal que P ( T < t ) = 0.05 e). Con v = 15, hállese los valores de a y b, tal que P (a < T < b) = 0.90. 4. Sea X una variable aleatoria con distribución t student con 19 grados de libertad, calcule 𝑡𝛼 , tal que: 𝑃(𝑇 > 𝑡𝛼 ) = 0.90 5. La variable X se distribuye según 𝑡 de Student con 25 grados de libertad: 114 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán VARIABLE ALEATORIA CONTINUA CON DISTRIBUCIÓN F Distribución 𝑭 Otra distribución muy útil es la distribución 𝐹 que también se conoce como la distribución F de Fisher o distribución de Fisher-Snedecor, haciendo referencia al gran estadístico Ronald Aylmer Fisher (1890-1962) y el fundador del primer departamento de estadística en los Estados Unidos, George Waddel Snedecor (1881-1974). Definición Una variable aleatoria 𝑿 tiene distribución 𝐹, con 𝒎 grados de libertad en el numerador y 𝒏 grados de libertad en el denominador si su función de densidad está dado por: FUNCIÓN DE DENSIDAD GRÁFICA DE LA FUNCIÓN DE DENSIDAD FUNCIÓN DE DISTRIBUCIÓN (ACUMULADA) GRÁFICA DE UNA FUNCIÓN DE DISTRIBUCIÓN Su función de distribución está dado por: Donde Es la función Beta regular Es la función Beta Es la función hipergeométrica. Es la función Gamma. Parámetros La media y la varianza están dadas por: 𝐸(𝑥) = 𝑉(𝑥) = 𝑚 𝑚−2 2𝑚2 (𝑚+𝑛−2) 𝑛(𝑚−2)2 (𝑚−4) 115 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Pero calcular probabilidades, tratándose de variables continuas se debe hacerlo en intervalos, es decir se debe utilizar la función de distribución 𝐹𝑋 (𝑥), así tenemos: 𝑥 𝑃(𝑭 < 𝐹𝑛,𝑚 ) = 𝐹𝑋 (𝑥) = ∫ −∞ Γ[(𝑣 + 1)/2] √𝑣𝜋Γ[𝑣/2] 𝟐 (𝟏 + 𝒔 ⁄𝒗) −(𝒗+𝟏)⁄𝟐 𝑑𝑠 Entonces, la tabla de probabilidades calcula las probabilidades 𝐹𝑋 (𝑥). Es decir: 𝑥 𝑃(𝑭 > 𝐹𝑛,𝑚 ) = 1 − 𝑃(𝑭 < 𝐹𝑛,𝑚 ) = 1 − 𝐹𝑋 (𝑥) = 1 − ∫ −∞ Γ[(𝑣 + 1)/2] √𝑣𝜋Γ[𝑣/2] 𝟐 (𝟏 + 𝒔 ⁄𝒗) −(𝒗+𝟏)⁄𝟐 𝑑𝑠 USO DE LAS TABLAS PARA EL CÁLCULO DE PROBABILIDADES CON LA DISTRIBUCIÓN F DE FISHER: 𝑃(𝑭 < 𝐹𝑛,𝑚 ) Las tablas de probabilidades de la distribución F de Fisher, vienen establecidas para ciertas probabilidades. Ejemplo 1.50 A continuación mostraremos los resultados de la tabla de probabilidades, 𝑃(𝑭 > 𝐹𝑛,𝑚 ) = 0.05 Donde: 𝑛: Grados de libertad del numerador 𝑚: Grados de libertad del denominador Es decir, el valor crítico asociado a 𝑃(𝐹 > 𝐹4,10 ) = 0.05 es: 𝐹4,10 = 3,478 116 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplos 1.51 Obtener los siguientes valores o puntos críticos, utilizando la tabla de la distribución 𝑃(𝑭 > 𝐹𝑛,𝑚 ) = 0.05 a) 𝑃(𝐹 > 𝐹2;6 ) = 0.05 b) 𝑃(𝐹 < 𝐹5,12 ) = 0.95 c) 𝑃(𝐹 < 𝐹6,15 ) = 0.05 SOLUCIÓN Es decir, el valor crítico asociado a 𝑃(𝐹 > 𝐹2,6 ) = 0.05 es: 𝐹2,6 = 5,143 Es decir, el valor crítico asociado a 𝑃(𝐹 < 𝐹5,12 ) = 0.95 es equivalente a 𝑃(𝐹 > 𝐹5,12 ) = 0.05 : 𝐹2,6 = 5,143 117 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán RELACIÓN ENTRE LA DISTRIBUCIÓN F DE FISHER Y LA DISTRIBUCIÓN CHI - CUADRADO Sea 𝑋 y 𝑌 variables aleatorias independientes con distribuciones chi-cuadrado con 𝑚 y 𝑛 grados de libertad, respectivamente, entonces la variable: 𝑋⁄𝑣1 F= ~ 𝐹𝑚,𝑛 𝑌⁄𝑣2 F Tiene distribución 𝐹 con 𝑣1 grados de libertad en el numerador y 𝑣2 grados de libertad en el denominador. Ejemplos 1.52. Sea X una variable aleatoria F con 4 grados de libertad de numerador y 5 grados de libertad de denominador. ¿Cuál es el quinto percentil superior? SOLUCIÓN 𝑃(𝐹 > 𝐹4;5 ) = 0.05 El quinto percentil superior es el valor de F de tal manera que la probabilidad a la derecha de x es 0,05 y, por tanto, la probabilidad a la izquierda de x es 0,95. (Ver gráfico) Para encontrar x usamos la siguiente tabla de tal manera que encontramos directamente, es decir 𝐹0,05 (4; 5) = 5,192 Respuesta: Si X es una variable aleatoria F, con 4 grados de libertad de numerador y 5 grados de libertad de denominador, entonces el quinto percentil superior es 5,192. 118 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán RELACIÓN ENTRE LA DISTRIBUCIÓN F DE FISHER Y SU INVERSA La definición de una variable aleatoria F de Fisher: F= 𝑋⁄𝑣1 𝑌⁄𝑣2 1 Implica que si la distribución 𝑊 es 𝐹(𝑣1 ; 𝑣2 ) entonces la distribución de es 𝐹(𝑣2 ; 𝑣1 ), es decir: 𝑊 1 𝐹1−𝛼 (𝑣1 ; 𝑣2 ) = 𝐹𝛼 (𝑣2 ; 𝑣1 ) 𝑣1 : Grados de libertad en el numerador 𝑣2 : Grados de libertad en el denominador Ejemplos 1.53. Sea X una variable aleatoria F con 4 grados de libertad de numerador y 5 grados de libertad de denominador. ¿Cuál es el primer percentil? SOLUCIÓN 𝑃(𝐹 < 𝐹4;5 ) = 0.01 El primer percentil, es el valor de F, de modo que la probabilidad a la izquierda de x es 0,01, y, por lo tanto, la probabilidad a la derecha de x es 0,99 (Ver gráfico) Puesto que no se puede encontrar directamente el valor en la tabla correspondiente, utilizamos la relación anterior, es decir, 𝐹0,99 (4; 5) está relacionado con 𝐹0,01 (5; 4) de la siguiente manera: 𝐹0,99 (4; 5) = 𝟏 𝐹0,01 (5; 4) El valor de 𝐹0,01 (5; 4) lo encontramos en la tabla y utilizando el resultado obtenido en la tabla, sustituyendo en la fórmula anterior tenemos: 𝐹0,99 (4; 5) = 1 15,522 = 0,064 Respuesta: Si X es una variable aleatoria F, con 4 grados de libertad de numerador y 5 grados de libertad de denominador, entonces el primer percentil es 0,064. 119 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Ejemplos 1.54. ¿Cuál es la probabilidad de que una variable aleatoria F con 4 grados de libertad del numerador y 5 grados de libertad del denominador sea mayor que 7.39? SOLUCIÓN 𝑃(𝐹 > 𝐹4;5 ) Como se observa en la tabla de F, para 4 grados de libertad en el numerador y 5 grados de libertad en el denominador al 0,025 se encuentre el valor de 7,39. Respuesta: Si X es una variable aleatoria F, con 4 grados de libertad de numerador y 5 grados de libertad de denominador, para valores de x mayores o iguales a 7 ,39 la probabilidad correspondiente es 0,025 (2,5%). 120 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán RELACION DE PROBLEMAS N 13 DISTRIBUCIÓN DE PROBABILIDADES DE UNA VARIABLE ALEATORIA F DE FISHER 1. Calcular los datos que faltan en las siguientes igualdades: a. 𝑃(𝐹3;5 > 12,06) b. 𝑃(𝐹5;3 <) = 0,01 2. Utilizando las tablas de la distribución F, hallar los valores críticos de: a. 𝐹11;15;0,05 b. 𝐹15;11;0,05 c. 𝐹11;15;0,95 d. 𝐹15;11;0,95 2. 3. Utilizando las tablas de la distribución F, hallar los valores críticos de: a. 𝐹5;1;0,01 b. 𝐹12;3;0,025 c. 𝐹7;2;0,05 d. 𝐹15;17;0,005 e. 𝐹30;20;0,05 f. 𝐹20;20;0,01 g. 𝐹15;20;0,005 4. Utilizando las tablas de la distribución F, hallar los valores críticos de: a. 𝐹3;6;0,95 b. 𝐹9;15;0,975 2. 5. Utilizando las tablas de la distribución F, hallar los valores de a y b que verifican 𝑃(𝑎 < 𝐹5;8 < 𝑏) = 0,90, siendo 𝑃(𝐹5;8 ≤ 𝑎) = 𝑃(𝐹5;8 ≥ 𝑏). 6. Utilizando las tablas de la distribución F, hallar los valores de a y b que verifican 𝑃(𝑎 < 𝐹7;12 < 𝑏) = 0,95, siendo 𝑃(𝐹7;12 ≤ 𝑎) = 𝑃(𝐹7;12 ≥ 𝑏). 121 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán ANEXOS TABLA DE DISTRIBUCIÓN BINOMIAL PUNTUAL 122 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 123 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 124 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán TABLA DE DISTRIBUCIÓN BINOMIAL ACUMULADA 125 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 126 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 127 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 128 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán TABLA DE DISTRIBUCIÓN DE POISSON PUNTUAL 129 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 130 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán TABLA DE DISTRIBUCIÓN DE POISSON ACUMULADA 131 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 132 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán TABLA DE DISTRIBUCIÓN DE LA DISTRIBUCION NORMAL ESTANDARIZADA 133 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 134 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 135 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 136 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 137 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán TABLA DE DISTRIBUCIÓN DE LA DISTRIBUCION T STUDENT 138 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán TABLA DE DISTRIBUCIÓN DE LA DISTRIBUCION CHI CUADRADA 139 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 140 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán TABLA DE DISTRIBUCIÓN DE LA DISTRIBUCION F 141 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 142 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 143 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad 144 Estadística aplicada a los Negocios I Lic. Luis Fernando Guerra Jordán