Uploaded by Anthony Mora Esquivel

I exa bioest II 2020 (1)

advertisement
Bioestadı́stica, ISOA-1121
Profesor: Pedro Sandoval Alvarado
II Cuatrimestre 2020
Primer Examen Parcial
Valor: 30%
Puntaje Total: 75 puntos
Instrucciones Generales para el Estudiante:
1. Este examen es una prueba que debe ser desarrollada de forma individual, en caso de
comprobarse de que existen respuesta iguales, se iniciará el proceso según los estatutos
correspondientes.
2. La solución de examen debe ser realizada en computador, y la parte numérica debe ser
realizada mediante editor de ecuaciones. El tiempo de entrega ya toma en cuenta este
requisito.
3. Cualquier criterio o suposición realizada para resolver esta prueba debe quedar en la
solución final.
4. La solución a esta prueba debe ser entregada únicamente en formato pdf mediante la
plataforma classroom, a más tardar el dı́a sábado 18 de julio del 2020 a las 10PM.
5. Por favor tome en cuenta que por cada 10 minutos de retraso en la entrega de la
solución, se le restarán 5 puntos de su calificación final, hasta alcanzar el lı́mite inferior
que será de 20.
A continuación se le presentan una serie de preguntas que deben ser resueltas de forma
individual. Utilice los mejores conceptos que tenga para justificar su respuesta, una respuesta
sin justificación, no podrá ser puntuable.
1. Dado un conjunto de n datos (x1 , x2 , . . . , xn ). Existe un valor c, que tiene la caracterı́stica de minimizar la suma de las distancias de ese valor a los n datos, d(x1 − c) +
d(x2 −c)+· · ·+d(xn −c) : ¿Qué nombre recibe este valor c?, De una posible explicación
de este comportamiento.
3 puntos.
2. Para un conjunto de datos con una marcada asimetrı́a positiva, ¿Donde se espera
encontrar una mayor cantidad de datos, por encima o por debajo de la mediana?
Explicar las razones.
3 puntos
3. Para un conjunto de datos, ¿qué nos sugiere el que la distancia entre los dos primeros
cuartiles (Q2 − Q1 ), sea mucho menor que la distancia entre los últimos cuartiles
(Q4 − Q3 )? Justifique su respuesta.
3 puntos
4. Para un conjunto de datos expresados en Kg, ¿en qué unidades viene expresada la
varianza?. Ahora, al tomar otro conjunto de datos que están expresados en metros m,
¿se podrı́an comparar estas varianzas? Justifique su respuesta
1 punto
1
Bioestadı́stica, ISOA-1121
Profesor: Pedro Sandoval Alvarado
II Cuatrimestre 2020
5. Para un conjunto de datos correspondiente a una variable cuantitativa continua, se
construye un diagrama de cajas de forma manual o mediante un software, y se brinda
la siguiente afirmación: El primer cuartil, Q1 , siempre coincide exactamente con el
valor de uno de los datos del conjunto. Está de acuerdo o en desacuerdo con esta
afirmación, debe justificar su respuesta.
2 puntos
6. En un test diagnóstico se indica que el valor predictivo negativo es del 95%, y se afirma
que:
(a) El 95% de las personas a las que se somete el test dan negativo.
(b) El 95% de las personas que dan negativo en el test tienen la enfermedad.
(c) El 5% de las personas que dan negativo en el test tienen la enfermedad.
(d) El 5% de las personas que tienen la enfermedad dan negativo en el test.
En cada uno de los casos anteriores, debe justificar si las afirmaciones son verdaderas
o falsas.
3 puntos
A continuación se le presentarán una serie de problemas a los cuales debe dar solución de
una forma detallada. Por favor no omita ningún paso, dado que esto ayuda a que el docente
pueda calificar de una mejor forma.
1. En este ejercicio se le solicita que cree un test diagnóstico, debe ser original, con
aplicación a su campo profesional (esto es un punto muy importante que será tomado
en cuenta en la calificación). Deberá indicar lo siguiente:
(a) Valor de la sensibilidad del test
(b) Valor de la especificidad del test
(c) Valor predictivo positivo del test
(d) Valor predictivo negativo del test
(e) Valor de la prevalencia de la variable a estudiar
(f) La probabilidad de tomar un individuo al azar y dado que el resultado del test
dio positivo, que esté sano.
Debe justificar la elección de cada uno de los valores anteriores, por ejemplo, porque
razón elegı́ un valor de sensibilidad de xyz. Como ya se imaginará, para algunos de los
ı́tem anteriores, deberá realizar algunos cálculos, que deben ser detallados. En caso de
que consulte fuentes bibliográficas deberá indicar la referencia respectiva. No olvide
que debe ser aplicado al área de estudio.
10 puntos
2. Usted trabaja para una empresa y tiene a cargo el consultorio médico. El doctor un
dı́a le realiza la siguiente consulta a usted como ingeniera o ingeniero: ”. . . observé,
en una revista especializada de bioestadı́stica, que unos investigadores propusieron un
modelo aproximado sobre el comportamiento de las incapacidades para un cierto tipo
de empresa”. La función que el médico le enseña es el siguiente:
Bioestadı́stica, ISOA-1121
Profesor: Pedro Sandoval Alvarado
II Cuatrimestre 2020
f (x) =
k(2x − x2 )
0<x<2
0
en otro caso
El médico continúa diciendo: ”. . . me gustarı́a saber el valor de k para que f (x) sea
una función de probabilidad, cuya variable aleatoria X representa el comportamiento
de las incapacidades en un empresa similar a esta”.
10 puntos
3. En un estudio de suicidas, Gibbons et al. encontraron que la distribución mensual
de adolescentes suicidas en el condado de Cook, Illinois, entre 1977 y 1987 siguió una
distribución de Poisson con parámetro λ = 2.75. Se debe:
10 puntos
(a) Determine la variable y el tipo de variable aleatoria X de este estudio.
(b) ¿Cómo pudieron determinar los investigadores que esta variable aleatoria X sigue
una distribución de Poisson y no una Binomial o de Bernoulli? Explique
(c) ¿Cuál es la probabilidad de que en un mes seleccionado de forma aleatoria sea
uno en el que no ocurrirán suicidios? Interprete el resultado.
(d) Determine P (1 < X ≤ 4) siendo X la variable aleatoria, interprete ese valor.
4. Si el nivel total de colesterol en cierta población tiene una distribución aproximadamente normal, con una media de 200 mgl/100 ml y una desviación estándar de 20
mg/100 ml, calcule la probabilidad de que un individuo, elegido al azar de entre esa
población, tenga un nivel de colesterol:
10 puntos
(a) ¿Cuál es la variable aleatoria? ¿Es discreta o continua?, justifique
(b) P (180 < X < 200), e interprete
(c) Menor que 150 mg/100 ml, e interprete
(d) Entre 190 y 210 mg/ml, e interprete
5. Se pretende estimar la concentración media de bilirrubina indirecta en el suero en
niños de cuatro dı́as de nacidos. La media para una muestra de 16 niños es de 5, 98
mg/100 cc y la desviación estándar para esa muestra es de 3, 5 mg/100 cc. Considérese
que la concentración de bilirrubina en los niños de cuatro dı́as de nacidos sigue una
distribución aproximadamente normal. Se debe:
10 puntos
(a) Determine el intervalo de confianza para la media de la población con nivel de
significación α = 5%. Interprete este resultado desde un punto de vista probabilı́stico.
(b) Determine el intervalo de confianza para la media de la población con nivel de
significación α = 1%. Interprete el resultado desde un punto de vista práctico.
(c) ¿Que hubiera pasado si no se tuviera información sobre la distribución que toma
la variable aleatoria X en la población.
Bioestadı́stica, ISOA-1121
Profesor: Pedro Sandoval Alvarado
II Cuatrimestre 2020
(d) ¿Cual es la variable aleatoria X?
(e) Explique, con justificación teórica adecuada, la razón de que los intervalos, calculados en los puntos (a) y (b) tengan amplitudes distintas.
6. Investigadores afirman que la N-nitrosobis (2-oxopropyl) amina (BOP) y las nitrosaminas (3-oxidizadas) producen una alta incidencia de tumores de conductos pancreáticos
en el hámster dorado sirio. Estudiaron los efectos en el peso sanguı́neo, en la glucosa
del plasma, en la insulina y en los niveles de transamina glutamico-oxaloacetica del
plasma (GOT) de los hámsteres expuestos en vivo a la BOP. Los investigadores reportaron. Los investigadores reportaron que 8 animales tratados presentaron niveles de
glucosa en el plasma sanguı́neo de 105 mg/gl con una desviación estándar de 5 mg/gl.
Por otro lado se analizaron 12 animales, sin tratamiento, donde el nivel promedio de
la glucosa en el plasma fue de 76 mg/gl con una desviación estándar de 6 mg/gl. Se
debe:
10 puntos
(a) Determinar la variable aleatoria X del estudio e indicar si es continua o discreta.
(b) Construya un intervalo de confianza para la diferencia de las medias poblacionales
con nivel de significación α = 5%. ¿Existen diferencias significativas entre las
medias de las poblaciones?.
(c) ¿Indique que suposición se debe debió realizar para construir el intervalo del punto
(b).
(d) Determine para que puede servir, a los investigadores, el resultado del punto (b).
Download