1 Investigación individual Ariel Josué Cedeño Rivero Tecnológico Universitario Argos Estadística Tedgy Kattyuska Loor Petter 12 de noviembre de 2024 2 Distribución de frecuencias La distribución de frecuencias, también conocida como tabla de frecuencias, es una herramienta estadística fundamental que organiza y resume un conjunto de datos al dividirlos en diferentes categorías o clases. Indica cómo un conjunto de datos se divide en varias categorías (o clases) al alistar todas las categorías junto con el número de valores de los datos que hay en cada una. Este tipo de distribución ayuda a entender cómo se comporta una variable de interés dentro de un conjunto de observaciones, permitiendo visualizar tendencias y patrones de manera más clara. Por ejemplo, al analizar la altura de una muestra de plantas, la distribución de frecuencias de esta variable permite determinar si, en promedio, las plantas son altas o bajas y si forman un grupo homogéneo o heterogéneo en términos de altura. Esto se relaciona con dos aspectos clave de los datos: el promedio, que proporciona una medida central o típica, y la variabilidad, que describe cuán dispersos o agrupados están los valores. Así, la distribución de frecuencias no solo facilita el resumen de datos en clases, sino que también permite hacer inferencias básicas sobre las características de la muestra observada. Tabla de frecuencias Una tabla de frecuencia es una herramienta estadística que organiza y resume un conjunto de datos en categorías, ofreciendo una visión más clara y estructurada de la información. Según Triola (2013), estas tablas son especialmente útiles para condensar grandes volúmenes de datos, lo que facilita su análisis posterior. No solo ayudan a entender mejor la distribución y el comportamiento de los datos, sino que también son fundamentales para crear gráficos como histogramas o gráficos de barras, que permiten una interpretación visual más sencilla. Para elaborar una tabla de frecuencias, se dividen los datos en intervalos o clases (por ejemplo, intervalos de 5 cm para la altura de plantas), cada uno con un límite inferior y superior que 3 define los valores que pertenecen a esa clase. En cada clase se registran las frecuencias absolutas, relativas y acumuladas, lo que facilita el análisis de patrones y tendencias en el conjunto de datos. Ejemplo: Pulsaciones de hombres y mujeres. Los médicos utilizan el pulso cardiaco para evaluar la salud de los pacientes. Cuando el pulso tiene una frecuencia demasiado baja o demasiado elevada, esto podría indicar que existe algún problema médico, ya sea Infección o deshidratación. Se realiza un estudio, con una muestra a conveniencia, con 40 hombres y 40 mujeres, de manera que se tomen el pulso en un minuto y se recolectaron los siguientes datos. Con base en la tabla anterior se puede observar que los datos se encuentran en una tabla, tal y como fueron recolectados, sin embargo, se puede realizar una tabla de frecuencias, que permita resumir la información. 4 Frecuencia absoluta La frecuencia absoluta se refiere al número de datos que pertenecen a una clase o categoría específica. Es un conteo directo de las observaciones que cumplen con las características de la clase, es decir, que se encuentran dentro de un intervalo o categoría definida. Este conteo requiere un análisis cuidadoso para evitar errores en la clasificación de los datos. Frecuencia relativa La frecuencia relativa muestra la frecuencia absoluta de una clase como una proporción o porcentaje del total de datos. Se calcula dividiendo la frecuencia absoluta de una clase entre el total de datos y multiplicando el resultado por 100 si se quiere en porcentaje. Este valor ayuda a entender cuán representativa es una clase en relación con el conjunto total de datos. 5 Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas de una clase y de todas las clases anteriores en la tabla. Su principal utilidad es garantizar que todos los datos han sido considerados en el análisis, lo que permite una verificación rápida de la inclusión total de los datos. Gráficos Histograma Un histograma es uno de los gráficos más comunes en estadística, utilizado para mostrar la distribución de frecuencias de datos cuantitativos. Aunque se asemeja a un gráfico de barras, se aplica específicamente cuando los valores de la variable tienen un orden natural o continuo, lo que permite organizar los intervalos de menor a mayor en el eje horizontal. Cada barra en un histograma representa un intervalo o clase, y su altura refleja la frecuencia de datos en ese rango, ya sea en términos absolutos, relativos o porcentuales. Cuando se dispone de una gran cantidad de datos numéricos, estos se agrupan en intervalos y se cuenta cuántos valores caen en cada uno, proporcionando así una representación visual que facilita la interpretación de patrones en los 6 datos. Al ajustar la amplitud de los intervalos, los histogramas pueden mostrar con mayor claridad la forma de la distribución de los datos. En muchos casos, un histograma revela una curva característica, como la forma de campana de la distribución normal o gaussiana, lo que permite inferir un modelo teórico de probabilidad para la variable en estudio. Gráfico de una línea Gráfico de una línea o gráfico de línea simple es una representación visual que ilustra cómo cambia un solo indicador o variable a lo largo del tiempo o en relación con una serie de valores. En este tipo de gráfico, los puntos que corresponden a cada valor de la serie se conectan mediante una línea, lo que permite observar la tendencia y las fluctuaciones del fenómeno analizado. Es muy utilizado en el análisis de series temporales, ya que ayuda a identificar patrones, como aumentos, disminuciones o ciclos en los datos. 7 Gráfico de barras compuestas Este tipo de gráfico se conoce como gráfico de barras agrupadas o apiladas. Se utiliza para comparar la magnitud de dos o más variables dentro de un mismo conjunto de categorías, utilizando barras que representan cada variable y que se superponen o agrupan en un solo eje. Estos gráficos pueden presentarse en orientación vertical u horizontal y muestran los valores de cada variable en cifras absolutas o relativas, lo que facilita la comparación directa entre los componentes de cada categoría. Son especialmente útiles para visualizar cómo contribuyen las diferentes variables al total o para comparar proporciones entre varias categorías. 8 Gráfico circular Este tipo de gráfico se conoce como gráfico de barras agrupadas o apiladas. Se utiliza para comparar la magnitud de dos o más variables dentro de un mismo conjunto de categorías, utilizando barras que representan cada variable y que se superponen o agrupan en un solo eje. Estos gráficos pueden presentarse en orientación vertical u horizontal y muestran los valores de cada variable en cifras absolutas o relativas, lo que facilita la comparación directa entre los componentes de cada categoría. Son especialmente útiles para visualizar cómo contribuyen las diferentes variables al total o para comparar proporciones entre varias categorías. Variables cualitativas y cuantitativas Las variables cualitativas, también llamadas categóricas, se refieren a características o cualidades que no se pueden medir numéricamente, sino que se organizan en categorías o clases. Estas variables describen atributos como el color, el género, el tipo de comida o el estado civil, y se dividen en: 9 Nominales: No presentan un orden o jerarquía entre las categorías (por ejemplo, el color de un coche: rojo, azul, verde). Ordinales: Las categorías tienen un orden o jerarquía, pero la diferencia entre ellas no se puede cuantificar (por ejemplo, nivel de satisfacción: bajo, medio, alto). Las variables cuantitativas, por otro lado, son aquellas que se pueden medir y expresar mediante números. Estas variables se dividen en: Discretas: Son aquellas que toman valores enteros y finitos, generalmente contables (por ejemplo, el número de hijos de una persona). Continuas: Son aquellas que pueden asumir cualquier valor dentro de un rango o intervalo, y pueden ser medidas con gran precisión (por ejemplo, la altura de una persona, la temperatura o el peso). Diagrama de tallo y hojas Una gráfica de tallos y hojas es una representación visual de un conjunto de datos numéricos que facilita la comprensión de su distribución y organización. En este tipo de gráfico, los datos se dividen en dos partes: el "tallo" representa las cifras más significativas (como las decenas o miles), mientras que la "hoja" muestra las cifras menos significativas (como las unidades o décimas). Así, cada valor del conjunto de datos se descompone en un "tallo" y una "hoja", lo que ayuda a visualizar la distribución y a identificar tendencias en los datos. Su aspecto es similar al de un histograma, pero en lugar de utilizar barras, organiza cada valor en 10 "tallos" y "hojas" alineados. Los "tallos" se agrupan verticalmente y las "hojas" se disponen horizontalmente, lo que permite una representación compacta y eficiente. Además, las gráficas de tallos y hojas mantienen los valores individuales de los datos, a diferencia de los histogramas, que agrupan los datos en intervalos. Consideremos el siguiente conjunto de datos: A continuación, se separa el dígito menos significativo del resto de los dígitos mediante una línea vertical, por ejemplo, el primer valor 126 se separa en 12 | 6. Se puede entonces conformar un diagrama como se muestra en la Fi gura 3.13, en donde se han ordenado los dígitos separados de menor a mayor, incluyendo repeticiones 11 Medidas de Centralización o Medidas de Tendencia Central Las medidas de centralización, también conocidas como medidas de tendencia central, son estadísticas que intentan describir el "centro" o la tendencia central de un conjunto de datos. Estas medidas ayudan a comprender el comportamiento de los datos y proporcionan una representación numérica que resume cómo se distribuyen los datos alrededor de un valor central. Las tres medidas principales de tendencia central son la media, la mediana y la moda. Las medidas de tendencia central son valores que intentan identificar el punto medio de un conjunto de datos. Estas medidas son útiles para resumir y entender de forma clara la distribución de los datos, ya que proporcionan un valor que representa el "centro" de los datos analizados. Media aritmética La media aritmética es el promedio de un conjunto de datos, calculándose al sumar todos los valores y dividir el resultado entre la cantidad total de datos. Fórmula de la media aritmética: donde: • ∑xi, es la suma de todos los valores del conjunto de datos. • n es el número total de observaciones o datos Propiedades de la media aritmética. Las principales propiedades de la media aritmética son: 12 1. Suma de las desviaciones: La suma de las desviaciones (diferencias entre cada valor y la media) es siempre cero. 2. Sensibilidad a los valores extremos: La media es muy sensible a los valores atípicos o extremos. Un valor muy alto o muy bajo puede afectar considerablemente el promedio. 3. Es única: Para un conjunto de datos dado, siempre existe una única media. 4. Es de fácil interpretación: Debido a su simplicidad, la media es fácil de calcular e interpretar. Media para datos agrupados Cuando se trabaja con datos agrupados en intervalos o clases, la media se calcula utilizando los puntos medios de cada clase, ya que no se dispone de los valores exactos. La fórmula es la siguiente: donde: • fi es la frecuencia de la clase i. • xi, es el punto medio de la clase i. • ∑fi es la suma total de las frecuencias. 13 Mediana La mediana es el valor que ocupa el centro de un conjunto de datos cuando están ordenados de menor a mayor. Si hay un número impar de datos, la mediana es el valor central. Si hay un número par de datos, la mediana se obtiene promediando los dos valores centrales. Para datos agrupados, la mediana se calcula utilizando la siguiente fórmula: donde: • L es el límite inferior de la clase mediana. • n es el número total de observaciones. • F es la frecuencia acumulada de la clase anterior a la clase mediana. • f es la frecuencia de la clase mediana. • w es el ancho del intervalo. 14 Moda La moda es el valor que se presenta con mayor frecuencia en un conjunto de datos. A diferencia de la media y la mediana, que se enfocan en el valor central de los datos, la moda simplemente señala el valor o los valores que aparecen con más frecuencia. Para datos agrupados, la moda se calcula utilizando la siguiente fórmula, que se basa en la clase modal (la clase con la mayor frecuencia): donde: • L es el límite inferior de la clase modal. • f1 es la frecuencia de la clase modal. • f0 es la frecuencia de la clase anterior a la clase modal. • f2 es la frecuencia de la clase posterior a la clase modal. • w es el ancho del intervalo. Media geométrica La media geométrica es una medida de tendencia central que se utiliza principalmente para conjuntos de datos que son productos de una serie de factores, como tasas de crecimiento o rendimientos multiplicativos. Se calcula multiplicando todos los valores y luego tomando la raíz n-ésima, donde n es el número de valores. Fórmula de la media geométrica: 15 donde x1, x2, ……, xn son los valores del conjunto de datos. La media geométrica es útil cuando los datos tienen grandes variaciones o cuando los valores son tasas o índices que se multiplican entre sí, como en el cálculo de tasas de interés o crecimiento económico. 16 Referencias: Triola, M. F. (2018). Estadística. http://librodigital.sangregorio.edu.ec/librosusgp/B0038.pdf Gamarra Astuhuaman, G., Wong Cabanillas, F., Pujay Cristobal, O. E., & Rivera Espinoza, T. A. (2015). Estadística e investigación con aplicaciones de SPSS. http://librodigital.sangregorio.edu.ec/librosusgp/B0031.pdf Salazar P., C., & Del Castillo G., S. (2018). Fundamentos básicos de la estadística. http://librodigital.sangregorio.edu.ec/librosusgp/B0009.pdf Newbold, P., Carlson, W. L., & Thorne, B. (2008). Estadística para administración y economía. https://fad.unsa.edu.pe/bancayseguros/wpcontent/uploads/sites/4/2019/03/Estadistica-para-administracion-y-la-economia.-6Ed.-Newbold2008.pdf
0
You can add this document to your study collection(s)
Sign in Available only to authorized usersYou can add this document to your saved list
Sign in Available only to authorized users(For complaints, use another form )