3.3 Recopilación y tratamiento de respuestas de la encuesta 3.3.1 Recopilación de respuestas Cuando se ha terminado la aplicación de la encuesta se deberá preparar la etapa del procesamiento de la información, donde será necesario cerrar las preguntas abiertas (si las hubo) y tabular las respuestas. Para el procesamiento de datos e información recabados en una encuesta existen diversos métodos, cuya utilización está condicionada por el tamaño de la muestra, el número de preguntas del instrumento, las formas de presentación requeridas y el tipo de análisis que se pretende realizar, así como por los recursos financieros y materiales disponibles. En la actualidad es muy frecuente auxiliarse de medios electrónicos para resolver problemas de cualquier tipo. Sin embargo, cuando se trata de volúmenes reducidos de información es más sencillo y económico valerse de procedimientos manuales o mecánicos para realizar esta fase. En primera instancia, aprender cómo recolectar respuestas de una encuesta es sumamente importante para que los mercadólogos obtengan los puntos clave que requieren y entiendan qué es lo que piensa su mercado meta. Al proceso de recopilación y vaciado de respuestas obtenidas en una encuesta en una matriz se le llama tabulación. Una buena matriz de respuestas debe tener: • • • • Títulos y encabezamientos claros y completamente definidos. Unidades en que se expresa la medición. Información que permita chequear la validez de los cálculos o argumentos. Fuentes de datos cuando corresponda. Cuando la muestra no es muy grande y resulta difícil disponer de medios electrónicos o mecánicos para procesar la información, el investigador debe valerse de la tabulación manual para construir sus tablas o cuadros estadísticos. El procedimiento empleado habitualmente consiste en utilizar hojas tabulares en las que se concentra la información, colocando en el lado izquierdo el número del cuestionario que se tabula y en la parte superior las preguntas. El procedimiento de tabulación consiste en los siguientes pasos: 1. Formar una tabla con tantas columnas como preguntas tenga el cuestionario y filas de acuerdo con la cantidad de encuestas aplicadas. Cada una de las columnas está dividida según el número de las opciones de respuesta de la pregunta, como se muestra en la figura: Tabla 1. Ejemplo de formato para la tabulación de una encuesta. 2. Leer cada cuestionario y se coloca un “1” en la celda que corresponda a la respuesta dada por el encuestado. 3. Obtener la suma por cada columna. Tabla 2. Ejemplo de llenado del formato pata la tabulación de encuest as 3.3.2 Tratamiento para preguntas con respuestas cuantitativas Cuando se efectúa un estudio de mercado por lo general los datos obtenidos en la recopilación no pueden ser utilizados para un análisis o interpretación ya que generalmente se encuentran desordenados. Para que las respuestas de una encuesta sean útiles deben “trabajarse” a través de procedimientos estadísticos que permitirán descubrir y entender el comportamiento del mercado meta; este tratamiento de datos se realiza en tres bloques: la construcción de la tabla de distribución de frecuencias, la obtención de las medidas de tendencia central y la graficación. En las siguientes páginas se explicará el proceso de cada uno. Leer con mucha atención. a) Distribución de frecuencias En estadística, se le llama distribución de frecuencias al ordenamiento y a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. El instrumento que permite ordenar los datos de manera que se presentan numéricamente las características de la distribución de un conjunto de datos recibe el nombre de tabla de frecuencias. Ésta consiste en el resumen tabular donde se muestra los eventos de cada una de las varias clases; su objetivo es proporcionar una perspectiva de los datos. Se explicará el proceso para construir la tabla de distribución de frecuencias por medio de un ejemplo, el cual parte de la siguiente situación: Una empresa agrícola desea exportar los frutos del zapallo; para ello, la norma de calidad dice que éstos deben tener un peso de 1.70kg con un margen de tolerancia de +/-0.30 kg. El personal de calidad, encargado de evaluar el peso de los frutos de la parcela de zapallo, tomó una muestra de 30 frutos: Paso 1. Determinar el rango. a) En los datos originales, se deberá identificar el valor máximo y el valor mínimo. b) El rango (r) es la diferencia entre el dato mayor y el dato menor del conjunto de datos. Paso 2. Definir el número de clases. Las clases son los intervalos en que se divide la característica sobre la que se han tomado los datos, por lo que el número de intervalos (K) es la cantidad de clases a trabajar en la tabla, es decir, el número de subgrupos en los que se dividirán los datos. Para definir las clases se puede utilizar cualquiera de las siguientes fórmulas, donde K es la cantidad de intervalos o número de clases y n el número de datos. Al aplicar las fórmulas en el ejemplo, se obtiene: Observe que el resultado se redondea al número o cifra decimal conveniente para el manejo de las clases. Dependiendo del número de clases en que se agrupen los datos se perderá más o menos información tratando de identificar la pauta de comportamiento. aso 3. Obtener la amplitud del intervalo (W). La amplitud de intervalos (w) se obtiene al dividir el rango (r) entre el número de intervalos deseados (K). Todas las clases deberán tener el mismo intervalo y no puede haber solapamiento entre las distintas clases. Para el ejemplo, se tomará K=6, por lo que: Si es necesario, esta amplitud se redondea a un número o cifra decimal conveniente para el manejo de las clases. Paso 4. Construir las clases. Una clase es un intervalo de números reales comprendidos entre otros dos datos: a y b, que reciben el nombre de extremos o límites del intervalo. Existen dos tipos de límites: el abierto (a, b), significa que los números que conforman el intervalo serán mayores que a y menores que b; y cerrado [a, b], quiere decir que los números que integran el intervalo serán mayores o iguales que a y menores o iguales que b. Para construir las clases se debe realizar lo siguiente: a) Dibujar la tabla de frecuencias. Se deberá trazar una tabla con nueve columnas y cantidad de filas de acuerdo con el número de intervalos más dos extras. Las primeras dos columnas se rotulan con los nombres “número de intervalo” y “clase”. b) Establecer los límites de cada clase. Se refiere a la cantidad de datos que comprende una categoría, la cual está delimitada por el límite inferior y el límite superior. • • El límite inferior (Li) de un intervalo corresponde al valor mínimo que puede incluirse en el intervalo. El límite superior (Ls) de un intervalo corresponde al valor máximo que puede incluirse en el intervalo. Para representar los intervalos se usan paréntesis ( ) y corchetes [ ]: • • • • La primera clase será un intervalo cerrado que partirá del valor mínimo de los datos y se le sumará la amplitud del intervalo. En el ejemplo, sería: 1.10 + 0.15, quedado [1.10-1.25] La segunda clase será un intervalo con límite inferior abierto y límite superior cerrado, que partirá del límite superior de la primera clase y se le sumará la amplitud del intervalo. En el ejemplo, sería: 1.25 + 0.15, quedado (1.25-1.40] La tercera clase será un intervalo con límite inferior abierto y límite superior cerrado, que partirá del límite superior de la segunda clase y se le sumará la amplitud del intervalo. En el ejemplo, sería: 1.40 + 0.15, quedado (1.40-1.55] Y así sucesivamente hasta completar el número total de intervalos. c) Calcular la marca de clase (Xi). Se refiere al punto medio de un intervalo y se obtiene sumando el límite superior (Ls) más el límite interior (Li) entre 2, en cada intervalo. El resultado se anota en la tercera columna de la tabla de frecuencias Aplicado al ejemplo: - Para el intervalo 1: Xi= (1.10+1.25)/2= 1.175 @ 1.18 - Para el intervalo 2: Xi= (1.25+1.40)/2= 1.325 @ 1.33 - Y así sucesivamente hasta completar el número total de intervalos. Paso 5. Contabilizar la frecuencia absoluta de cada clase. En la cuarta columna de la tabla de frecuencias se señala, para cada intervalo o clase, la cantidad de datos cuyos valores pertenecen al intervalo, conocida como frecuencia absoluta (fi). Para ello, se deberá contar el número de datos que están incluidos en cada una de las clases. Para el recuento se debe empezar con el primer dato de la lista e identificar la clase en la cual está incluido y señalar para dicha clase, un "palote". Repetir el mismo proceso para cada dato del conjunto. Al final se recomienda comprobar que el número total de datos de la muestra es igual a la suma de las frecuencias de cada clase. En el ejemplo: - Para el intervalo 1: Paso 6. Obtener la frecuencia relativa de cada intervalo. La frecuencia relativa (fr) es la razón que se obtiene al dividir la frecuencia absoluta (fi) de un intervalo entre el número total de datos de la muestra (n); es decir: Paso 7. Obtener la frecuencia acumulada de cada intervalo. En la sexta columna de la tabla de distribución de datos agrupados se coloca la frecuencia acumulada (fa), que se obtiene al sumar la frecuencia absoluta de un intervalo con la anterior. Continuando con el ejemplo: ▪ ▪ Primer intervalo = frecuencia absoluta del primer intervalo, en este caso, 3 Segundo intervalo = frecuencia acumulada del primer intervalo + frecuencia absoluta del segundo intervalo; es decir, 3 + 4 = 7 ▪ ▪ Tercer intervalo = frecuencia acumulada del segundo intervalo + frecuencia absoluta del tercer intervalo; o sea, 7 + 5 = 12 Y así sucesivamente hasta llegar a acumular el total de datos de la muestra. Paso 8. Obtener la frecuencia relativa acumulada de cada intervalo. En la séptima columna de la tabla se anota la frecuencia relativa acumulada (FR), que se obtiene al dividir la frecuencia acumulada (fa) del intervalo entre el total de datos de la distribución (n); es decir: Paso 9. Obtener la frecuencia porcentual de cada intervalo. En la octava columna de la tabla de datos agrupados se coloca la frecuencia porcentual (f%) que se obtiene al multiplicar la frecuencia relativa (fr) de cada intervalo por 100. Al final se recomienda comprobar que la suma de la frecuencia porcentual sea igual a 100%. Observa el ejemplo: Paso 10. Obtener la frecuencia acumulada de cada intervalo. porcentual En la última columna se coloca el resultado de la frecuencia porcentual acumulada (F%), que es la frecuencia relativa acumulada (FR) multiplicada por 100, como se aplica en el ejemplo: b) Medidas de tendencia central para datos agrupados Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos ordenados según su magnitud y permiten al investigador resumir en un sólo valor el comportamiento de una muestra. Las medidas de tendencia central más utilizadas son: media, mediana y moda, las cuales representan el punto medio o centro alrededor del cual se encuentra ubicado todo el conjunto de los datos analizados. La media aritmética También se le conoce como promedio y se refiere a la suma de todos y cada uno de los valores de la frecuencia absoluta dividida entre el total de datos de la muestra. Existen diversas fórmulas para obtener la media aritmética, pero para un conjunto de datos agrupados la más usual es: Retomando el ejemplo de la tabla de distribución de frecuencias, se tiene que: ▪ ▪ ▪ ▪ ▪ Se agrega una columna a la tabla, donde se anotará el producto xifi. Para el primer intervalo: (xi)(fi) = (1.18)(3) = 3.54 Para el segundo intervalo: (xi)(fi) = (1.33)(4) = 5.32 Y así hasta acabar con los intervalos. En la fila “Total” se suma la columna xifi Lo cual significa que el peso promedio de los zapallos es de 1.57 kilogramos, por lo que cumplen con la norma de calidad para su exportación. La mediana Es el valor que ocupa la posición central en un conjunto de datos, que deben estar ordenados, de esta manera la primera mitad de las observaciones es menor que la mediana y la segunda mitad es mayor que la mediana; este dato resulta muy apropiado cuando se poseen observaciones extremas. La mediana es una cuantila (punto tomado de un intervalo regular de la función de distribución de una variable aleatoria) que permite obtener el valor central en una serie de datos numéricos; en otras palabras, la mediana es la medida o el valor que divide la serie de datos en dos partes iguales: por arriba de ella se encuentra el 50 por ciento de los casos y por debajo el 50 por ciento restante. Para obtener la mediana de un conjunto de datos agrupados se utiliza la fórmula: La moda La moda es el valor de un conjunto de datos que aparece con mayor frecuencia. En una serie simple la moda se obtiene observando el valor que aparece más veces, pero en un conjunto agrupado se debe emplear la siguiente fórmula: c) Representación gráfica Un gráfico o una representación gráfica son un tipo de presentación de datos, generalmente numéricos, mediante recursos gráficos como líneas, vectores, superficies o símbolos, para que se manifieste visualmente la relación matemática o correlación estadística que guardan entre sí. Las tablas estadísticas representan toda la información de modo esquemático y están preparadas para los cálculos posteriores. Los gráficos estadísticos transmiten esa información de modo más expresivo y permiten, con un sólo golpe de vista, entender de qué se habla, observar las características más importantes, incluso sacar alguna conclusión sobre el comportamiento de la muestra donde se está realizando el estudio. Se debe tomar en cuenta que “datos” no es igual que “información”; los datos son numéricos, son cuantitativos, con ellos se llevan a cabo operaciones matemáticas; en cambio, la información es de carácter cualitativo, como propiedades, cualidades o características de un objeto. De acuerdo con el tipo de datos o información que se maneje en el estudio de mercado, las gráficas que se pueden emplear son: Histograma El histograma es una gráfica de barras o rectángulos que muestra la distribución de un conjunto de datos. Cada barra representa un subconjunto de los datos y se dibujan una pegada a la otra, es decir, no hay espacio entre las barras. Se construye utilizando los límites de cada uno de los intervalos, representados en el eje de las abscisas, y la altura de los rectángulos corresponde a la frecuencia absoluta, indicada por el eje de las ordenadas. En conjunto, el histograma muestra la acumulación o tendencia de un conjunto de datos para analizar su comportamiento. Retomando el ejemplo de los zapallos: Paso 1. Dibujar y rotular los ejes. Trazar un eje de coordenadas. El eje vertical representa la frecuencia absoluta, por tanto, en él se rotularán números naturales, dependiendo su valor y en la escala que se considere más adecuada. El eje horizontal representa la magnitud de la característica medida por los datos. Este eje se divide en tantos segmentos iguales como clases se hayan definido y rotular los límites de los intervalos de clase. Posteriormente se debe rotular cada eje con la característica representada y las unidades de medida empleadas, así como asignar el título al gráfico. Paso 2. Dibujar el histograma Dibujar las barras verticales correspondientes a cada clase. Su base está situada en el eje horizontal y su altura corresponderá a la frecuencia absoluta de la clase representada. Paso 3: Rotular el gráfico Cuando proceda, poner el título, las condiciones en que se han recogido los datos, los límites de tolerancia nominales, etcétera. Estas notas ayudan a los demás a interpretar el gráfico y sirven de recordatorio de la fuente de los datos. Cuando sea el caso, para concluir la elaboración del histograma es muy importante marcar el margen de tolerancia indicado en los parámetros de calidad, pues esto apoyará al análisis de la tendencia de los datos. En el ejemplo, para poder exportar zapallos, éstos deben pesar 1.70 kg, con un margen de tolerancia de +/-0.30 kg, es decir, que se aceptan frutos de 1.40 kg a 2 kg. En la gráfica se representarán dichos valores con líneas verticales nacientes del eje de las abscisas, como se muestra: De esta forma se puede observar que una gran parte de la cosecha de zapallos cumple con el requisito para ser vendida en el extranjero. Polígono de frecuencias Si en el histograma se colocan las marcas de clase (Xi), en el punto medio de cada barra, y se unen los puntos medios de la parte superior de cada barra, se obtiene otra representación gráfica conocida como polígono de frecuencias. El polígono de frecuencia es una gráfica de línea que representa la distribución de un conjunto de datos construidas sobre sus marcas de clase. Para construirlo: 1. Se agrega un intervalo al principio y al final con frecuencia cero. 2. Se localizan las marcas de clase de cada intervalo y se proyecta hasta la parte superior de la barra de acuerdo con la frecuencia absoluta. 3. Se unen los puntos. Utilizando el mismo caso: Ojiva Este es un tipo de gráfico de frecuencia, conocido también como polígono de frecuencia acumulada. Una ojiva muestra la curva de una función de distribución acumulativa. Los puntos trazados son el límite superior de la clase y la frecuencia acumulada correspondiente. Sirve para dar el número (o proporción) de observaciones más pequeño o igual a un valor particular. Para su construcción: 1. Se traza un sistema de ejes perpendiculares. En el eje horizontal se colocan los límites superiores de los intervalos de clase y en el eje horizontal se coloca la escala que represente a la frecuencia acumulad de la tabla de frecuencias. 2. En cada uno de los valores límite, se determina la altura igual a la frecuencia acumulada correspondiente a ese valor. 3. Se unen los puntos sucesivos por segmentos de línea, obteniendo una línea llamada ojiva. Retomando el ejemplo inicial: 3.3.3 Tratamiento de preguntas con respuestas cualitativas Cuando en los resultados de una encuesta se obtienen valores cualitativos, su tratamiento consistirá en dos etapas: la clasificación de la información en varias categorías o clases que correspondan a las cualidades, valores o atributos del objeto que está en estudio y la graficación. Por ejemplo: Una agencia de autos registró los colores de los vehículos que solicitaron sus clientes para saber cuál es el de mayor agrado y tenerlo en disponibilidad, obteniendo los siguientes valores: En este caso, el primer paso para organizar la información consiste en identificar las categorías o clases que la conformen y efectuar el conteo para obtener la frecuencia absoluta de cada cualidad registrada. Ejemplo: Enseguida se realiza la tabla de distribución de frecuencia simple, tal como se revisó en el apartado anterior: ▪ ▪ ▪ ▪ ▪ Frecuencia relativa (fr): se obtiene dividiendo la frecuencia absoluta de la categoría entre el número total de registros. La suma de todas las frecuencias relativas del conjunto de datos debe ser igual a 1. Frecuencia acumulada (fa): se obtiene sumando la frecuencia absoluta de la categoría con la frecuencia absoluta de los intervalos anteriores. La frecuencia acumulada de la última clase debe corresponder al número total de registros. Frecuencia relativa acumulada (FR): se obtiene dividiendo la frecuencia acumulada de cada categoría entre el número total de registros. Frecuencia porcentual (f%): es la frecuencia relativa de una categoría multiplicada por 100, cuyo valor representa el porcentaje de registros que contiene cada clase. Frecuencia porcentual acumulada (F%): es la frecuencia relativa acumulada de una categoría al multiplicarla por 100; su valor representa el porcentaje acumulado de registros que se encuentran hasta cierta clase. Para el caso de este ejemplo: Una vez que han sido agrupadas las respuestas obtenidas en la investigación de mercado, se pueden utilizar para obtener algunas conclusiones directamente de la tabla de distribución de frecuencias, o bien, se pueden representar mediante una gráfica, ya que su representación por sí sola mostrará el comportamiento de dichos datos. Como se mencionó en el apartado anterior, para la representación de información existen tres gráficas: barras, pictograma y círculograma. Gráfica de barras Consiste en ejes perpendiculares donde se trazan una serie de rectángulos cuyas bases se encuentran sobre el eje horizontal, correspondiendo a cada una de las clases o categorías, y cuya altura se indica en el eje vertical, que es proporcional a la frecuencia absoluta. Las normas generales de presentación de este tipo de gráficas son las siguientes: • • • • El ancho de la barra debe ser uniforme para todas las barras del diagrama. La longitud de la barra debe ser proporcional a la cantidad que representa. El espacio de separación entre barras por cada categoría debe ser constante. Las barras en estos gráficos pueden disponerse vertical u horizontalmente. Al elaborar la gráfica de barras del ejemplo queda: Pictograma El pictograma es un gráfico estadístico que se suele utilizar para caracteres cualitativos y que, en lugar de barras para representar las frecuencias, utiliza dibujos o gráficos alusivos a cada atributo y cuya dimensión sea proporcional a la frecuencia absoluta o relativa de la clase que representa. Cada uno de los dibujos o símbolos equivale a ciertas unidades de frecuencia relativa o absoluta. Cuantos más dibujos haya en cada categoría, mayor será la frecuencia. Aunque no existen reglas estrictas aplicables para la construcción de este tipo de gráfica, se recomienda este proceso: 1. Recopilar los datos 2. Elegir los símbolos a utilizar, y en algunos casos se deberá asignar qué cantidad de unidades representa cada símbolo. 3. Dibujar y etiquetar los ejes del gráfico. 4. Dibujar los símbolos correspondientes en cada categoría, dependiendo de la cantidad de unidades a representar. Se pueden usar símbolos parciales para representar los números con exactitud. 5. Colocar el significado de la simbología y su valor. Para hacer un pictograma en Excel® se deben ingresar los datos en la hoja de cálculo, seleccionar los datos e insertar un gráfico de barras. Luego, seleccionar una de las barras del gráfico y dar clic izquierdo, seleccionar "relleno"; elegir "imagen" y seleccionar "imágenes en línea" como fuente de la imagen. Seleccionar la imagen que se usará como símbolo y hacer clic en "apilar y ajustar la escala con unidades" para cambiar las barras por imágenes. Aplicando esta gráfica al ejemplo, queda: Círculograma A esta gráfica también se le llama gráfica circular o de pastel y se utiliza para representar información agrupada en clases o categorías a las que se les asigna una parte proporcional del círculo, llamada segmento circular, que corresponde al porcentaje que representan los datos del total. Para su construcción se requiere: 1. Obtener el ángulo en grados del segmento circular que representará a cada categoría, correspondiente a la frecuencia absoluta, utilizando la fórmula. 2. Verificar que la suma de grados de 360°. 3. Dibujar el circulo. 4. Trazar cada ángulo con ayuda del trasportador. 5. Dividir la circunferencia en los sectores. 6. Etiquetar cada sector con la categoría que representa y la frecuencia porcentual que le corresponde. 7. Colocar el título de la gráfica. Aplicando este proceso al ejemplo: Debes recordar que cada gráfica debe estar acompañada de su descripción y la interpretación del significado de los resultados para la toma de decisiones sobre la configuración del producto y las estrategias de mercadotecnia.