Escuela Profesional de Contabilidad ESTADÍSTICA APLICADA A LOS NEGOCIOS II MUESTREO PROBABILÍSTICO CON SPSS Profesor: Luis Fernando Guerra Jordán Arequipa - 2020 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Tema 1: Entorno SPSS 1. 2. 3. 4. 5. 6. 7. Introducción Creación de un fichero de datos Editor de datos: Vista de datos y vista de variables Introducción de datos Guardar datos Transformación de variables Filtrar casos (Selección y modificación de casos) 3 3 3 8 9 10 16 Tema 2: Muestreo Aleatorio simple 8. 9. 10. Muestreo aleatorio simple Sin uso de muestras complejas Con uso de muestras complejas 27 28 27 Tema 2: Muestreo Sistemático simple 11. 12. Muestra aleatoria sistemática Uso de muestras complejas 35 36 Tema 3: Muestreo Estratificado 13. 14. Muestra aleatoria estratificada Uso de muestras complejas 40 41 Tema 4: Muestreo por Conglomerados 15. 16. Muestra por conglomerados Uso de muestras complejas 46 47 2 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Introducción En la enseñanza actual de cursos de estadística, en particular, en la parte inferencial, como en las investigaciones de naturaleza cuantitativa, los estudiantes, profesionales y personas relacionadas afines recurren al uso de programas informáticos para el procesamiento de los datos procedentes de estos estudios relacionados. Por tal motivo, se recurre a la enseñanza de diferentes programas estadísticos (SPSS, Minitab, Statgraphics, etc) para incorporarlos en el sílabo de los cursos de estadística de las diferentes escuelas profesionales de las universidades. En particular, para la parte del estudio de los distintos tipos de muestreo, en el caso probabilístico: Aleatorio simple, sistemático simple, Estratificado y por Conglomerados, utilizaremos uno de los programas más conocidos de estadística, es el Software estadístico SPSS (Statistical Package for Social Sciences). CREACIÓN DE UN FICHERO DE DATOS CON SPSS Para la creación de una matriz de datos en el SPSS, se tiene que utilizar el editor de datos. EDITOR DE DATOS Es la ventana que se abre automáticamente cuando se inicia una sesión de SPSS. Muestra el contenido del archivo de datos actual. Con él, se pueden crear nuevos archivos o modificar los ya existentes. (Ver Figura N1). Figura N1 ESTRUCTURA DEL EDITOR DE DATOS El Editor de datos consta de dos ventanas: Vista de datos Vista de variables VISTA DE VARIABLES La Vista de variables contiene descripciones de las propiedades de cada variable del archivo de datos. (Ver Figura N2). En la Vista de variables tenemos: Las filas son variables. Las columnas son las características (propiedades) de las variables. 3 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Seleccionamos “la Vista de variables” en la cual definimos todas sus características (propiedades) de las variables. Características Variables Figura N2 Se pueden añadir o eliminar variables, y modificar las características de las variables: Nombre: Sirve para identificar la característica (variable) de interés de la unidad de observación. Tiene algunas restricciones, el primer carácter debe ser una letra y solo admite combinación de letras (máximo 24 caracteres), no acepta números o símbolos alfanuméricos ni espacios en blanco a excepción del subguión. Ejemplo: Edad_Obrera……………….Válido Edad Obrera……………….No válido Tipo: Tipo de dato, por defecto numérico pero contiene otras opciones (fecha, cadena, dólar, moneda personalizada, etc.). (Ver Figura N3). Anchura: Cantidad de dígitos o caracteres para el cálculo y procesamiento estadístico. Decimal: Cantidad de decimales en datos que son producto de mediciones. Figura N3 4 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Etiqueta: Las etiquetas descriptivas de variable. Sirve para ampliar las limitaciones que presenta al escribir el nombre de la variable. Valores: Opción que se utiliza para variables cualitativas. Permite codificar asignando valores a las diferentes modalidades de las variables. (Ver Figura N4). Figura N4 Perdidos: Valores perdidos del usuario. Corresponden a preguntas que no se obtienen respuestas. Se codifican su ingreso con valores grandes 99, 999. (Ver Figura N5). Figura N5 Columnas: Ancho de columna, sirve para visualización de los valores que se ingresan como del nombre de la variable. Medida: Nivel de medición de la variable. Escala corresponderá a la Interválica o de razón, también están la ordinal y nominal se eligen según corresponda el nivel de medición de la variable. 5 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán VISTA DE DATOS La Vista de datos los valores de las variables correspondientes a las unidades de observación de los datos. (Ver Figura N6). En la Vista de datos tenemos: Las filas son Unidades de Observación. Las columnas son las variables. Las intersecciones de las filas y columnas son los valores de las variables. Posteriormente en “la Vista de datos” introducimos los datos. VARIABLE BARRA DE HERRAMIENTAS BARRA DE MENU UNIDAD DE OBSERVACIÓN VALOR DE LA VARIABLE Figura N6 VISTA DE RESULTADOS Todas las tablas, gráficos y los resultados estadísticos se muestran en el visor. Puede editar resultados y guardarlos. Esta ventana se abre automáticamente la primera vez que se ejecuta un procedimiento. (Ver Figura N7). ESTRUCTURA DEL VISTA DE RESULTADOS El visor del visor de resultados consta de dos ventanas: Esquema del visor (Navegador de resultados). Contenido del visor (Visualizador de resultados). Opciones de ventana.(Barra del Menú y de Herramientas). Figura N7 6 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán ESQUEMA DE LA VISTA DE RESULTADOS Nos permite explorar los resultados que hemos obtenido a través de los diferentes análisis realizados. CONTENIDO DE LA VISTA DE RESULTADOS En el cual obtenemos la imagen de los resultados de los procedimientos (tablas, gráficos, lenguas de su sintaxis) BARRA DEL MENÚ Al igual que en la vista de datos, es posible utilizar en la vista de resultados esta opción, que permite realizar las mismas actividades si necesidad de ir a la vista de datos. BARRA DE LAS HERRAMIENTAS Al igual que en la vista de datos, es posible utilizar en la vista de resultados esta opción, que permite realizar las mismas actividades si necesidad de ir a la vista de datos. Los datos se pueden introducir en el Editor de datos, lo que puede resultar útil para archivos de datos pequeños o para realizar tareas de edición menores en archivos de datos más grandes Ejemplos 1.1 Supongamos que los datos obtenidos en una encuesta a trabajadores obreras son los que se muestran en la siguiente tabla. La matriz de datos (Tabla N1). Tabla N1 7 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán INGRESO DE DATOS EN EL SPSS Las variables de la Matriz de datos (Tabla N1) Ubicación de la Obrera (Sólo de referencia) Edad Estado civil Número de hijos Experiencia (años) Escolaridad Ganancia (dólares por día) Número de ausencias Calificación Ingresamos las características de las variables, según el siguiente cuadro (Tabla N2). de especificaciones: Nombre Tipo Anchu Decima ra les OBRERA CADENA _NRO EDAD NUMÉRICO 2 0 2 0 ESTADO_ CIVIL NUMERO _DE_HIJ OS EXPERIE NCIA ESCOLA RIDAD NUMÉRICO 1 0 NUMÉRICO 1 0 NUMÉRICO 2 0 NUMÉRICO 1 0 GANANCI NUMÉRICO A_DIARIA AUSENCI NUMÉRICO AS 3 0 1 0 CALIFICA NUMÉRICO CIÓN 1 0 Etiqueta Valores Colum Alineaci Medida nas ón UBICACIÓN DE LAS Ninguno OBRERAS EDAD DE LAS Ninguno OBRERAS ESTADO CIVIL DE LAS OBRERAS NÚMERO DE HIJOS Ninguno DE LAS OBRERAS 11 EXPERIENCIAS DE LAS OBRERAS NIVEL DE ESCOLARIDAD E LAS OBRERAS GANANCIA DIARIA DE LAS OBRERAS NÚMERO DE AUSENCIAS DE LAS OBRERAS NIVEL DE CALIFICACIÓN DE LAS OBRERAS Centrado Nominal 8 Centrado Escala 10 Centrado Ordinal 16 Centrado Escala Ninguno 10 Centrado Escala Ninguno 11 Centrado Escala Ninguno 12 Centrado Escala Ninguno 8 Centrado Escala Ninguno 10 Centrado Escala Tabla N2 En la vista de variables, se debe visualizar de la siguiente manera: (Ver Figura N8) Figura N8 8 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán En la vista de datos (figura anterior) se muestra los valores de ingresos (datos), como se observa; sin embargo se puede visualizar las etiquetas (modalidades) correspondiente a las variables cualitativas activando de la caja de herramientas la pestaña de “ETIQUETAS DE VALOR”.: En la vista de datos se ingresa los datos proporcionados según la matriz de datos, (Tabla N1), los resultados se muestran en la siguiente figura: (Ver Figura N9) Figura N9 GUARDAR LOS DATOS EN EL SPSS Una vez realizado el ingreso de los datos (matriz de daos) en el software estadístico SPSS versión 22, se procede a guardar el conjunto de datos, mediante el siguiente procedimiento: PROCEDIMIENTO Archivo > Guardar datos como… Direccionamos o indicamos la ruta donde se va a guardar los datos. Escribimos el nombre del archivo a guardar: OBRERAS Pulsamos la opción Guardar (Ver Figura N10) Figura N10 9 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán El software estadístico SPSS, guardara el archivo de datos con la extensión: sav Cuando requiera buscar el archivo de datos, lo encontrará con la siguiente extensión: OBRERAS.sav TRANSFORMACIÓN DE LAS VARIABLES En muchas situaciones para un estudio en la matriz de datos inicial, los datos para realizar un análisis estadístico descriptivo y luego inferencial, necesitan previamente ser transformados, por ejemplo, del ejemplo de la matriz de datos de la información del grupo de obreras, puede que sea de interés realizar un estudio estadístico considerando las edades en cuatro grupos étareos o grupos de 20 a 25 años, 26 a 30 años, 31 a 40 años, y los demás en otro grupo. Entonces se debe en la matriz de datos inicial modificar o crear una nueva variable edad transformada en cuatro grupos. RECODIFICACIÓN DE LAS VARIABLES Hay veces que para realizar ciertos análisis es necesario recodificar alguna variable, como por ejemplo, convertir una variable continua en categórica, o unir categorías de variables discretas, etc. Veamos en este apartado como cambiar los valores correspondientes a los individuos de una muestra mediante la recodificación de dicha variable, o creando una nueva. Para realizar estas transformaciones se activa en el menú: Se pueden realizar con las opciones del menú Transformar o con lenguaje de comandos SPSS. Existen dos opciones para la recodificación: “En distintas variables” recodifica la variable y crea una variable nueva con esta recodificación; y “En las mismas variables” recodifica la variable, es decir, los datos originales de la variable se sustituyen por los nuevos. 10 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán RECODIFICACIÓN EN DISTINTAS VARIABLES PROCEDIMIENTO Menú principal Transformar > Recodificar en distintas variables… En la ventana Recodificar en distintas variables: Seleccionar la variable a recodificar Con el botón de asignación (botón ubicado en la parte central de la ventana), enviar la variable seleccionada, por ejemplo, la variable Estado Civil al campo de la ventana central (campo donde se va a realizar los cambios) En la variable de resultado, escribir el nombre de la nueva variable como su etiqueta correspondiente, por ejemplo Nombre: Estado_civil_agrupado Etiqueta: Estado civil agrupado Pulsar el botón cambiar. Existen dos opciones para la recodificación: “Valores antiguos y nuevos” y “Si la opción” Seleccionar la opción: valores antiguos y nuevos En la ventana Recodificar en distintas variables: Valores antiguos y nuevos Hay diferentes formar de recodificar valores de la variable (datos), en el campo Valor antiguo: Valor Utilizado para variables cualitativas, ejemplo, si se quiere en la variable Estado Civil considerar, Viuda y Unión Libre en una sola categoría, se puede hacer la reasignación con esta opción. 11 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Valor 1 2 3 4 Modalidades Soltera Casada Viuda Unión libre Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Valor 1 2 3 Modalidades Soltera Casada Otros En la celda de valor antiguo, se introduce el valor de 1 En la celda de valor nuevo, se introduce el valor de 1 Se pulsa el botón de añadir. Se repite el proceso con el valor de 2 y de 3. En cambio, para el último caso, en la celda de valor antiguo, se introduce el valor de 4, y en la celda de valor nuevo, se introduce el valor de 3, se pulsa el botón de añadir y se termina el proceso. Pulsar continuar Pulsar Aceptar En el conjunto de datos, aparece en la última columna, la nueva variable creada: Estado_civil_agrupado Esta variable, fue creada con valores numéricos, luego, se etiqueta esta nueva variable y se le considera una variable cualitativa ordinal. 12 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán PROCEDIMIENTO Vista de variables Anchura: 1 Decimales: 0 Valores: Valor: 1 Valor: 2 Valor: 3 Medida: Etiqueta: Solteras Etiqueta: Casadas Etiqueta: Otros Ordinal Realizado el cambio de esta variable, en la vista de datos debe ser mostrada de la siguiente manera Rango Utilizado para variables cuantitativas, si se va a recodificar un grupo de valores numéricos, ejemplo: edades, en subgrupos o estratos, por ejemplo, si se quiere en la variable “ganancia por día”, en cuatro grupos como sigue: 13 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad PROCEDIMIENTO Valor 1 2 3 4 Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán GANANCIA AL DIA 200.- 204 205 – 212 213 – 220 221 - 232 Menú principal Transformar > Recodificar en distintas variables… En la ventana Recodificar en distintas variables: Seleccionar la variable a recodificar Con el botón de asignación (botón ubicado en la parte central de la ventana), enviar la variable seleccionada, por ejemplo, la variable Ganancia diaria al campo de la ventana central (campo donde se va a realizar los cambios) En la variable de resultado, escribir el nombre de la nueva variable como su etiqueta correspondiente, por ejemplo Nombre: Ganancia agrupada Etiqueta: Ganancia agrupada Pulsar el botón cambiar. Con el botón de asignación (botón ubicado en la parte central de la ventana), enviarlo a la ventana central (ventana donde se va a realizar los cambios) En la variable de resultado, escribir el nombre de la nueva variable como su etiqueta correspondiente Seleccionar la opción: valores antiguos y nuevos En la ventana Recodificar en distintas variables: Valores antiguos y nuevos En el campo Valor antiguo: Seleccionar la opción Rango En la celda ubicada en la parte inferior, se introduce el valor de 200 En la celda posterior (hasta), se introduce el valor de 204 En el campo de valor nuevo, en la celda de valor, se introduce el valor de 1. Se pulsa el botón de añadir. Se repite el proceso con el valor de 205 a 212, de 213 a 220 y finalmente de 221 a 232. Pulsar continuar Pulsar Aceptar 14 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán En el conjunto de datos, aparece en la última columna, la nueva variable creada: Ganancia_agrupada Esta variable, fue creada con valores numéricos, luego, se etiqueta esta nueva variable y se le considera una variable cualitativa ordinal. Se realiza después el cambio a variable cualitativa, como en el caso anterior. 15 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán FILTRACIÓN DE CASOS O SELECCIÓN DE CASOS En muchas situaciones se está interesado en realizar un análisis estadístico descriptivo y luego inferencial de una parte del archivo de datos inicial, por ejemplo, del ejemplo de la matriz de datos de la información del grupo de obreras, puede que sea de interés realizar un estudio estadístico sólo a las obreras solteras, o las obreras con más de 30 años de edad, etc. Entonces de debe seleccionar o filtrar la matriz de datos inicial, para que satisfaga los requerimientos en los cuales se desea analizar. En ocasiones de todos los casos que integran un archivo interesa seleccionar algunos de ellos, con una determinada condición referida a una o más variables o ya sea en forma aleatoria para obtener una muestra, éste último procedimiento se explicará más adelante. El SPSS permite filtrar temporalmente el conjunto de datos o generar un nuevo conjunto de datos. PROCEDIMIENTO Menú principal Datos > Seleccionar casos… En el menú desplegable de la poción seleccionar casos, se presenta cinco formas de realizarlo: Todos los casos. Si se satisface la condición. Muestra aleatoria de casos Basándose en el rango del tiempo o de los casos. Usar variable de filtro. 16 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán TODOS LOS CASOS En la ventana Seleccionar casos, la opción activada por defecto es “Todos los casos” y bajo la lista de variables aparece el mensaje Estado actual: No filtrar casos. Antes de proceder a la selección de casos hay que tener en cuenta que el programa presenta dos formas distintas para el tratamiento de los casos no seleccionados dependiendo de la opción que se active en el recuadro Los casos no seleccionados son. Con la opción Filtrados los casos no seleccionados no son incluidos en ningún procedimiento posterior pero permanecen en la base de datos y pueden recuperarse en cualquier momento desactivando el filtro; con la opción Eliminados los casos no seleccionados desaparecen de la base de datos y ya no son recuperables. Siempre que hay un filtro activado a la derecha de la barra de estado aparece la palabra Filtrado. Los casos no seleccionados aparecen marcados en la base de datos. SI SE SATISFACE LA CONDICIÓN Si en donde debe especificarse la condición de filtrado, de manera que los casos que la verifiquen quedan seleccionados. PROCEDIMIENTO En la ventana de Seleccionar casos Escoger la opción Si se satisface la condición Pulsar en la pestaña ubicada en la parte inferior: Si la op… 17 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán La ventana que aparece si se selecciona este modo personalizado de filtro permite generar una expresión de filtro compleja incluyendo una o varias condiciones. Cada condición puede construirse a partir del contenido de variables ya existentes y el empleo de operadores y funciones de SPSS. Teclado numérico Variables ya existentes Operadores Funciones OPERADORES Los operadores lógicos, relacionales y aritméticos, son los usados a la hora de establecer condiciones para los cálculos, o la hora de filtrar la base. OPERADORES RELACIONALES Los operadores relacionales se usan para saber la relación existente entre los dos términos que hay a la izquierda y derecha del operador, pudiendo ser los términos dos variables, una variable y un valor o dos valores; pudiendo ser a su vez los valores y las 18 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán variables numéricas o alfanuméricas, teniendo la precaución de que los dos términos sean del mismo tipo. Los operadores relacionales del SPSS son: símbolo = ~= < <= Operador Igual que No igual que Menor que Menor que o igual que Mayor que Mayor o igual que > >= OPERADORES LÓGICOS Los operadores lógicos se utilizan para saber la relación existente entre dos expresiones simples, excepto el operador “no” que sólo afecta a la expresión situada a la derecha. Los operadores lógicos en el SPSS son: símbolo ~ & | Operador No Y O Negación de la expresión Ambas expresiones simultáneamente Una expresión o la otra, o ambas OPERADORES ARITMÉTICOS Los operadores aritméticos se utilizan para expresiones simples relacionadas con variables numéricas. Los operadores aritméticos en el SPSS son: Suma (+), Resta (-), Multiplicación (*), División (/) Exponencial (**). Agrupación ( ) [los operadores y funciones que aparecen dentro del paréntesis se realizan antes de los que están fuera]. ORDEN DE PROCESAMEINTO DE LOS OPERADORES LÓGICOS En las expresiones lógicas, el orden de las operaciones es: Se ejecutan las operaciones relacionales Se ejecuta el operador de negación "~" Se ejecuta el operador de conjunción "&", se cumplan dos expresiones simultáneamente 19 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Se ejecuta el operador de disyunción “|”, se cumplan una de las dos expresiones o ambas a la vez. Los operadores del mismo nivel se ejecutan de izquierda a derecha. El orden de la operación puede ser modificado con la paréntesis “(. )”, ejecutándose primero la expresión que se encuentra dentro del paréntesis. Ejemplo 1 Consideremos que se está interesado, de la matriz de datos del archivo: obreras.sav en seleccionar sólo las mujeres solteras. La variable “Estado civil” de la Matriz de datos, sus categorías o modalidades tiene los siguientes valores de ingreso o de codificación en el SPSS: Valor 1 2 3 4 Modalidades Soltera Casada Viuda Unión libre El ingreso en el SPSS debe ser: Estado Civil = 1 PROCEDIMIENTO En el Menú principal Datos > Seleccionar casos En la ventana: Seleccionar casos, escoger la opción Si se satisface la condición Pulsar en la pestaña ubicada en la parte inferior: Si la op… En la ventana: Seleccionar casos: Si la opción Seleccionar la variable: Estado civil que está ubicada en la parte izquierda de esta ventana Con el botón de asignación enviarlo a la derecha, a la zona donde se realiza las operaciones lógicas, aritméticas y relaciones, Utilizar la calculadora que está ubicada en la parte inferior, pulsar el botón del operador relacional “igual” y asignar a continuación el valor de 1. Continuar 20 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán En la ventana: Seleccionar casos, escoger la opción en los resultados Copiar casos seleccionados a un nuevo conjunto de datos Nombre del conjunto de datos: Obreras_1 Aceptar A continuación, se muestra los resultados del nuevo conjunto de datos Ejemplo 2 Consideremos que se está interesado, de la matriz de datos del archivo: obreras.sav en seleccionar las obreras casadas y que tengan mayores o iguales a 1 ausencia. La variable “Estado civil” y la variable “ausencias”, de la Matriz de datos, presenta los siguientes valores de ingreso o de codificación en el SPSS: Variable: Estado civil valor Modalidades Soltera 1 Casada 2 Viuda 3 Unión libre 4 Variable: ausencias Valor 0 1 2 3 4 El ingreso en el SPSS debe ser: Estado Civil = 2 & ausencias >= 1 PROCEDIMIENTO En el Menú principal Datos > Seleccionar casos 21 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán En la ventana: Seleccionar casos, escoger la opción Si se satisface la condición Pulsar en la pestaña ubicada en la parte inferior: Si la op… En la ventana: Seleccionar casos: Si la opción Seleccionar la variable: Estado civil que está ubicada en la parte izquierda de esta ventana Con el botón de asignación enviarlo a la derecha, a la zona donde se realiza las operaciones lógicas, aritméticas y relaciones, Utilizar la calculadora que está ubicada en la parte inferior, pulsar el botón del operador relacional “igual” y asignar a continuación el valor de 2. Luego, seleccionar de la calculadora del SPSS, el operador lógico “&”. Seleccionar la variable: “ausencias” que está ubicada en la parte izquierda de esta ventana Con el botón de asignación enviarlo a la derecha, a la zona donde se realiza las operaciones lógicas, aritméticas y relaciones, Utilizar la calculadora que está ubicada en la parte inferior, pulsar el botón del operador relacional “menor o igual que” >= y asignar a continuación el valor de 1. Continuar En la ventana: Seleccionar casos, escoger la opción en los resultados Copiar casos seleccionados a un nuevo conjunto de datos Nombre del conjunto de datos: Obreras_2 22 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Aceptar A continuación, se muestra los resultados del nuevo conjunto de datos Ejemplo 3 De la matriz de datos, que está en el archivo del SPSS, OBRERAS.SAV, seleccionar las obreras casadas, con edades comprendidas entre 30 a 34 años. Solución La variable “Estado civil” y la variable “edad”, de la Matriz de datos, presenta los siguientes valores de ingreso o de codificación en el SPSS: Variable: Estado civil valor Modalidades Soltera 1 Casada 2 Viuda 3 Unión libre 4 Variable: Edad Valores Mínimo: 22 Máximo: 40 El ingreso en el SPSS debe ser: Estado Civil = 1 & edad >= 30 & edad <= 34 23 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán PROCEDIMIENTO En el menú principal de la vista de datos Datos > Seleccionar casos > Si se satisface la condición En la ventana: Seleccionar casos, escoger la opción Si se satisface la condición Pulsar en la pestaña ubicada en la parte inferior: Si la op… En la ventana: Seleccionar casos: Si la opción Seleccionar la variable: Estado civil que está ubicada en la parte izquierda de esta ventana Con el botón de asignación enviarlo a la derecha, a la zona donde se realiza las operaciones lógicas, aritméticas y relaciones, Utilizar la calculadora que está ubicada en la parte inferior, pulsar el botón del operador relacional “igual” y asignar a continuación el valor de 1. Luego, seleccionar de la calculadora del SPSS, el operador lógico “&”. Seleccionar la variable: “edad” que está ubicada en la parte izquierda de esta ventana Con el botón de asignación enviarlo a la derecha, a la zona donde se realiza las operaciones lógicas, aritméticas y relaciones, Utilizar la calculadora que está ubicada en la parte inferior, pulsar el botón del operador relacional “mayor o igual que” >= 30, luego pulsar el botón del operador relacional “menor o igual que” <= 34. Continuar Continuar Copiar casos seleccionados a un nuevo conjunto de datos Nombre del conjunto de datos: Obreras_3 24 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Aceptar A continuación, se muestra los resultados del nuevo conjunto de datos MUESTRA ALEATORIA DE CASOS Este procedimiento nos permite extraer una muestra de los casos; ya sea basándonos en un porcentaje concreto de los casos o por medio de un número específico de casos. Al hacer clic en el botón Muestra, aparece el cuadro de diálogo correspondiente Al hacer clic en el botón Muestra, aparece el cuadro de diálogo correspondiente Al seleccionar la primera de las opciones (porcentaje de los casos), el programa aproxima el valor del porcentaje al número entero de casos más cercano. Al seleccionar la segunda opción (número exacto de casos), el programa escoge los valores de los primeros casos del archivo; es decir, de los casos que se encuentren en las filas iniciales del archivo. 25 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán BASÁNDOSE EN EL RANGO DE TIEMPO O DE LOS CASOS Esta opción nos permite definir los limites (Superior e Inferior), entre los cuales se escogerán los casos. Al hacer clic sobre el botón Rango, aparece el cuadro de diálogo correspondiente. En este cuadro aparecen dos casillas, en donde debemos ingresar los valores del primer caso y el último caso que será seleccionado. Los valores de estas casilla pueden ser numéricos o fechas/horas. Los rangos de fechas o de tiempos sólo estarán disponibles para los datos de series temporales con variables de fecha ya definidas (menú Datos, Definir fechas). USAR VARIABLE DE FILTRO Emplea una variable numérica cuyos datos determinan los casos seleccionados. Todos los casos de la variable de filtro que cuenten con cualquier valor distinto del cero (0) o del valor perdido por el sistema (Vació), serán seleccionados. Para utilizar este método, es necesario ingresar una variable en la casilla ubicada en la parte inferior de la opción, haciendo clic en el botón Flecha. 26 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán USO DEL SOFTWARE DE ESTADÍSTICA SPSS PARA SELECCIONAR UNIDADES DE OBSERVACIÓN MEDIANTE TIPOS DE MUESTREO Una vez creado un fichero de datos (MATRIZ DE DATOS OBRERAS.sav), puede ser necesario en ocasiones seleccionar a determinadas “unidades de observación” de la población para que formen parte de la muestra, mediante algún método de muestreo, en este caso probabilístico. El software estadístico SPSS (versión 22), permite seleccionar “unidades de observación” mediante diferentes procedimientos de muestreo, en este documento, serán los métodos probabilísticos: Aleatorio Simple, Sistemático simple, estratificado y por conglomerados. MUESTREO ALEATORIO SIMPLE DEFINICIÓN Procedimiento de muestreo probabilístico, que consiste en la selección de n unidades de análisis de una población de tamaño N, de tal manera que cada unidad de la población tenga la misma probabilidad de ser seleccionada para ser parte de la muestra. Dependiendo de si los individuos del universo pueden ser seleccionados más de una vez en la muestra, hablaremos de Muestreo Aleatorio Simple con reposición o sin reposición. Si usamos reposición, el hecho de que seleccione un individuo al azar para mi muestra no impediría que este mismo individuo pudiese volver a ser seleccionado en una siguiente selección. Sería equivalente a decir que cada vez que extraigo un número al azar de mi urna, vuelvo a colocar el número antes de la siguiente extracción. Si por el contrario no usamos reposición, un individuo seleccionado para la muestra una vez ya no entraría nuevamente en el sorteo. A continuación vamos a describir algunos ejemplos de cómo realizar con el programa SPSS distintos tipos de procedimientos de muestreo. MUESTREO ALEATORIO SIMPLE CON SPSS PROCEDIMIENTO N 1 (SIN USO DE MUESTRAS COMPLEJAS) Paso 1: Abrir el archivo de datos (marco muestral de la población), en el ejemplo: MATRIZ DE DATOS OBRERAS.sav Paso 2: En el menú principal seleccionar: Datos > Seleccionar casos… 27 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Paso 3: En el cuadro de diálogo: Seleccionar la opción Muestra aleatoria de casos Pulsar el botón Ejemplo (Ver Figura N11) Paso 4: Figura N11 En el cuadro de diálogo: Seleccionar la opción Exactamente Ingresar los datos 𝒏 = 𝟏𝟐 y 𝑵 = 𝟓𝟎 como se muestran a continuación: Pulsar: Continuar Paso 5: Regresa al cuadro de diálogo anterior: Seleccionar casos En los resultados: Selecciona: Copiar casos seleccionados a un nuevo conjunto de datos Nombre de conjunto de datos: MUESTRA_ALEATORIA_SIMPLE_1 Pulsar: Aceptar (Ver Figura N12) Figura N12 28 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Con esta opción, se crea un nuevo conjunto de datos, en el archivo: MUESTRA_ALEATORIA_SIMPLE_1.sav, como se observa en la siguiente figura: (Ver Figura N13) Figura N13 A continuación, se puede solicitar al software SPSS, algunos resultados de interés, por ejemplo: Porcentaje de obreras solteras Promedio de la edad de las obreras En la vista de datos, realizamos el siguiente procedimiento: Paso 1: En el Menú Principal, seleccionar: Analizar > Estadísticos descriptivos > Frecuencias… (Ver Figura N14) Figura N14 29 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Paso 2: En el cuadro de diálogo de Frecuencias: Seleccionar las variables: Edad y Estado Civil, y con el botón de asignación, enviarlo al recuadro de Variables. Paso 3: Debe estar activado (por defecto) en la parte inferior del cuadro la opción: Paso 4: Pulsar sobre la opción: Estadísticos Seleccione de las medidas de tendencia central: Media Continuar Aceptar (Ver Figura N15). Figura N15 En la vista de resultados, se obtienen los siguientes resultados: (Ver Figura N15). Figura N15 Luego, en la muestra aleatoria simple de 12 unidades de observación (obreras) se obtuvo los siguientes resultados: El porcentaje de obreras solteras es de: 58,3% El promedio de la edad de las obreras es de 29,08 años En cualquiera de estas situaciones, sea cual sea la combinación de procedimientos, al final tenemos como resultante UN DISEÑO MUESTRAL que es el producto final de la mezcla de todos los diseños muestrales que intervienen. Un diseño muestral de este tipo se denomina diseño muestral complejo. Las muestras obtenidas con tales diseños se pueden por ello denominar muestras complejas. El módulo de SPSS denominado precisamente Muestras Complejas nos permite, 30 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán PROCEDIMIENTO N 2 (CON USO DE MUESTRAS COMPLEJAS) Paso 1: Abrir el archivo de datos (marco muestral de la población), en el ejemplo: MATRIZ DE DATOS OBRERAS.sav Paso 2: En el menú principal seleccionar: Analizar > Muestras Complejas > Seleccionar una muestra… (Ver Figura N16). Figura N16 Aparece una ventana (Cuadro de diálogo) en la que podemos elegir entre CREAR un plan de muestreo nuevo, EDITAR un plan de muestreo ya existente, o pasar directamente a la EXTRACCIÓN de una muestra (esto requiere que ya haya un plan). En principio, si estamos en el inicio, emplearemos la primera opción. Mediante la opción Examinar es posible escoger el directorio en el cual se grabará el fichero con el plan que creemos, así como su nombre. Por defecto la extensión es .CSPLAN. (Ver Figura N17). Figura N17 31 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Paso 3: En el Asistente de muestreo elegir: Diseñar una muestra Pulsar Examinar Seleccionar el directorio donde se desea grabar el archivo con el plan de muestreo. En este caso, se eligió el siguiente directorio: D: Semestre 2018 II / Trabajo Social / Segunda componente/Archivos SPSS / PLAN DE MUESTREO/ MUESTREO ALEATORIO SIMPLE Escribir un nombre del archivo que contenga el plan de muestreo, ejemplo: MUESTREO/_ALEATORIO_ SIMPLE (Ver Figura N18). Figura N18 Pulsar guardar Pulsar siguiente Pulsar siguiente Pulsar siguiente Paso 4: En el asistente de muestreo, en la opción de valor: escribir la cantidad de unidades de observación, es decir, tamaño de la muestra: 12 (Ver Figura N19). Figura N19 32 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Pulsar siguiente Pulsar siguiente Pulsar siguiente Paso 5: En el asistente de muestreo, seleccionamos, valor personalizado: introducimos una cadena de números, ejemplo: 222222, para poder posteriormente con esta opción poder crear otra muestra aleatoria distinta a la inicial. Pulsar siguiente (Ver Figura N20). Figura N20 Paso 6: En el asistente de muestreo, escogemos la opción: Nuevo conjunto de datos y escribimos un nombre para la muestra, ejemplo: MUESTRA_ALEATORIA_SIMPLE_02 (Ver Figura N21). Figura N21 Pulsar siguiente Pulsar Finalizar 33 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Con esta opción, se crea un nuevo conjunto de datos, en el archivo: MUESTRA_ALEATORIA_SIMPLE_02, como se observa en la siguiente figura: (Ver Figura N22). Figura N22 Una vez creado el nuevo conjunto de datos, procedemos a guardarlo PROCEDIMIENTO Archivo > Guardar datos como… Direccionamos o indicamos la ruta donde se va a guardar los datos. Por ejemplo: D: Semestre 2018 II / Trabajo Social / Segunda componente/Archivos SPSS/PLAN DE MUESTREO/ MUESTREO ALEAOTRIO SIMPLE/ Escribimos el nombre del archivo a guardar: MUESTRA_ALEATORIA_SIMPLE_02 Pulsamos la opción Guardar 34 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán MUESTREO SISTEMÁTICO SIMPLE DEFINICIÓN Procedimiento de muestreo probabilístico, que consiste en seleccionar la primera unidad de análisis en forma aleatoria y las demás n-1 unidades de análisis de la muestra serán seleccionadas de acuerdo a una regla o sucesión mediante una constante. MUESTREO SISTEMÁTICO SIMPLE CON SPSS PROCEDIMIENTO (CON USO DE MUESTRAS COMPLEJAS) Paso 1: Abrir el archivo de datos (marco muestral de la población), en el ejemplo: MATRIZ DE DATOS OBRERAS.sav Paso 2: En el menú principal seleccionar: Analizar > Muestras Complejas > Seleccionar una muestra… (Ver Figura N23). Figura N23 35 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Aparece una ventana (Cuadro de diálogo), se trata del Asistente de muestreo, el cual tienen varias opciones: Diseñar una muestra: Se utiliza para crear un plan de muestreo nuevo, cuando no se tiene, es la opción que vamos a utilizar Editar un diseño muestral: Se utiliza cuando ya se tiene creado un plan de muestreo. Extraer la muestra: Se tiene el plan de muestreo creado, entonces se puede extraer una muestra. (Ver Figura N24). Figura N24 Paso 3: En el Asistente de muestreo elegir: Diseñar una muestra Pulsar Examinar Seleccionar el directorio donde se desea grabar el archivo con el plan de muestreo. En este caso, se eligió el siguiente directorio: D: Semestre 2018 II / Trabajo Social / Segunda componente/Archivos SPSS / PLAN DE MUESTREO/ MUESTREO SISTEMÁTICO SIMPLE Escribir un nombre del archivo que contenga el plan de muestreo, ejemplo: Pulsar guardar MUESTREO SISTEMÁTICO SIMPLE (Ver Figura N25). Figura N25 36 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Pulsar guardar Pulsar siguiente Paso 4: En el asistente de muestreo, escoger en el método, la opción: Sistemático Simple (Ver Figura N26). Figura N26 Pulsar siguiente Paso 5: En el asistente de muestreo, en la opción de valor: escribir la cantidad de unidades de observación, es decir, tamaño de la muestra: 12. (Ver Figura N27). Figura N27 Pulsar siguiente Pulsar siguiente Pulsar siguiente 37 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Paso 6: En el asistente de muestreo, seleccionamos, valor personalizado: introducimos una cadena de números, ejemplo: 666666, para poder posteriormente con esta opción poder crear otra muestra aleatoria distinta a la inicial. (Ver Figura N28). Figura N28 Pulsar siguiente Paso 7: En el asistente de muestreo, escogemos la opción: Nuevo conjunto de datos y escribimos un nombre para la muestra, ejemplo: MUESTRA_SISTEMÁTICO_SIMPLE_1 (Ver Figura N29). Figura N29 38 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Pulsar siguiente Pulsar Finalizar Con esta opción, se crea un nuevo conjunto de datos, en el archivo: MUESTRA_SISTEMATICA_SIMPLE_1, como se observa en la siguiente figura: (Ver Figura N30). Figura N30 Una vez creado el nuevo conjunto de datos, procedemos a guardarlo PROCEDIMIENTO Archivo > Guardar datos como… Direccionamos o indicamos la ruta donde se va a guardar los datos. Por ejemplo: D: Semestre 2018 II / Trabajo Social / Segunda componente/Archivos SPSS/PLAN DE MUESTREO/ MUESTREO SISTEMATICO SIMPLE/ Escribimos el nombre del archivo a guardar: MUESTRA_SISTEMÁTICO SIMPLE_1 Pulsamos la opción Guardar 39 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán MUESTREO ALEATORIO ESTRATIFICADO Introducción Al realizar un muestreo aleatorio simple, por efecto del azar, puede ocurrir que en la muestra se encuentren en distinta proporción que en la población, valores de variables que puedan influir decisivamente en la variable o variables principales del estudio. Por ejemplo, si el objetivo del estudio es estimar la talla media de los habitantes con edades comprendidas entre 18 y 65 años de una determinada ciudad, en la que el 50% de los habitantes son hombres y el 50% de ella, son mujeres. Si por efecto del azar en la muestra hay más mujeres que hombres, la estimación de la talla será menor de lo que realmente es, puesto que, en general, la talla de las mujeres es menor que la de los hombres. Para evitar que el efecto del azar pueda influir por desequilibrios en una determinada variable, se puede dividir la población en tantas partes como categorías tenga la variable cuya influencia se quiere controlar; a esta división de la población se le denomina estratificar. En este caso la variable estratificadora es el sexo y el número de estratos son dos: hombres y mujeres. El muestreo se realizará de tal manera que tenga una proporción de hombres y mujeres igual que en el de la población que se quiere muestrear, para evitar el riesgo. DEFINICIÓN Procedimiento de muestreo probabilístico, que consiste en dividir en subgrupos disjuntos (Estratos) a la población, y posteriormente en cada uno de subgrupos seleccionar las unidades de análisis mediante un muestreo aleatorio simple. Observación Se puede usar otros métodos de muestreo en cada subgrupo (muestreo sistemático, aleatorio con reposición, etc.). ESTRATOS Los estratos suelen ser grupos homogéneos de individuos, que a su vez son heterogéneos entre diferentes grupos. Los estratos deben ser homogéneos internamente y heterogéneos entre sí. Es relativamente habitual definir estratos de acuerdo a algunas variables características de la población como son la edad, sexo, clase social o región geográfica. Estas variables permiten dividir fácilmente la muestra en grupos mutuamente excluyentes y con bastante frecuencia, permiten discriminar comportamientos diferentes dentro de la población. 40 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Gráfica: Estratificación de la población MUESTREO ESTRATIFICADO ALEATORIO CON SPSS PROPORCIONAL AL TAMAÑO DE LOS ESTRATOS Para determinar, la afijación o distribución del tamaño de la muestra fijada inicialmente,𝑛 = 12, con respecto a cada estrato (Soltera, Casada, Viuda y Unión Libre), debemos considerar varias opciones, una de ellas tiene que ver con los porcentajes de cada estrato en toda la población. PROCEDIMIENTO Vista de datos Ubicarse con el cursor, en la variable: ESTADO_CIVIL Pulsar con la parte derecha del mouse se desplegará un menú, del cual seleccionará, estadísticos descriptivos (Ver Figura N31). Figura N31 41 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán En la vista de resultados, se puede obtener la información Del cual, obtenemos las cantidades de la muestra, que corresponden a cada estrato: 60 × 12 = 7.2 ≈ 7 ∶ 𝑆𝑜𝑙𝑡𝑒𝑟𝑎𝑠 100 10 × 12 = 1.2 ≈ 1 ∶ 𝑉𝑖𝑢𝑑𝑎 100 ; ; 20 × 12 = 2.4 ≈ 3 ∶ 𝐶𝑎𝑠𝑎𝑑𝑎𝑠 100 10 × 12 = 1.2 ≈ 1 100 ∶ 𝑈𝑛𝑖ó𝑛 𝐿𝑖𝑏𝑟𝑒 PROCEDIMIENTO (CON USO DE MUESTRAS COMPLEJAS) Paso 1: Abrir el archivo de datos (marco muestral de la población), en el ejemplo: MATRIZ DE DATOS OBRERAS.sav Paso 2: En el menú principal seleccionar: Analizar > Muestras Complejas > Seleccionar una muestra… (Ver Figura N32). Figura N32 42 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Paso 3: En el Asistente de muestreo elegir: Diseñar una muestra Pulsar Examinar Seleccionar el directorio donde se desea grabar el archivo con el plan de muestreo. En este caso, se eligió el siguiente directorio: D: Semestre 2018 II / Trabajo Social / Segunda componente/Archivos SPSS / PLAN DE MUESTREO/ MUESTREO ESTRATIFICADO ALEATORIO Escribir un nombre del archivo que contenga el plan de muestreo, ejemplo: MUESTREO ESTRATIFICADO ALEATORIO Pulsar guardar (Ver Figura N33). Pulsar siguiente Figura N33 Paso 4: En el asistente de muestreo, seleccionar la variable que va a considerar a estratificar, en este caso, vamos a considerar la variable: Estado Civil de las Obreras (Ver Figura N34). Figura N34 Pulsar siguiente Pulsar siguiente (Por defecto, se escoge el método de muestreo aleatorio simple). 43 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Paso 5: En el asistente de muestreo, escogemos: Valores desiguales para los estratos Definir En el recuento, colocar los valores de la muestra en cada estrato: Soltera: 7 Casada: 3 Viuda:1 Unión Libre: 1 (Ver Figura N35). Continuar Figura N35 Paso 6: En el asistente de muestreo, seleccionamos, valor personalizado: introducimos una cadena de números, ejemplo: 444444, para poder posteriormente con esta opción poder crear otra muestra aleatoria distinta a la inicial. (Ver Figura N36). Figura N36 Siguiente Paso 7: En el asistente de muestreo, escogemos la opción: Nuevo conjunto de datos y escribimos un nombre para la muestra, ejemplo: MUESTRA_ESTRATIFICADO_ 1 (Ver Figura N37). 44 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Figura N37 Siguiente Finalizar Con esta opción, se crea un nuevo conjunto de datos, en el archivo: MUESTRA_ESTRATIFICADA_1, como se observa en la siguiente figura: (Ver Figura N38). Figura N38 Una vez creado el nuevo conjunto de datos, procedemos a guardarlo PROCEDIMIENTO Archivo > Guardar datos como… Direccionamos o indicamos la ruta donde se va a guardar los datos. Por ejemplo: D: Semestre 2018 II / Trabajo Social / Segunda componente/Archivos SPSS/PLAN DE MUESTREO/ MUESTREO ESTRATIFICADO ALEATORIO/ Escribimos el nombre del archivo a guardar: MUESTRA_ESTRATICADA_1 Pulsamos la opción Guardar 45 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán MUESTREO POR CONGLOMERADOS Introducción En los procedimientos de muestreo probabilístico hasta ahora analizados: Muestreo Aleatorio Simple, Muestreo Sistemático y Muestreo Estratificado, se ha supuesto que la población está dada, y que mediante cualquiera de los procedimientos anteriores en situaciones diferentes se pueden extraer las unidades de análisis, es decir, las unidades de análisis coinciden con las unidades de muestreo. Sin embargo, las unidades de análisis no necesariamente están bien definidas, aunque la población lo esté. Puede haber varias formas de enumerar las unidades y el tamaño de unidad elegido puede contener subunidades más pequeñas. Suponga que queremos determinar cuántas bicicletas son propiedad de los residentes de una comunidad de 10 000 familias. Podríamos extraer una muestra aleatoria simple de 400 familias o dividir la comunidad en bloques que tuviesen aproximadamente 20 familias cada uno y analizar a cada familia en cada uno de los 20 bloques elegidos al azar de entre los 500 bloques de la comunidad. DEFINICIÓN Procedimiento de muestreo probabilístico, que consiste en la que cada unidad de muestreo es un conjunto o conglomerados de elementos. El muestreo por conglomerados es una técnica que aprovecha la existencia de grupos o conglomerados en la población que representan correctamente el total de la población en relación a la característica que queremos medir. Dicho de otro modo, estos grupos contienen toda la variabilidad de la población. Si esto sucede, podemos seleccionar únicamente algunos de estos conglomerados para realizar el estudio. CONGLOMERADOS Son grupos disjuntos (sin solapamiento) y exhaustiva (todos los individuos deben estar en un grupo), de tal manera que los grupos no difieran entre sí en relación a aquello que queremos medir. Estos grupos deberán ser tan heterogéneos como la población total. Si los grupos son tan heterogéneos como la población, es tan eficiente como el muestreo aleatorio simple. En el muestreo por conglomerados las unidades de muestreo son grupos de unidades de estudio, algo que puede resultar muy beneficioso en relación al coste del propio muestreo. A cambio, es habitual obtener una menor precisión al usar esta técnica, causada por falta de heterogeneidad dentro de los conglomerados. 46 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán MUESTREO POR CONGLOMERADOS CON SPSS PROCEDIMIENTO (CON USO DE MUESTRAS COMPLEJAS) Paso 1: Abrir el archivo de datos (marco muestral de la población), en el ejemplo: MATRIZ DE DATOS OBRERAS.sav Paso 2: En el menú principal seleccionar: Analizar > Muestras Complejas > Seleccionar una muestra… (Ver Figura N39). Figura N39 Paso 3: En el Asistente de muestreo elegir: Diseñar una muestra Pulsar Examinar Seleccionar el directorio donde se desea grabar el archivo con el plan de muestreo. En este caso, se eligió el siguiente directorio: D: Semestre 2018 II / Trabajo Social / Segunda componente/Archivos SPSS / PLAN DE MUESTREO/ MUESTREO POR CONGLOMERADOS Escribir un nombre del archivo que contenga el plan de muestreo, ejemplo: MUESTREO POR CONGLOMERADOS Pulsar guardar (Ver Figura N40). Figura N40 47 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Pulsar siguiente Paso 4: En el asistente de muestreo, seleccionar la variable que va a considerar para ser cluster o conglomerado, en este caso, vamos a considerar la variable: CALIFICACIÓN Pulsar siguiente Pulsar siguiente (Por defecto, muestreo aleatorio simple). Valor 1 2 3 4 5 Categoría Muy mala Mala Regular Buena Muy buena se escoge el método de (Ver Figura N41). Figura N41 Paso 5: (Seleccionamos aleatoriamente dos conglomerados o cluster) En el asistente de muestreo, escogemos: Unidades: Recuentos Valor: 2 (Ver Figura N42). Figura N42 48 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Siguiente Siguiente Paso 6: En el asistente de muestreo, seleccionamos, valor personalizado: introducimos una cadena de números, ejemplo: 888888, para poder posteriormente con esta opción poder crear otra muestra aleatoria distinta a la inicial. (Ver Figura N43). Figura N43 Siguiente Paso 7: En el asistente de muestreo, escogemos la opción: Nuevo conjunto de datos y escribimos un nombre para la muestra, ejemplo: MUESTRA_POR_CONGLOMERADOS_1 (Ver Figura N44). Figura N44 49 Facultad de Ciencias Contables y Financieras Escuela Profesional de Contabilidad Métodos de muestreo probabilístico Profesor: Lic. Luis Fernando Guerra Jordán Siguiente Finalizar Con esta opción, se crea un nuevo conjunto de datos, en el archivo: MUESTRA_POR_CONGLOEMRADOS_1, como se observa en la siguiente figura: (Ver Figura N45). Figura N45 Una vez creado el nuevo conjunto de datos, procedemos a guardarlo PROCEDIMIENTO Archivo > Guardar datos como… Direccionamos o indicamos la ruta donde se va a guardar los datos. Por ejemplo: D: Semestre 2018 II / Trabajo Social / Segunda componente/Archivos SPSS/PLAN DE MUESTREO/ MUESTREO POR CONGLOMERADOS/ Escribimos el nombre del archivo a guardar: Pulsamos la opción Guardar MUESTRA_POR_CONGOMERADOS_1 50