Economía y Negocios Proyecto Empírico 2 Maria Emilia Sigcha 00200896 Camila Flores. 00209122 Diana Benavides 00202068 Sebastián Zambrano 00204900 Martín Suarez 00214003 1. Revisa el documento training_data_descrip.pdf. Selecciona 10 variables de las 121 disponibles en la base. Esta selección debe ser en base de la importancia para predecir la variable kfr_pooled_p25 de movilidad intergeneracional. Ordena las variables en razón de su relevancia. Justifica la elección de cada variable usando fuentes como noticias, artículos académicos libros, reportes etc. P_1 Bankruptcies per 1000 adults in 2008 La crisis financiera del 2008 fue el desastre económico más grande que ha tenido los Estados Unidos desde La Gran Depresión del año 1929. Las leyes desreguladas del sistema financiero, que permitieron a los bancos la inversión en bienes raíces, llevo a la quiebra a muchas empresas que a su vez tuvieron repercusión en los trabajadores. Luego de esta crisis, las personas cambiaron su estilo de vida y la perspectiva en la cual analizaban su situación financiera, por lo que tuvieron un gran impacto en su movilidad social. El 2008 tuvo una tasa de bancarrotas no relacionadas a negocios de un 34.86% (1.004.171) y así el país entró en una recesión que empezó a descender a mediados del 2010, esto lo podemos observar en el gráfico de arriba. Por estas razones, creemos que esta variable puede ser importante para el análisis que vamos a realizar, ya que creemos que puede existir una correlación entre la variable P_1 Bankruptcies per 1000 adults in 2008 y kfr_pooled_25, la primera ser causante de un efecto de la movilidad intergeneracional. P_54 Job Density (in square miles) in 2013 Según el portal de noticias Bloomberg, basado en el estudio de Brooking Institutions, la densidad de trabajo se ha incrementado significativamente entre los años 2004 y 2015. La densidad de trabajo se ha elevado a 20.000 trabajos por milla cuadrada en 2004 y 26.000 en 2015, por lo que se ha visto un incremento de casi 6.000 trabajos por milla cuadrada, es decir un aproximado del 30%. Creemos que es importante tener en cuenta la densidad de los trabajos por milla cuadrada ya que esto nos da una mejor idea de cuanto trabajo existe para las personas y que tantas oportunidades tienen a su alrededor. Esta es una de las variables que creemos más importantes ya que nos ayuda a entender si la gente no tiene trabajo porque no existen puestos disponibles o si debemos pensar existen otras razones por las cuales las personas no pueden acceder a puestos de trabajo. Si analizamos estos datos, junto a la información que tenemos sobre los estudios de la movilidad intergeneracional, podremos contrastar y tener una perspectiva mas formada acerca de la movilidad intergeneracional de las personas. P_53 Average Annual Job Growth Rate 2004‐ 2013 Según el U.S. Bureau of Labour and Statistics desde enero de 1939, el crecimiento laboral en los Estados Unidos ha tenido una media de 2.1% por año. Con el fin de argumentar el Monthly Labor Review’s Centenial, los editores del BLS han invitado a muchos productores y usuarios de data BLS para hacer un contraste de los últimos 100. Se ha descubierto que las compañías privadas han experimentado un constante crecimiento y han incremento su masa laboral desde un 50% a un 71%, hasta Diciembre del 2015. Del 2001 al 2015 existió un cambio promedio de un 0.6% en el crecimiento laboral, el más bajo desde el periodo de 1972 a 1979. Creemos que esta variable también nos ayuda a tener una perspectiva más formada acerca de las oportunidades que tienen las personas, ya que si las tasas de trabajo son altas o bajas podremos analizarlas y determinar si esto influye en la movilidad intergeneracional de las personas. P_27 Fraction of Residents w/ a College Degree or More in 2006‐ 2010 ACS Como podemos ver en el gráfico, según la página de estudios estadísticos Estatista, el porcentaje de la población de los Estados Unidos que ha terminado los estudios universitarios ha incrementado con el tiempo. Desde 1940 hasta el 2019 se ha incrementado el nivel de estudio de cuatro años de universidad, en los hombres desde un 7% a un 35% aproximadamente y en las mujeres de un 4% a un 37% aproximadamente. Estos datos son interesantes para el análisis ya que nos dan una idea de la preparación que adquieren los segmentos de la población de Estados Unidos y así podemos analizar si esta tiene una correlación causal con la movilidad intergeneracional. P_68 Percent Diabetics (Adults) En 2017 la Asociación Americana para la Diabetes realizo un estudio sobre el costo económico de la diabetes. Este estudio tuvo como objetivo actualizar las estimaciones anteriores de la carga económica de la diabetes y cuantificar el uso de recursos de salud y la perdida de productividad asociada a la diabetes. Se concluyó en que los costos económicos de la diabetes habían aumentado en un 26% entre los años 2012 y 2017 debido a su prevalencia y al costo por persona con diabetes. La prevalencia de la enfermedad y los costos médicos que se asocian a ella, centrados principalmente en la población adulta, contribuyen a un costo creciente para el programa Medicare. En este articulo se destaca la carga financiera que la diabetes genera a la sociedad, los costos intangibles, recursos de atención brindados por cuidadores no remunerados y los costos asociados con la diabetes no diagnosticada. De esta manera entendemos que esta enfermedad tiene un impacto económico significante, por lo que creemos que es importante buscar si existe una correlación entre estas variable y la movilidad social de la población. P_78 Percent Obese Persons (20 Years and Over) En los Estados Unidos, la obesidad se ha convertido en un tema muy importante. Según el articulo del Centro Nacional de Información Biotecnológica, sobre el impacto económico de la obesidad, en los Estados Unidos más de dos tercios de los adultos tienen sobrepeso y un tercio es obeso. En esta investigación se han identificado al menos cuatro categorías de impacto económico vinculadas con la epidemia de obesidad: costos médicos directos, costos de productividad, costos de transporte y costos de capital humano. El NCBI dice que sigue siendo necesario un análisis mas completo de los costos que la obesidad representa y la magnitud del impacto económico y subraya la importancia del problema de la obesidad como foco de políticas y temas para futuras investigaciones. Por lo que podemos pensar que esta enfermedad en algún momento pueda causar un cambio en la economía, en donde esta se vea afectada por las cuatro categorías antes mencionadas. Lo que nos hace pensar que este problema, que no es nuevo, pudo y puede tener un impacto en la movilidad intergeneracional de las personas al verse afectada su productividad y su costo de capital humano. P_12 Total Violent and Property Crimes Rate El FBI, en su servicio de información criminal de justicia, determinó que durante el año 2018 existió un estimado de 71.96.045 crímenes de ofensa en los Estados Unidos. La tendencia de diez años mostró que la tasa de crímenes a la propiedad bajó un 22.9% en 2018, cuando esta se contrastó con la del estimado del 2009. En 2018 la tasa de crimen a la propiedad tuvo un estimado de 2199,5 por cada 100000 habitantes, es decir, un 6.9% de decrecimiento comparándose a la tasa estimada del 2017. El hurto representó un 72.5% de todos los delitos contra la propiedad, el robo representó un 17.1% y el robo de vehículos motorizados un 10.4%, en 2018. Los crímenes a la propiedad significaron una perdida estimada de $16.4 billones. Por lo que nos parece interesante analizar cuanto afectan los crímenes a la sociedad y a su movilidad social, ya que cuando las personas se ven afectadas por un robo, no cuentan con un seguro y tienen una perdida que se convierte en un gasto extra para su familia. Los gastos pueden contar no solo con la perdida de bienes materiales o familiares afectados, sino que también representan un costo de seguridad, ya sea que piensen en cambiarse de casa, contraten una empresa de seguridad o tengan que remodelar el hogar para hacerlo más seguro. Todos estos factores que afectan los ingresos de las familias creemos que deben ser tomados en cuenta al momento de analizar la movilidad intergeneracional ya que influyen en la vida de las personas causando distintas reacciones a lo largo de su vida, ya que una gran pérdida puede significar perdidas posteriores. P_67 Drug Poisoning Mortality Rate per 100,000 Population Como podemos ver en los gráficos proporcionados por el Centro de Control y Prevención de Enfermedades (CDC) de los Estados Unidos, teniendo en cuenta que los datos abarcan todas las edades, razas y sexos, en el 2017 existieron alrededor de 70.000 muertes relacionadas a las drogas. En 1999 la tasa de mortalidad relacionada a las drogas era de un 0.5%, datos más actuales muestran un incremento en esta tasa de mortalidad con casi un 20% para el 2017. Como podemos ver, la línea azul, la cual abarca a todas las personas, ha mantenido un incremento constante con el pasar de los años, lo cual puede significar que el problema cada vez se agrava más. En 2017 el Donald Trump, el presidente de los Estados Unidos, se declaró en guerra contra el uso indebido de opioides. Por estas razones podemos asumir que las muertes relacionadas con drogas están afectando el desarrollo de la sociedad, creando un gasto extra al gobierno y afectando la productividad de las personas. Se están creando, con más frecuencia, mercados negros de drogas, no solo ilícitas. En el documental Take Your Pills de Netflix podemos entender cómo este problema está afectando a las personas desde los colegios, entrando a las ventas en campus de universidades y afectando los trabajos, inclusive en Wall Street, y por ende a la productividad de las personas. Por estas razones, creemos que a largo plazo este problema se va a seguir incrementando cada vez más y es importante tener en cuenta esta variable para analizar si hay un efecto causal a la movilidad intergeneracional de las personas. P_77 Percent of Persons with Access to Exercise Opportunities El deporte es uno de los mitigantes naturales de enfermedades cardiacas y mentales. Los buenos sistemas inmunológicos son más resistentes y existe menos daño cuando se presentan ante distintas enfermedades. De esta manera, creemos que es importante analizar el porcentaje de personas que tienen oportunidades de realizar actividades físicas en los Estados Unidos. Según la revista Times, en el año 2018, de acuerdo con un nuevo reporte del Centro Estadístico de Control y Prevención Nacional para la Salud (NCHS) menos de un cuarto de los americanos se rigen bajo el esquema de actividades físicas nacionales. Este esquema recomienda que los adultos tengan, al menos, 150 minutos de ejercicio físico moderado o 75 minutos de ejercicio físico intenso cada semana. De acuerdo con una encuesta realizada por el NCHS solamente un 23% de adultos entre 18 y 64 cumplen ambas recomendaciones, un 32% cumple un solo una de las dos recomendaciones y un 45% no cumple ninguna de las dos. Estos datos nos hacen pensar que su nivel de productividad se puede ver afectad a y, analizando el tema de forma colectiva, si más del 40% no realiza ninguna actividad física puede haber un impacto en la economía dentro de la productividad y por ende afectar la movilidad intergeneracional de las personas. P_79 Percent Percent Physically Inactive Persons (20 Years and Over) De acuerdo con la data más reciente del Behaevoral Risk Factor Surveillance System (BRFSS), realizada en el 2018, , en los Estados Unidos, Kentucky tuvo el mayor reporte de inactividad con una tasa de 32.3% en los adultos. En esta encuesta se concluyó que un 51.7% de la población completa las pautas nacionales de actividad física del país. Como podemos ver en el gráfico, 34 estados entran en una tasa de 20% a 29.9% de adultos que no realizan actividades físicas. La poca actividad física no significa necesariamente que las personas están trabajando o siendo productivas en su tiempo libre. Estas tasas tan comunes, pueden representar a largo plazo problemas de salud debido a la inactividad física. Cada vez son más las empresas que recompensan y buscan que sus empleados sean activos físicamente, ya que de esta manera no solo liberan estrés, sino que aumentan su rendimiento y se vuelven más productivos. Es posible que la poca actividad física esté ligada a la movilidad intergeneracional de las personas ya que la productividad baja. Por eso queremos investigar si existe una correlación causal en estas variables. 2. Crea un modelo de regresión múltiple usando la variable dependiente kfr_pooled_p25 y las diez variables de tu lista de la pregunta 1. ¿Qué interpretación corresponde a cada coeficiente de las variables independientes? Interpretación de los coeficientes de la regresión múltiple: Los coeficientes de una regresión múltiple se pueden interpretar como la pendiente de una línea recta dentro de un sistema de coordenadas donde la variable dependiente es kfr_poole~25 y la variable independiente es cada una de las 10 variables consideradas para la regresión, desde ese punto de vista se pueden interpretar los coeficientes de regresión de cada variable como una estimación del cambio o la variación que “sufre” kfr_poole~25 debido a un cambio en una unidad en la variable analizada, mientras todas las demás variables independientes permanecen constantes. Considerando que kfr_poole~25 representa el rango promedio de ingresos familiares de los padres de un niño que están en el percentil 25 de la distribución nacional de ingreso, entonces se tiene para cada variable el siguiente análisis de coeficientes: P_1 Bankruptcies per 1000 adults in 2008 - 0.0004723 es la estimación de la disminución esperada (ya que tiene signo negativo) en el ingreso promedio familiar que corresponde al incremento de 1000 bancarrotas de adultos en el año 2008 (en este caso se toma como unidad igual a 1000 ya que esta variable se mide en bankruptcies por cada 1000 adultos). Este cambio en kfr_poole~25 se da tomando en cuenta que las 9 variables independientes restantes permanecen constantes mientras p_1 aumenta en 1000. P_54 Job Density (in square miles) in 2013: -1.07e-07 es un valor demasiado pequeño como para considerar que existe cambios en kfr_poole~25 cuando p_54 aumenta en una unidad, por lo tanto, el cambio de la variable independiente es prácticamente cero. P_53 Average Annual Job Growth Rate 2004‐2013 0.40 es la estimación del aumento esperado en el ingreso promedio familiar que corresponde a la tasa de crecimiento laboral anual para el periodo comprendido entre 2004 y 2013. Este cambio en kfr_poole~25 se da tomando en cuenta que las 9 variables independientes restantes permanecen constantes mientras p_53 aumenta una unidad. P_27 Fraction of Residents w/ a College Degree or More in 2006‐2010 ACS El valor de -0.074256 es la estimación de la disminución esperada (ya que tiene signo negativo) en el ingreso promedio familiar que corresponde al incremento de una unidad en la proporción de residentes que tienen un grado de Colegio o más en el periodo de 2006 a 2010. Este cambio en kfr_poole~25 se da tomando en cuenta que las 9 variables independientes restantes permanecen constantes mientras p_27 aumenta en 1. P_68 Percent Diabetics (Adults) El coeficiente igual a -0.0109 es la estimación de la disminución esperada (ya que tiene signo negativo) en el ingreso promedio familiar que corresponde al incremento de una unidad en el porcentaje de adultos con diabetes. Este cambio en kfr_poole~25 se da tomando en cuenta que las 9 variables independientes restantes permanecen constantes mientras p_68 aumenta en 1 punto porcentual. P_78 Percent Obese Persons (20 Years and Over) 0.000241 es la estimación de la disminución esperada (ya que tiene signo negativo) en el ingreso promedio familiar que corresponde al incremento de una unidad en el porcentaje de personas mayores de 20 años que sufren de obesidad. Este cambio en kfr_poole~25 se da tomando en cuenta que las 9 variables independientes restantes permanecen constantes mientras p_78 aumenta en 1 punto porcentual. Al ser un coeficiente cercano a cero se puede considerar que no hay cambios en la variable dependiente cuando aumenta el porcentaje de personas obesas. P_12 Total Violent and Property Crimes Rate -0.00001 es un valor demasiado pequeño como para considerar que existe cambios en kfr_poole~25 cuando p_12 aumenta en una unidad, por lo tanto, el cambio de la variable independiente es prácticamente cero. P_67 Drug Poisoning Mortality Rate per 100,000 Population El valor del coeficiente para esta variable es de 0.0000443 el mismo que se considera despreciable como para generar cambios en kfr_poole~25 cuando p_67 aumenta en una unidad, por lo tanto, el cambio de la variable independiente es prácticamente cero. P_77 Percent of Persons with Access to Exercise Opportunities El coeficiente de esta variable es de -0.0001339 el cual es la estimación de la disminución esperada (ya que tiene signo negativo) en el ingreso promedio familiar que corresponde al incremento de una unidad en el porcentaje de personas con acceso a oportunidades de ejercicio. Este cambio en kfr_poole~25 se da tomando en cuenta que las 9 variables independientes restantes permanecen constantes mientras p_77 aumenta en 1 punto porcentual. Este cambio sobre la variable dependiente se puede considerar igual a cero debido a que el valor del coeficiente es cercano a cero. P_79 Percent Physically Inactive Persons (20 Years and Over) El coeficiente de esta variable que vale -0.000575 es la estimación de la disminución esperada (ya que tiene signo negativo) en el ingreso promedio familiar que corresponde al incremento de una unidad en el porcentaje de personas físicamente inactivas. Este cambio en kfr_poole~25 se da tomando en cuenta que las 9 variables independientes restantes permanecen constantes mientras p_79 aumenta en 1 punto porcentual. Este cambio sobre la variable dependiente se puede considerar igual a cero debido a que el valor del coeficiente es cercano a cero. En cuanto a la significancia de estas variables y tomando en cuenta el valor p de cada una de ellas y relacionándolas con un valor de significancia igual al 5% o 0.05, se puede deducir que las variables p_54, p_78, p_67, p_77 y p_79 se consideran no significativas ya que sus correspondientes valores p son menores que el valor de significancia dado (5%). Esto también se puede observar en el hecho de que los cambios generados por los coeficientes de estas variables sobre la variable independiente son prácticamente cero como se describió anteriormente de forma individual, este análisis del valor p corrobora el análisis hecho con los coeficientes individuales de cada variable. 3. Corre el siguiente modelo de regresión en Stata: Error: global predictorvars "v6 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17" *OLS regression reg kfr_pooled_p25 $predictorvars P_* if training == 1, r predict rank_hat_ols Corrección: global predictorvars v6 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17*OLS regression reg kfr pooled_p25 $predictorvars P_* if training == 1, predict rank_hat_ols 4. Crea un histograma para kfr_pooled_actual. Consulta la ayuda de hist para poder crear el histograma. Comenta sobre el resultado de la distribución de movilidad intergeneracional. De igual forma, crea un histograma para rank_hat_ols. Comenta sobre el resultado de la distribución de movilidad intergeneracional predicha kfr_pooled_actual Gráfico 1 Para los valores reales de los ingresos, no hay una movilidad intergeneracional. Esto tomando en cuenta que los padres se encontraban en el percentil 25 y en este caso la distribución de la nueva generación empieza un poco más abajo en el percentil 23. Al no haberse movido de percentil, significa que los miembros de esta generación tendrán el mismo estatus socioeconómico que sus ascendientes. rank_hat_ols Gráfico 1 Para los valores predichos, la distribución empieza después de percentil 25, exactamente en 0.2867415. Como los padres se encontraban en el percentil 25 y los niños empiezan después del mismo significa que si existe una movilidad intergeneracional. Además, los valores se están centrando cerca de la media por el percentil 50. Como existe movilidad, puede que la siguiente generación haya cambiado para poder mejorar su estatus socioeconómico. 5. Usando el siguiente comando: twoway (hist kfr_actual)(hist rank_hat_ols) Crea un histograma conjunto. Selecciona otro color para uno de los histogramas. Comenta sobre las diferencias entre los resultados reales y los resultados predichos. ¿A qué podrías atribuir estas diferencias? Gráfico 3 El histograma que podemos observar en el gráfico 3 muestra las variables kfr_actual y rank_hat_ols, cons sus histogramas de colores amarillo y verde respectivamente. Estos histogramas nos muestran la similitud entre estas distintas variables. El histograma amarillo, referente a la variable kfr_actual, muestra los valores actuales referentes al ingreso de las personas, mientras que el histograma verde, referente a la variable rank_hat_ols, muestra una predicción de cuales podrían a ser los ingresos de las personas, tomando como punto de partida los valores actuales. Lo que podemos observar en este gráfico es que existe una gran similitud entre los ingresos actuales y los ingresos que se piensan podrían ser ciertos a futuro, lo cual nos indica que no existe un cambio tan significativo en cuanto a la movilidad social de las personas, de lo contrario, al parecer, las personas tienden más a quedarse en su estatus socioeconómico que a salir de él. Si observamos los gráficos 1 y 2 de la pregunta 4 podremos observar que existe una diferencia más evidente entre los percentiles 29 y 34. Por esta razón, creemos que para el grupo de personas perteneciente a estos percentiles es posible que la movilidad intergeneracional sea diferente. No es el mismo caso de las personas ubicadas entre los percentiles 35 y 55, aquí sí podemos ver que la predicción se acerca más a los valores actuales reales. Works Cited Just the Facts: Consumer Bankruptcy Filings, 2006-2017. (2020). Retrieved 6 July 2020, from https://www.uscourts.gov/news/2018/03/07/just-facts-consumerbankruptcy-filings-2006-2017 Bloomberg - Are you a robot?. (2020). Retrieved 6 July 2020, from https://www.bloomberg.com/news/articles/2019-06-20/where-in-the-u-s-are-jobs-mostdense Ghanbari, M. (2016). Current Employment Statistics survey: 100 years of employment, hours, and earnings : Monthly Labor Review: U.S. Bureau of Labor Statistics. Retrieved 6 July 2020, from https://www.bls.gov/opub/mlr/2016/article/current-employmentstatistics-survey-100-years-of-employment-hours-and-earnings.htm Americans with a college degree 1940-2018, by gender | Statista. (2020). Retrieved 6 July 2020, from https://www.statista.com/statistics/184272/educational-attainment-ofcollege-diploma-or-higher-by-gender/ Economic Costs of Diabetes in the U.S. in 2017. (2018). Diabetes Care, 41(5), 917-928. doi: 10.2337/dci18-0007 Property Crime. (2020). Retrieved 6 July 2020, from https://ucr.fbi.gov/crime-in-theu.s/2018/crime-in-the-u.s.-2018/topic-pages/property-crime NCHS Data Visualization Gallery - Drug Poisoning Mortality. (2020). Retrieved 6 July 2020, from https://www.cdc.gov/nchs/data-visualization/drug-poisoningmortality/index.htm Hammond, R., & Levine. (2010). The economic impact of obesity in the United States. Diabetes, Metabolic Syndrome And Obesity: Targets And Therapy, 285. doi: 10.2147/dmsott.s7384 Only 23% of Americans Get Enough Exercise, a New Report Says. (2020). Retrieved 6 July 2020, from https://time.com/5324940/americans-exercise-physical-activityguidelines/