Uploaded by Cams 00015

31176-409567 - Sebastian Zambrano - 7 de julio de 2020 1155 - Proyecto Empirico 2

advertisement
Economía y Negocios
Proyecto Empírico 2
Maria Emilia Sigcha
00200896
Camila Flores.
00209122
Diana Benavides
00202068
Sebastián Zambrano
00204900
Martín Suarez
00214003
1. Revisa el documento training_data_descrip.pdf. Selecciona 10 variables de
las 121 disponibles en la base. Esta selección debe ser en base de la
importancia para predecir la variable kfr_pooled_p25 de movilidad
intergeneracional. Ordena las variables en razón de su relevancia. Justifica
la elección de cada variable usando fuentes como noticias, artículos
académicos libros, reportes etc.

P_1 Bankruptcies per 1000 adults in 2008
La crisis financiera del 2008 fue el desastre económico más grande que ha tenido
los Estados Unidos desde La Gran Depresión del año 1929. Las leyes desreguladas
del sistema financiero, que permitieron a los bancos la inversión en bienes raíces,
llevo a la quiebra a muchas empresas que a su vez tuvieron repercusión en los
trabajadores. Luego de esta crisis, las personas cambiaron su estilo de vida y la
perspectiva en la cual analizaban su situación financiera, por lo que tuvieron un
gran impacto en su movilidad social. El 2008 tuvo una tasa de bancarrotas no
relacionadas a negocios de un 34.86% (1.004.171) y así el país entró en una
recesión que empezó a descender a mediados del 2010, esto lo podemos observar
en el gráfico de arriba. Por estas razones, creemos que esta variable puede ser
importante para el análisis que vamos a realizar, ya que creemos que puede existir
una correlación entre la variable P_1 Bankruptcies per 1000 adults in 2008 y
kfr_pooled_25, la primera ser causante de un efecto de la movilidad
intergeneracional.

P_54 Job Density (in square miles) in 2013
Según el portal de noticias Bloomberg, basado en el estudio de Brooking Institutions,
la densidad de trabajo se ha incrementado significativamente entre los años 2004 y
2015. La densidad de trabajo se ha elevado a 20.000 trabajos por milla cuadrada en
2004 y 26.000 en 2015, por lo que se ha visto un incremento de casi 6.000 trabajos
por milla cuadrada, es decir un aproximado del 30%. Creemos que es importante
tener en cuenta la densidad de los trabajos por milla cuadrada ya que esto nos da una
mejor idea de cuanto trabajo existe para las personas y que tantas oportunidades
tienen a su alrededor. Esta es una de las variables que creemos más importantes ya
que nos ayuda a entender si la gente no tiene trabajo porque no existen puestos
disponibles o si debemos pensar existen otras razones por las cuales las personas no
pueden acceder a puestos de trabajo. Si analizamos estos datos, junto a la
información que tenemos sobre los estudios de la movilidad intergeneracional,
podremos contrastar y tener una perspectiva mas formada acerca de la movilidad
intergeneracional de las personas.

P_53 Average Annual Job Growth Rate 2004‐ 2013
Según el U.S. Bureau of Labour and Statistics desde enero de 1939, el crecimiento
laboral en los Estados Unidos ha tenido una media de 2.1% por año. Con el fin de
argumentar el Monthly Labor Review’s Centenial, los editores del BLS han invitado
a muchos productores y usuarios de data BLS para hacer un contraste de los últimos
100. Se ha descubierto que las compañías privadas han experimentado un constante
crecimiento y han incremento su masa laboral desde un 50% a un 71%, hasta
Diciembre del 2015. Del 2001 al 2015 existió un cambio promedio de un 0.6% en el
crecimiento laboral, el más bajo desde el periodo de 1972 a 1979. Creemos que esta
variable también nos ayuda a tener una perspectiva más formada acerca de las
oportunidades que tienen las personas, ya que si las tasas de trabajo son altas o bajas
podremos analizarlas y determinar si esto influye en la movilidad intergeneracional
de las personas.

P_27 Fraction of Residents w/ a College Degree or More in 2006‐ 2010
ACS
Como podemos ver en el gráfico, según la página de estudios estadísticos Estatista, el
porcentaje de la población de los Estados Unidos que ha terminado los estudios
universitarios ha incrementado con el tiempo. Desde 1940 hasta el 2019 se ha
incrementado el nivel de estudio de cuatro años de universidad, en los hombres desde
un 7% a un 35% aproximadamente y en las mujeres de un 4% a un 37%
aproximadamente. Estos datos son interesantes para el análisis ya que nos dan una
idea de la preparación que adquieren los segmentos de la población de Estados
Unidos y así podemos analizar si esta tiene una correlación causal con la movilidad
intergeneracional.

P_68 Percent Diabetics (Adults)
En 2017 la Asociación Americana para la Diabetes realizo un estudio sobre el costo
económico de la diabetes. Este estudio tuvo como objetivo actualizar las
estimaciones anteriores de la carga económica de la diabetes y cuantificar el uso de
recursos de salud y la perdida de productividad asociada a la diabetes. Se concluyó
en que los costos económicos de la diabetes habían aumentado en un 26% entre los
años 2012 y 2017 debido a su prevalencia y al costo por persona con diabetes. La
prevalencia de la enfermedad y los costos médicos que se asocian a ella, centrados
principalmente en la población adulta, contribuyen a un costo creciente para el
programa Medicare. En este articulo se destaca la carga financiera que la diabetes
genera a la sociedad, los costos intangibles, recursos de atención brindados por
cuidadores no remunerados y los costos asociados con la diabetes no diagnosticada.
De esta manera entendemos que esta enfermedad tiene un impacto económico
significante, por lo que creemos que es importante buscar si existe una correlación
entre estas variable y la movilidad social de la población.

P_78 Percent Obese Persons (20 Years and Over)
En los Estados Unidos, la obesidad se ha convertido en un tema muy importante.
Según el articulo del Centro Nacional de Información Biotecnológica, sobre el
impacto económico de la obesidad, en los Estados Unidos más de dos tercios de los
adultos tienen sobrepeso y un tercio es obeso. En esta investigación se han
identificado al menos cuatro categorías de impacto económico vinculadas con la
epidemia de obesidad: costos médicos directos, costos de productividad, costos de
transporte y costos de capital humano. El NCBI dice que sigue siendo necesario un
análisis mas completo de los costos que la obesidad representa y la magnitud del
impacto económico y subraya la importancia del problema de la obesidad como foco
de políticas y temas para futuras investigaciones. Por lo que podemos pensar que esta
enfermedad en algún momento pueda causar un cambio en la economía, en donde
esta se vea afectada por las cuatro categorías antes mencionadas. Lo que nos hace
pensar que este problema, que no es nuevo, pudo y puede tener un impacto en la
movilidad intergeneracional de las personas al verse afectada su productividad y su
costo de capital humano.

P_12 Total Violent and Property Crimes Rate
El FBI, en su servicio de información criminal de justicia, determinó que durante el
año 2018 existió un estimado de 71.96.045 crímenes de ofensa en los Estados
Unidos. La tendencia de diez años mostró que la tasa de crímenes a la propiedad bajó
un 22.9% en 2018, cuando esta se contrastó con la del estimado del 2009. En 2018 la
tasa de crimen a la propiedad tuvo un estimado de 2199,5 por cada 100000
habitantes, es decir, un 6.9% de decrecimiento comparándose a la tasa estimada del
2017. El hurto representó un 72.5% de todos los delitos contra la propiedad, el robo
representó un 17.1% y el robo de vehículos motorizados un 10.4%, en 2018. Los
crímenes a la propiedad significaron una perdida estimada de $16.4 billones. Por lo
que nos parece interesante analizar cuanto afectan los crímenes a la sociedad y a su
movilidad social, ya que cuando las personas se ven afectadas por un robo, no
cuentan con un seguro y tienen una perdida que se convierte en un gasto extra para su
familia. Los gastos pueden contar no solo con la perdida de bienes materiales o
familiares afectados, sino que también representan un costo de seguridad, ya sea que
piensen en cambiarse de casa, contraten una empresa de seguridad o tengan que
remodelar el hogar para hacerlo más seguro. Todos estos factores que afectan los
ingresos de las familias creemos que deben ser tomados en cuenta al momento de
analizar la movilidad intergeneracional ya que influyen en la vida de las personas
causando distintas reacciones a lo largo de su vida, ya que una gran pérdida puede
significar perdidas posteriores.

P_67 Drug Poisoning Mortality Rate per 100,000 Population
Como podemos ver en los gráficos proporcionados por el Centro de Control y
Prevención de Enfermedades (CDC) de los Estados Unidos, teniendo en cuenta que
los datos abarcan todas las edades, razas y sexos, en el 2017 existieron alrededor de
70.000 muertes relacionadas a las drogas. En 1999 la tasa de mortalidad relacionada
a las drogas era de un 0.5%, datos más actuales muestran un incremento en esta tasa
de mortalidad con casi un 20% para el 2017. Como podemos ver, la línea azul, la cual
abarca a todas las personas, ha mantenido un incremento constante con el pasar de
los años, lo cual puede significar que el problema cada vez se agrava más. En 2017 el
Donald Trump, el presidente de los Estados Unidos, se declaró en guerra contra el
uso indebido de opioides. Por estas razones podemos asumir que las muertes
relacionadas con drogas están afectando el desarrollo de la sociedad, creando un
gasto extra al gobierno y afectando la productividad de las personas. Se están
creando, con más frecuencia, mercados negros de drogas, no solo ilícitas. En el
documental Take Your Pills de Netflix podemos entender cómo este problema está
afectando a las personas desde los colegios, entrando a las ventas en campus de
universidades y afectando los trabajos, inclusive en Wall Street, y por ende a la
productividad de las personas. Por estas razones, creemos que a largo plazo este
problema se va a seguir incrementando cada vez más y es importante tener en cuenta
esta variable para analizar si hay un efecto causal a la movilidad intergeneracional de
las personas.

P_77 Percent of Persons with Access to Exercise Opportunities
El deporte es uno de los mitigantes naturales de enfermedades cardiacas y mentales.
Los buenos sistemas inmunológicos son más resistentes y existe menos daño cuando
se presentan ante distintas enfermedades. De esta manera, creemos que es importante
analizar el porcentaje de personas que tienen oportunidades de realizar actividades
físicas en los Estados Unidos. Según la revista Times, en el año 2018, de acuerdo con
un nuevo reporte del Centro Estadístico de Control y Prevención Nacional para la
Salud (NCHS) menos de un cuarto de los americanos se rigen bajo el esquema de
actividades físicas nacionales. Este esquema recomienda que los adultos tengan, al
menos, 150 minutos de ejercicio físico moderado o 75 minutos de ejercicio físico
intenso cada semana. De acuerdo con una encuesta realizada por el NCHS solamente
un 23% de adultos entre 18 y 64 cumplen ambas recomendaciones, un 32% cumple
un solo una de las dos recomendaciones y un 45% no cumple ninguna de las dos.
Estos datos nos hacen pensar que su nivel de productividad se puede ver afectad a y,
analizando el tema de forma colectiva, si más del 40% no realiza ninguna actividad
física puede haber un impacto en la economía dentro de la productividad y por ende
afectar la movilidad intergeneracional de las personas.

P_79 Percent Percent Physically Inactive Persons (20 Years and Over)
De acuerdo con la data más reciente del Behaevoral Risk Factor Surveillance System
(BRFSS), realizada en el 2018, , en los Estados Unidos, Kentucky tuvo el mayor reporte
de inactividad con una tasa de 32.3% en los adultos. En esta encuesta se concluyó que
un 51.7% de la población completa las pautas nacionales de actividad física del país.
Como podemos ver en el gráfico, 34 estados entran en una tasa de 20% a 29.9% de
adultos que no realizan actividades físicas. La poca actividad física no significa
necesariamente que las personas están trabajando o siendo productivas en su tiempo
libre. Estas tasas tan comunes, pueden representar a largo plazo problemas de salud
debido a la inactividad física. Cada vez son más las empresas que recompensan y
buscan que sus empleados sean activos físicamente, ya que de esta manera no solo
liberan estrés, sino que aumentan su rendimiento y se vuelven más productivos. Es
posible que la poca actividad física esté ligada a la movilidad intergeneracional de las
personas ya que la productividad baja. Por eso queremos investigar si existe una
correlación causal en estas variables.
2. Crea un modelo de regresión múltiple usando la variable dependiente
kfr_pooled_p25 y las diez variables de tu lista de la pregunta 1. ¿Qué
interpretación corresponde a cada coeficiente de las variables
independientes?

Interpretación de los coeficientes de la regresión múltiple:
Los coeficientes de una regresión múltiple se pueden interpretar como la pendiente de
una línea recta dentro de un sistema de coordenadas donde la variable dependiente es
kfr_poole~25 y la variable independiente es cada una de las 10 variables consideradas
para la regresión, desde ese punto de vista se pueden interpretar los coeficientes de
regresión de cada variable como una estimación del cambio o la variación que “sufre”
kfr_poole~25 debido a un cambio en una unidad en la variable analizada, mientras todas
las demás variables independientes permanecen constantes.
Considerando que kfr_poole~25 representa el rango promedio de ingresos familiares de
los padres de un niño que están en el percentil 25 de la distribución nacional de ingreso,
entonces se tiene para cada variable el siguiente análisis de coeficientes:

P_1 Bankruptcies per 1000 adults in 2008
- 0.0004723 es la estimación de la disminución esperada (ya que tiene signo negativo) en
el ingreso promedio familiar que corresponde al incremento de 1000 bancarrotas de
adultos en el año 2008 (en este caso se toma como unidad igual a 1000 ya que esta variable
se mide en bankruptcies por cada 1000 adultos). Este cambio en kfr_poole~25 se da
tomando en cuenta que las 9 variables independientes restantes permanecen constantes
mientras p_1 aumenta en 1000.
P_54 Job Density (in square miles) in 2013:
-1.07e-07 es un valor demasiado pequeño como para considerar que existe cambios en
kfr_poole~25 cuando p_54 aumenta en una unidad, por lo tanto, el cambio de la variable
independiente es prácticamente cero.

P_53 Average Annual Job Growth Rate 2004‐2013
0.40 es la estimación del aumento esperado en el ingreso promedio familiar que
corresponde a la tasa de crecimiento laboral anual para el periodo comprendido entre
2004 y 2013. Este cambio en kfr_poole~25 se da tomando en cuenta que las 9 variables
independientes restantes permanecen constantes mientras p_53 aumenta una unidad.

P_27 Fraction of Residents w/ a College Degree or More in 2006‐2010 ACS
El valor de -0.074256 es la estimación de la disminución esperada (ya que tiene signo
negativo) en el ingreso promedio familiar que corresponde al incremento de una unidad
en la proporción de residentes que tienen un grado de Colegio o más en el periodo de
2006 a 2010. Este cambio en kfr_poole~25 se da tomando en cuenta que las 9 variables
independientes restantes permanecen constantes mientras p_27 aumenta en 1.

P_68 Percent Diabetics (Adults)
El coeficiente igual a -0.0109 es la estimación de la disminución esperada (ya que tiene
signo negativo) en el ingreso promedio familiar que corresponde al incremento de una
unidad en el porcentaje de adultos con diabetes. Este cambio en kfr_poole~25 se da
tomando en cuenta que las 9 variables independientes restantes permanecen constantes
mientras p_68 aumenta en 1 punto porcentual.

P_78 Percent Obese Persons (20 Years and Over)
0.000241 es la estimación de la disminución esperada (ya que tiene signo negativo) en el
ingreso promedio familiar que corresponde al incremento de una unidad en el porcentaje
de personas mayores de 20 años que sufren de obesidad. Este cambio en kfr_poole~25 se
da tomando en cuenta que las 9 variables independientes restantes permanecen constantes
mientras p_78 aumenta en 1 punto porcentual. Al ser un coeficiente cercano a cero se
puede considerar que no hay cambios en la variable dependiente cuando aumenta el
porcentaje de personas obesas.

P_12 Total Violent and Property Crimes Rate
-0.00001 es un valor demasiado pequeño como para considerar que existe cambios en
kfr_poole~25 cuando p_12 aumenta en una unidad, por lo tanto, el cambio de la variable
independiente es prácticamente cero.

P_67 Drug Poisoning Mortality Rate per 100,000 Population
El valor del coeficiente para esta variable es de 0.0000443 el mismo que se considera
despreciable como para generar cambios en kfr_poole~25 cuando p_67 aumenta en una
unidad, por lo tanto, el cambio de la variable independiente es prácticamente cero.
 P_77 Percent of Persons with Access to Exercise Opportunities
El coeficiente de esta variable es de -0.0001339 el cual es la estimación de la
disminución esperada (ya que tiene signo negativo) en el ingreso promedio familiar que
corresponde al incremento de una unidad en el porcentaje de personas con acceso a
oportunidades de ejercicio. Este cambio en kfr_poole~25 se da tomando en cuenta que
las 9 variables independientes restantes permanecen constantes mientras p_77 aumenta
en 1 punto porcentual. Este cambio sobre la variable dependiente se puede considerar
igual a cero debido a que el valor del coeficiente es cercano a cero.

P_79 Percent Physically Inactive Persons (20 Years and Over)
El coeficiente de esta variable que vale -0.000575 es la estimación de la disminución
esperada (ya que tiene signo negativo) en el ingreso promedio familiar que corresponde
al incremento de una unidad en el porcentaje de personas físicamente inactivas. Este
cambio en kfr_poole~25 se da tomando en cuenta que las 9 variables independientes
restantes permanecen constantes mientras p_79 aumenta en 1 punto porcentual. Este
cambio sobre la variable dependiente se puede considerar igual a cero debido a que el
valor del coeficiente es cercano a cero.
En cuanto a la significancia de estas variables y tomando en cuenta el valor p de cada
una de ellas y relacionándolas con un valor de significancia igual al 5% o 0.05, se
puede deducir que las variables p_54, p_78, p_67, p_77 y p_79 se consideran no
significativas ya que sus correspondientes valores p son menores que el valor de
significancia dado (5%). Esto también se puede observar en el hecho de que los
cambios generados por los coeficientes de estas variables sobre la variable
independiente son prácticamente cero como se describió anteriormente de forma
individual, este análisis del valor p corrobora el análisis hecho con los coeficientes
individuales de cada variable.
3. Corre el siguiente modelo de regresión en Stata:

Error:
global predictorvars "v6 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17"
*OLS regression reg kfr_pooled_p25 $predictorvars P_* if training == 1, r
predict rank_hat_ols

Corrección:
global predictorvars v6 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17*OLS regression reg
kfr pooled_p25 $predictorvars P_* if training == 1, predict rank_hat_ols
4. Crea un histograma para kfr_pooled_actual. Consulta la ayuda de
hist para poder crear el histograma. Comenta sobre el resultado de la
distribución de movilidad intergeneracional. De igual forma, crea un
histograma para rank_hat_ols. Comenta sobre el resultado de la
distribución de movilidad intergeneracional predicha

kfr_pooled_actual
Gráfico 1
Para los valores reales de los ingresos, no hay una movilidad intergeneracional. Esto
tomando en cuenta que los padres se encontraban en el percentil 25 y en este caso la
distribución de la nueva generación empieza un poco más abajo en el percentil 23. Al
no haberse movido de percentil, significa que los miembros de esta generación tendrán
el mismo estatus socioeconómico que sus ascendientes.

rank_hat_ols
Gráfico 1
Para los valores predichos, la distribución empieza después de percentil 25, exactamente
en 0.2867415. Como los padres se encontraban en el percentil 25 y los niños empiezan
después del mismo significa que si existe una movilidad intergeneracional. Además, los
valores se están centrando cerca de la media por el percentil 50. Como existe movilidad,
puede que la siguiente generación haya cambiado para poder mejorar su estatus
socioeconómico.
5. Usando el siguiente comando:
twoway (hist kfr_actual)(hist rank_hat_ols)
Crea un histograma conjunto. Selecciona otro color para uno de los
histogramas. Comenta sobre las diferencias entre los resultados reales y
los resultados predichos. ¿A qué podrías atribuir estas diferencias?
Gráfico 3
El histograma que podemos observar en el gráfico 3 muestra las variables kfr_actual y
rank_hat_ols, cons sus histogramas de colores amarillo y verde respectivamente. Estos
histogramas nos muestran la similitud entre estas distintas variables. El histograma
amarillo, referente a la variable kfr_actual, muestra los valores actuales referentes al
ingreso de las personas, mientras que el histograma verde, referente a la variable
rank_hat_ols, muestra una predicción de cuales podrían a ser los ingresos de las
personas, tomando como punto de partida los valores actuales. Lo que podemos
observar en este gráfico es que existe una gran similitud entre los ingresos actuales y los
ingresos que se piensan podrían ser ciertos a futuro, lo cual nos indica que no existe un
cambio tan significativo en cuanto a la movilidad social de las personas, de lo contrario,
al parecer, las personas tienden más a quedarse en su estatus socioeconómico que a salir
de él.
Si observamos los gráficos 1 y 2 de la pregunta 4 podremos observar que existe una
diferencia más evidente entre los percentiles 29 y 34. Por esta razón, creemos que para
el grupo de personas perteneciente a estos percentiles es posible que la movilidad
intergeneracional sea diferente. No es el mismo caso de las personas ubicadas entre los
percentiles 35 y 55, aquí sí podemos ver que la predicción se acerca más a los valores
actuales reales.
Works Cited
Just the Facts: Consumer Bankruptcy Filings, 2006-2017. (2020). Retrieved 6 July
2020, from https://www.uscourts.gov/news/2018/03/07/just-facts-consumerbankruptcy-filings-2006-2017
Bloomberg - Are you a robot?. (2020). Retrieved 6 July 2020, from
https://www.bloomberg.com/news/articles/2019-06-20/where-in-the-u-s-are-jobs-mostdense
Ghanbari, M. (2016). Current Employment Statistics survey: 100 years of employment,
hours, and earnings : Monthly Labor Review: U.S. Bureau of Labor Statistics. Retrieved
6 July 2020, from https://www.bls.gov/opub/mlr/2016/article/current-employmentstatistics-survey-100-years-of-employment-hours-and-earnings.htm
Americans with a college degree 1940-2018, by gender | Statista. (2020). Retrieved 6
July 2020, from https://www.statista.com/statistics/184272/educational-attainment-ofcollege-diploma-or-higher-by-gender/
Economic Costs of Diabetes in the U.S. in 2017. (2018). Diabetes Care, 41(5), 917-928.
doi: 10.2337/dci18-0007
Property Crime. (2020). Retrieved 6 July 2020, from https://ucr.fbi.gov/crime-in-theu.s/2018/crime-in-the-u.s.-2018/topic-pages/property-crime
NCHS Data Visualization Gallery - Drug Poisoning Mortality. (2020). Retrieved 6 July
2020, from https://www.cdc.gov/nchs/data-visualization/drug-poisoningmortality/index.htm
Hammond, R., & Levine. (2010). The economic impact of obesity in the United
States. Diabetes, Metabolic Syndrome And Obesity: Targets And Therapy, 285. doi:
10.2147/dmsott.s7384
Only 23% of Americans Get Enough Exercise, a New Report Says. (2020). Retrieved 6
July 2020, from https://time.com/5324940/americans-exercise-physical-activityguidelines/
Download