En Ecuador, el INEC usa datos de hogares para evaluar programas sociales como el BDH. Pero ¿cómo comparar familias que recibieron el beneficio con las que no, si estas últimas son más pobres y viven en zonas rurales? El Propensity Score Matching es la herramienta que usan los estadísticos para crear grupos comparables como si fueran experimentos controlados. ¡Vamos a dominarla juntos!
¿Por qué el emparejamiento estadístico es tu mejor aliado?
Imagina que quieres evaluar si los microcréditos del BNF mejoran los ingresos en la provincia de Tungurahua. Tienes datos de 200 familias: 100 recibieron microcréditos y 100 no. El problema es que quienes recibieron el crédito suelen tener más educación, vivir en zonas urbanas y ser más emprendedores. Si comparas directamente los ingresos, estarás midiendo diferencias que no son causadas por el microcrédito, sino por estas características previas. Aquí entra el Propensity Score Matching (PSM): una técnica que crea grupos comparables como si fueran experimentos controlados.
- Sin PSM: Comparas manzanas con peras (diferencias en educación, ingresos, región)
- Con PSM: Comparas manzanas con manzanas (mismas características excepto el tratamiento)
Un investigador quiere evaluar si los microcréditos mejoran los ingresos de familias en Tungurahua. Tiene datos de 200 familias: 100 recibieron microcréditos y 100 no.
- Las familias con microcrédito tienen en promedio 12 años de educación vs 8 años en el grupo sin crédito
- El 70% vive en zonas urbanas vs 30% en el grupo sin crédito
- El ingreso mensual promedio es de 280 en el grupo sin crédito
- El 60% son mujeres emprendedoras vs 20% en el grupo sin crédito
Si comparas directamente los ingresos, atribuirás la diferencia ($170) al microcrédito, pero en realidad es por las diferencias previas en educación y ubicación.
¿Qué es el Propensity Score y cómo se calcula?
El Propensity Score es la probabilidad condicional de recibir un tratamiento dado un conjunto de covariables observables. En notación: , donde es el tratamiento (1=recibió, 0=no recibió) y son las variables que predicen recibir el tratamiento (ej.: educación, ingresos, región). Rosenbaum y Rubin demostraron en que si el tratamiento es ignorable dado (es decir, no hay variables no observadas que afecten tanto como el resultado), entonces emparejar por es suficiente para eliminar el sesgo.
En clair : El propensity score es como un 'índice de probabilidad' que resume todas las características de una persona que influyen en recibir el tratamiento.
Définition : Para un individuo con covariables , el propensity score se define como , donde es la variable binaria de tratamiento. Bajo el supuesto de ignorabilidad (no hay variables no observadas que afecten y el resultado ), emparejar individuos con valores similares de crea grupos comparables.
À ne pas confondre : El propensity score NO es lo mismo que la probabilidad de que el tratamiento sea efectivo. Tampoco es la probabilidad marginal de recibir el tratamiento sin considerar covariables.
Este puntaje te permite comparar 'peras con peras' en lugar de 'manzanas con peras'.
El propensity score se estima típicamente usando un modelo de regresión logística porque el tratamiento es una variable binaria.
Supongamos que tenemos datos de 500 familias en Azuay: 250 recibieron microcréditos y 250 no. Las covariables son: años de educación del jefe de hogar (), ingresos mensuales en dólares (), y si vive en zona urbana ( = 1 sí, 0 no).
- Estimamos un modelo logístico:
- Obtenemos coeficientes: , , ,
- Para una familia con 10 años de educación, ingresos de e(X) = \frac{\exp(-2.5 + 0.15\times 10 + 0.8\times \log(500) + 1.2\times 1)}{1 + \exp(-2.5 + 0.15\times 10 + 0.8\times \log(500) + 1.2\times 1)} \approx 0.72$
- Esto significa que esta familia tiene un 72% de probabilidad de haber recibido el microcrédito, dado sus características
El propensity score resume en un solo número todas las características que predicen recibir el tratamiento.
¿Cómo funciona el emparejamiento por puntaje de propensión?
El emparejamiento por propensity score sigue estos pasos: 1) Estimar para cada individuo, 2) Emparejar cada individuo tratado con uno o más controles que tengan un propensity score similar, 3) Verificar que las covariables estén balanceadas después del emparejamiento, 4) Calcular el efecto promedio del tratamiento en los tratados (ATT). La magia está en que, si el modelo está bien especificado, los grupos emparejados son comparables como en un experimento aleatorio.
Sigue este procedimiento paso a paso usando el paquete MatchIt en R.
- Instala el paquete MatchIt: install.packages("MatchIt")
- Estima el propensity score con un modelo logístico: model <- glm(tratamiento ~ educacion + log(ingresos) + zona_urbana + edad, family=binomial, data=mis_datos)
- Crea el objeto de matching: matching <- matchit(tratamiento ~ educacion + log(ingresos) + zona_urbana + edad, data=mis_datos, method="nearest", caliper=0.05)
- Verifica el balance con summary(matching) y gráficos de balance
- Obtén los datos emparejados: datos_emparejados <- match.data(matching)
- Calcula el ATT: mean(resultado[tratamiento==1] - resultado[tratamiento==0], na.rm=TRUE) en los datos emparejados
Si después del emparejamiento las covariables no están balanceadas, revisa tu modelo de propensity score o cambia el método de emparejamiento.
- Vecino más cercano: Cada tratado se empareja con el control que tenga el propensity score más cercano
- Caliper matching: Solo se emparejan si la diferencia en propensity score es menor a un umbral (ej.: 0.02 o 0.05)
- Emparejamiento por estratos: Se divide la muestra en estratos según rangos de propensity score y se comparan dentro de cada estrato
- Emparejamiento por kernel: Usa una función de ponderación que da más peso a controles con propensity score cercano
Un estudio en Pichincha quiere evaluar el impacto de un programa de capacitación laboral en el ingreso mensual. Tenemos datos de 150 personas capacitadas y 300 no capacitadas. Después de estimar el propensity score, emparejamos usando vecino más cercano con caliper de 0.03.
- De los 150 tratados, 120 se emparejan exitosamente con controles (30 no tienen controles cercanos)
- Antes del emparejamiento, la diferencia en años de educación era de 2.1 años; después, se reduce a 0.3 años
- Antes del emparejamiento, la diferencia en ingresos previos era de 15
- El ATT estimado es de 85 mensuales
El emparejamiento logró grupos comparables, permitiendo una estimación más confiable del efecto causal.
Aplicación real: Evaluando el impacto de Socio Bosque en la Sierra
El programa Socio Bosque paga a comunidades rurales por proteger bosques nativos. En Cotopaxi y Tungurahua, investigadores del INEC querían saber si el programa realmente reduce la deforestación. Usaron PSM para comparar comunidades participantes con comunidades similares que no participaron, controlando por variables como altitud, precipitación y acceso a mercados. El PSM permitió estimar que Socio Bosque reduce la deforestación en un 18% en promedio, un resultado que no se habría obtenido con comparaciones directas.
| Variable | Descripción | Unidad | Fuente |
|---|---|---|---|
| Altitud | Altura sobre el nivel del mar | m | INEC, 2022 |
| Precipitación anual | Milímetros de lluvia por año | mm | INAMHI |
| Acceso a mercados | Distancia a la ciudad más cercana | km | Mapas oficiales del MAE |
| Índice de pobreza | Índice de pobreza multidimensional | Índice 0-100 | SIISE |
| Tenencia de tierra | Porcentaje de tierra en propiedad | % | Censo Agropecuario |
El ATT es la diferencia promedio en el resultado entre los tratados y los controles emparejados.
En el estudio de Cotopaxi, después del emparejamiento por propensity score, se comparó la deforestación en 45 comunidades participantes vs 45 comunidades similares no participantes.
- Deforestación promedio en comunidades participantes: 2.1% anual
- Deforestación promedio en comunidades control emparejadas: 2.6% anual
- ATT = 2.1% - 2.6% = -0.5% (reducción de 0.5 puntos porcentuales)
- Error estándar del ATT: 0.2%
- Intervalo de confianza al 95%: [-0.9%, -0.1%]
El programa Socio Bosque reduce la deforestación en 0.5 puntos porcentuales anuales, con un nivel de confianza del 95%.
Ventajas, limitaciones y alternativas al PSM
El PSM es una herramienta poderosa, pero no es la solución para todos los problemas de causalidad. Sus mayores ventajas son la simplicidad conceptual y la capacidad de reducir sesgos en estudios observacionales. Sin embargo, depende críticamente del supuesto de ignorabilidad: si hay variables no observadas que afectan tanto el tratamiento como el resultado (ej.: motivación intrínseca), el PSM no puede resolver el problema. Otras técnicas como el Diferencias en diferencias o los Modelos de variables instrumentales pueden ser alternativas cuando el PSM no es apropiado.
- Reduce el sesgo de selección en estudios con datos transversales del INEC
- Es fácil de implementar con software libre como R o Python
- Proporciona resultados interpretables: 'el efecto promedio del tratamiento' en términos monetarios o porcentuales
- No requiere datos longitudinales (a diferencia de diferencias en diferencias)
- Funciona bien con variables categóricas comunes en datos ecuatorianos (región, etnia, tipo de vivienda)
| Técnica | Datos necesarios | Supuestos clave | Ventajas para Ecuador | Limitaciones |
|---|---|---|---|---|
| Propensity Score Matching | Datos transversales con muchas covariables (ej.: ECV 2022) | Ignorabilidad, soporte común | Intuitivo, fácil de comunicar a autoridades, funciona con datos del INEC | Depende de variables observadas, requiere tamaño muestral adecuado |
| Diferencias en diferencias | Datos longitudinales (antes/después) como panel de hogares | Efectos fijos en el tiempo, tendencias paralelas | Controla por tendencias previas, útil para políticas nacionales | Requiere datos panel, supuestos difíciles de verificar |
| Variables instrumentales | Variables instrumentales válidas y exógenas | Instrumento relevante y exógeno | Soluciona endogeneidad, útil para políticas con reglas claras | Difícil encontrar instrumentos válidos en datos ecuatorianos |
| Regresión discontinua | Regla de asignación clara (ej.: nota de corte, edad mínima) | Efectos locales alrededor del umbral | Causalidad local fuerte, resultados claros | Solo válido cerca del umbral, requiere datos con discontinuidad |
Ejercicio práctico: Microcréditos en Guayaquil
Evaluando el impacto de microcréditos en ingresos mensuales
Tienes datos de 200 familias en Guayas: 100 recibieron microcréditos del BNF (tratamiento) y 100 no (control). Las variables disponibles son: años de educación del jefe de hogar (), ingresos mensuales previos en dólares (), si vive en zona urbana (), y edad del jefe de hogar (). Estima el propensity score usando un modelo logístico y calcula el ATT para el ingreso mensual posterior al microcrédito.
- Modelo estimado:
- Resultado promedio en grupo tratado: Y_1 = \ ParseError: Unexpected character: '\' at position 7: Y_1 = \̲520$
- Resultado promedio en grupo control: Y_0 = \ ParseError: Unexpected character: '\' at position 7: Y_0 = \̲380$
- Después del emparejamiento por vecino más cercano (caliper=0.05), se emparejan 85 familias de cada grupo
Solution
- Estimar el propensity score para cada familia — Usa la fórmula del modelo logístico para calcular para cada familia. Por ejemplo, para una familia con 12 años de educación, ingresos previos de $400, en zona urbana, y edad 45 años:
- Emparejar familias usando vecino más cercano con caliper — Empareja cada familia tratada con una control que tenga el propensity score más cercano, dentro de un caliper de 0.05. En la práctica, esto se hace con código en R o Python.
- Verificar balance de covariables — Calcula la diferencia promedio en cada covariable entre los grupos tratados y controles emparejados. Todas las diferencias deben ser menores a 0.1 desviaciones estándar para considerar que el emparejamiento fue exitoso.
- Calcular el ATT — El ATT es la diferencia entre el ingreso promedio de las familias tratadas emparejadas y el ingreso promedio de las familias control emparejadas.
→ El ATT estimado es de 42, 75 mensuales, y este resultado es estadísticamente significativo. Retén: El PSM nos permitió comparar familias similares y aislar el efecto causal del microcrédito.
Antes de seguir, responde mentalmente: Si tuvieras que evaluar el impacto de la gratuidad de la educación en Ecuador usando PSM, ¿qué variables incluirías en tu modelo de propensity score?
Voir la réponse
Las variables clave serían: nivel socioeconómico, región, tipo de escuela (pública/privada), educación de los padres, y acceso a internet en el hogar.
FAQ
¿El PSM funciona si tengo muy pocos datos en mi estudio?
El PSM requiere suficiente tamaño muestral para que haya controles disponibles para cada tratado. Como regla práctica, necesitas al menos 5 controles por cada tratado. Con pocos datos, considera usar estratificación en lugar de emparejamiento por vecino más cercano, o técnicas como diferencias en diferencias si tienes datos longitudinales.
¿Puedo usar PSM con variables categóricas como región (Costa, Sierra, Oriente) o etnia en Ecuador?
¡Absolutamente! Las variables categóricas son esenciales en el modelo de propensity score. Simplemente inclúyelas como variables dummy en la regresión logística. Por ejemplo, en R podrías usar: model <- glm(tratamiento ~ educacion + log(ingresos) + factor(region) + factor(etnia) + edad, family=binomial, data=mis_datos)
¿Cómo sé si mi modelo de propensity score está bien especificado?
Después del emparejamiento, verifica que: 1) Las diferencias en medias de las covariables entre grupos tratados y controles sean menores a 0.1 desviaciones estándar, 2) Las diferencias en varianzas sean pequeñas, 3) Pruebas estadísticas como el test t o el test de Kolmogorov-Smirnov no rechacen la hipótesis nula de igualdad de distribuciones. También revisa el gráfico de balance que genera el paquete MatchIt.
¿Qué hago si después del emparejamiento algunas covariables siguen desbalanceadas?
Revisa tu modelo: añade interacciones entre variables (ej.: educación × ingresos), incluye términos cuadráticos para variables continuas, o prueba con otro algoritmo de emparejamiento. También puedes usar ponderaciones basadas en el propensity score (inverse probability weighting) en lugar de emparejamiento directo. Si persiste el desbalance, considera cambiar de técnica (ej.: diferencias en diferencias).
¿El PSM me dice si el programa es bueno o malo, o solo si es efectivo?
El PSM estima el efecto causal promedio del tratamiento, pero no juzga si ese efecto es 'bueno' o 'malo'. Eso depende del contexto y de los objetivos de política pública. Por ejemplo, un ATT de -20, pero malo si cuesta $100. Siempre debes contextualizar el resultado con el costo del programa y sus objetivos sociales.
¿Puedo usar PSM para evaluar el impacto de la gratuidad de la educación en Ecuador usando datos del INEC?
Sí, pero con cuidado. La gratuidad se implementó a nivel nacional, así que no hay grupo de control natural. Podrías: 1) Usar datos de antes/después con técnicas como diferencias en diferencias, 2) Comparar regiones con diferentes niveles de implementación de la gratuidad, 3) Usar PSM si tienes datos de hogares con y sin acceso a gratuidad en zonas similares (ej.: comparar familias en Quito con familias en Quito que no accedieron por error administrativo). El PSM sería útil si encuentras variación en el acceso a la gratuidad dentro de zonas geográficas similares.