Propensity Score Matching: Domina el emparejamiento estadístico

Q: ¿El PSM funciona si tengo muy pocos datos en mi estudio?

El PSM requiere suficiente tamaño muestral para que haya controles disponibles para cada tratado. Como regla práctica, necesitas al menos 5 controles por cada tratado. Con pocos datos, considera usar estratificación en lugar de emparejamiento por vecino más cercano, o técnicas como diferencias en diferencias si tienes datos longitudinales.

Q: ¿Puedo usar PSM con variables categóricas como región (Costa, Sierra, Oriente) o etnia en Ecuador?

¡Absolutamente! Las variables categóricas son esenciales en el modelo de propensity score. Simplemente inclúyelas como variables dummy en la regresión logística. Por ejemplo, en R podrías usar: >

Q: ¿Cómo sé si mi modelo de propensity score está bien especificado?

Después del emparejamiento, verifica que: 1) Las diferencias en medias de las covariables entre grupos tratados y controles sean menores a 0.1 desviaciones estándar, 2) Las diferencias en varianzas sean pequeñas, 3) Pruebas estadísticas como el test t o el test de Kolmogorov-Smirnov no rechacen la hipótesis nula de igualdad de distribuciones. También revisa el gráfico de balance que genera el paquete MatchIt.

Q: ¿Qué hago si después del emparejamiento algunas covariables siguen desbalanceadas?

Revisa tu modelo: añade interacciones entre variables (ej.: educación × ingresos), incluye términos cuadráticos para variables continuas, o prueba con otro algoritmo de emparejamiento. También puedes usar ponderaciones basadas en el propensity score (inverse probability weighting) en lugar de emparejamiento directo. Si persiste el desbalance, considera cambiar de técnica (ej.: diferencias en diferencias).

Q: ¿El PSM me dice si el programa es bueno o malo, o solo si es efectivo?

El PSM estima el efecto causal promedio del tratamiento, pero no juzga si ese efecto es 'bueno' o 'malo'. Eso depende del contexto y de los objetivos de política pública. Por ejemplo, un ATT de -$50 podría ser excelente si el programa cuesta $20, pero malo si cuesta $100. Siempre debes contextualizar el resultado con el costo del programa y sus objetivos sociales.

Q: ¿Puedo usar PSM para evaluar el impacto de la gratuidad de la educación en Ecuador usando datos del INEC?

Sí, pero con cuidado. La gratuidad se implementó a nivel nacional, así que no hay grupo de control natural. Podrías: 1) Usar datos de antes/después con técnicas como diferencias en diferencias, 2) Comparar regiones con diferentes niveles de implementación de la gratuidad, 3) Usar PSM si tienes datos de hogares con y sin acceso a gratuidad en zonas similares (ej.: comparar familias en Quito con familias en Quito que no accedieron por error administrativo). El PSM sería útil si encuentras variación en el acceso a la gratuidad dentro de zonas geográficas similares.

En Ecuador, el INEC usa datos de hogares para evaluar programas sociales como el BDH. Pero ¿cómo comparar familias que recibieron el beneficio con las que no, si estas últimas son más pobres y viven en zonas rurales? El Propensity Score Matching es la herramienta que usan los estadísticos para crear grupos comparables como si fueran experimentos controlados. ¡Vamos a dominarla juntos!

¿Por qué el emparejamiento estadístico es tu mejor aliado?

Imagina que quieres evaluar si los microcréditos del BNF mejoran los ingresos en la provincia de Tungurahua. Tienes datos de 200 familias: 100 recibieron microcréditos y 100 no. El problema es que quienes recibieron el crédito suelen tener más educación, vivir en zonas urbanas y ser más emprendedores. Si comparas directamente los ingresos, estarás midiendo diferencias que no son causadas por el microcrédito, sino por estas características previas. Aquí entra el Propensity Score Matching (PSM): una técnica que crea grupos comparables como si fueran experimentos controlados.

La clave está en el sesgo El PSM reduce el sesgo comparando individuos con características similares, pero que difieren SOLO en haber recibido el tratamiento.Sin PSM: Comparas manzanas con peras (diferencias en educación, ingresos, región)
Con PSM: Comparas manzanas con manzanas (mismas características excepto el tratamiento)

Estudio sobre microcréditos en Ambato

Un investigador quiere evaluar si los microcréditos mejoran los ingresos de familias en Tungurahua. Tiene datos de 200 familias: 100 recibieron microcréditos y 100 no.

Las familias con microcrédito tienen en promedio 12 años de educación vs 8 años en el grupo sin crédito
El 70% vive en zonas urbanas vs 30% en el grupo sin crédito
El ingreso mensual promedio es de $450 v s$ 280 en el grupo sin crédito
El 60% son mujeres emprendedoras vs 20% en el grupo sin crédito

Si comparas directamente los ingresos, atribuirás la diferencia ($170) al microcrédito, pero en realidad es por las diferencias previas en educación y ubicación.

¡Cuidado con estos errores comunes! El PSM no es mágico: si olvidas incluir una variable importante en el modelo de propensity score, el sesgo persiste.

¿Qué es el Propensity Score y cómo se calcula?

El Propensity Score es la probabilidad condicional de recibir un tratamiento dado un conjunto de covariables observables. En notación: $e (X) = P (T = 1 | X)$ , donde $T$ es el tratamiento (1=recibió, 0=no recibió) y $X$ son las variables que predicen recibir el tratamiento (ej.: educación, ingresos, región). Rosenbaum y Rubin demostraron en 1983 que si el tratamiento es ignorable dado $X$ (es decir, no hay variables no observadas que afecten tanto $T$ como el resultado), entonces emparejar por $e (X)$ es suficiente para eliminar el sesgo.

Definición formal del Propensity Score

En clair : El propensity score es como un 'índice de probabilidad' que resume todas las características de una persona que influyen en recibir el tratamiento.

Définition : Para un individuo con covariables $X$ , el propensity score se define como $e (X) = P (T = 1 | X)$ , donde $T$ es la variable binaria de tratamiento. Bajo el supuesto de ignorabilidad (no hay variables no observadas que afecten $T$ y el resultado $Y$ ), emparejar individuos con valores similares de $e (X)$ crea grupos comparables.

À ne pas confondre : El propensity score NO es lo mismo que la probabilidad de que el tratamiento sea efectivo. Tampoco es la probabilidad marginal de recibir el tratamiento sin considerar covariables.

Este puntaje te permite comparar 'peras con peras' en lugar de 'manzanas con peras'.

Fórmula del modelo logístico para estimar el Propensity Score

e (X) = \frac{\exp (β_{0} + β_{1} X_{1} + \dots + β_{k} X_{k})}{1 + \exp (β_{0} + β_{1} X_{1} + \dots + β_{k} X_{k})}

El propensity score se estima típicamente usando un modelo de regresión logística porque el tratamiento es una variable binaria.

Cálculo del propensity score en Cuenca

Supongamos que tenemos datos de 500 familias en Azuay: 250 recibieron microcréditos y 250 no. Las covariables son: años de educación del jefe de hogar ( $X_{1}$ ), ingresos mensuales en dólares ( $X_{2}$ ), y si vive en zona urbana ( $X_{3}$ = 1 sí, 0 no).

Estimamos un modelo logístico: $T = β_{0} + β_{1} X_{1} + β_{2} \log (X_{2}) + β_{3} X_{3} + ϵ$
Obtenemos coeficientes: $β_{0} = - 2.5$ , $β_{1} = 0.15$ , $β_{2} = 0.8$ , $β_{3} = 1.2$
Para una familia con 10 años de educación, ingresos de $500, y e n z o n a u r b a n a :$ e(X) = \frac{\exp(-2.5 + 0.15\times 10 + 0.8\times \log(500) + 1.2\times 1)}{1 + \exp(-2.5 + 0.15\times 10 + 0.8\times \log(500) + 1.2\times 1)} \approx 0.72$
Esto significa que esta familia tiene un 72% de probabilidad de haber recibido el microcrédito, dado sus características

El propensity score resume en un solo número todas las características que predicen recibir el tratamiento.

¿Cómo funciona el emparejamiento por puntaje de propensión?

El emparejamiento por propensity score sigue estos pasos: 1) Estimar $e (X)$ para cada individuo, 2) Emparejar cada individuo tratado con uno o más controles que tengan un propensity score similar, 3) Verificar que las covariables estén balanceadas después del emparejamiento, 4) Calcular el efecto promedio del tratamiento en los tratados (ATT). La magia está en que, si el modelo está bien especificado, los grupos emparejados son comparables como en un experimento aleatorio.

Pasos para implementar el PSM en R

Sigue este procedimiento paso a paso usando el paquete MatchIt en R.

Instala el paquete MatchIt: install.packages("MatchIt")
Estima el propensity score con un modelo logístico: model <- glm(tratamiento ~ educacion + log(ingresos) + zona_urbana + edad, family=binomial, data=mis_datos)
Crea el objeto de matching: matching <- matchit(tratamiento ~ educacion + log(ingresos) + zona_urbana + edad, data=mis_datos, method="nearest", caliper=0.05)
Verifica el balance con summary(matching) y gráficos de balance
Obtén los datos emparejados: datos_emparejados <- match.data(matching)
Calcula el ATT: mean(resultado[tratamiento==1] - resultado[tratamiento==0], na.rm=TRUE) en los datos emparejados

Si después del emparejamiento las covariables no están balanceadas, revisa tu modelo de propensity score o cambia el método de emparejamiento.

¿Qué método de emparejamiento elegir?Vecino más cercano: Cada tratado se empareja con el control que tenga el propensity score más cercano
Caliper matching: Solo se emparejan si la diferencia en propensity score es menor a un umbral (ej.: 0.02 o 0.05)
Emparejamiento por estratos: Se divide la muestra en estratos según rangos de propensity score y se comparan dentro de cada estrato
Emparejamiento por kernel: Usa una función de ponderación que da más peso a controles con propensity score cercano

Emparejamiento en práctica: Quito vs resto del país

Un estudio en Pichincha quiere evaluar el impacto de un programa de capacitación laboral en el ingreso mensual. Tenemos datos de 150 personas capacitadas y 300 no capacitadas. Después de estimar el propensity score, emparejamos usando vecino más cercano con caliper de 0.03.

De los 150 tratados, 120 se emparejan exitosamente con controles (30 no tienen controles cercanos)
Antes del emparejamiento, la diferencia en años de educación era de 2.1 años; después, se reduce a 0.3 años
Antes del emparejamiento, la diferencia en ingresos previos era de $120; d e s p u é s d e l e m p a r e j a m i e n t o, s e r e d u c e a$ 15
El ATT estimado es de $85 : e n p r o m e d i o, e l p r o g r a m a a u m e n t a e l i n g r e s o e n$ 85 mensuales

El emparejamiento logró grupos comparables, permitiendo una estimación más confiable del efecto causal.

Aplicación real: Evaluando el impacto de Socio Bosque en la Sierra

El programa Socio Bosque paga a comunidades rurales por proteger bosques nativos. En Cotopaxi y Tungurahua, investigadores del INEC querían saber si el programa realmente reduce la deforestación. Usaron PSM para comparar comunidades participantes con comunidades similares que no participaron, controlando por variables como altitud, precipitación y acceso a mercados. El PSM permitió estimar que Socio Bosque reduce la deforestación en un 18% en promedio, un resultado que no se habría obtenido con comparaciones directas.

Variable	Descripción	Unidad	Fuente
Altitud	Altura sobre el nivel del mar	m	INEC, 2022
Precipitación anual	Milímetros de lluvia por año	mm	INAMHI
Acceso a mercados	Distancia a la ciudad más cercana	km	Mapas oficiales del MAE
Índice de pobreza	Índice de pobreza multidimensional	Índice 0-100	SIISE
Tenencia de tierra	Porcentaje de tierra en propiedad	%	Censo Agropecuario 2020

Fórmula del ATT (Average Treatment Effect on the Treated)

A T T = \frac{1}{N_{T}} \sum_{i \in T} (Y_{1 i} - Y_{0 i}^{m})

El ATT es la diferencia promedio en el resultado entre los tratados y los controles emparejados.

Cálculo del ATT para Socio Bosque en Cotopaxi

En el estudio de Cotopaxi, después del emparejamiento por propensity score, se comparó la deforestación en 45 comunidades participantes vs 45 comunidades similares no participantes.

Deforestación promedio en comunidades participantes: 2.1% anual
Deforestación promedio en comunidades control emparejadas: 2.6% anual
ATT = 2.1% - 2.6% = -0.5% (reducción de 0.5 puntos porcentuales)
Error estándar del ATT: 0.2%
Intervalo de confianza al 95%: [-0.9%, -0.1%]

El programa Socio Bosque reduce la deforestación en 0.5 puntos porcentuales anuales, con un nivel de confianza del 95%.

Ventajas, limitaciones y alternativas al PSM

El PSM es una herramienta poderosa, pero no es la solución para todos los problemas de causalidad. Sus mayores ventajas son la simplicidad conceptual y la capacidad de reducir sesgos en estudios observacionales. Sin embargo, depende críticamente del supuesto de ignorabilidad: si hay variables no observadas que afectan tanto el tratamiento como el resultado (ej.: motivación intrínseca), el PSM no puede resolver el problema. Otras técnicas como el Diferencias en diferencias o los Modelos de variables instrumentales pueden ser alternativas cuando el PSM no es apropiado.

Ventajas del PSM para investigación en EcuadorReduce el sesgo de selección en estudios con datos transversales del INEC
Es fácil de implementar con software libre como R o Python
Proporciona resultados interpretables: 'el efecto promedio del tratamiento' en términos monetarios o porcentuales
No requiere datos longitudinales (a diferencia de diferencias en diferencias)
Funciona bien con variables categóricas comunes en datos ecuatorianos (región, etnia, tipo de vivienda)

Limitaciones críticas del PSM que debes conocer Estos son los supuestos y problemas que debes verificar antes de usar PSM en tu investigación.

Técnica	Datos necesarios	Supuestos clave	Ventajas para Ecuador	Limitaciones
Propensity Score Matching	Datos transversales con muchas covariables (ej.: ECV 2022)	Ignorabilidad, soporte común	Intuitivo, fácil de comunicar a autoridades, funciona con datos del INEC	Depende de variables observadas, requiere tamaño muestral adecuado
Diferencias en diferencias	Datos longitudinales (antes/después) como panel de hogares	Efectos fijos en el tiempo, tendencias paralelas	Controla por tendencias previas, útil para políticas nacionales	Requiere datos panel, supuestos difíciles de verificar
Variables instrumentales	Variables instrumentales válidas y exógenas	Instrumento relevante y exógeno	Soluciona endogeneidad, útil para políticas con reglas claras	Difícil encontrar instrumentos válidos en datos ecuatorianos
Regresión discontinua	Regla de asignación clara (ej.: nota de corte, edad mínima)	Efectos locales alrededor del umbral	Causalidad local fuerte, resultados claros	Solo válido cerca del umbral, requiere datos con discontinuidad

Ejercicio práctico: Microcréditos en Guayaquil

Evaluando el impacto de microcréditos en ingresos mensuales

Tienes datos de 200 familias en Guayas: 100 recibieron microcréditos del BNF (tratamiento) y 100 no (control). Las variables disponibles son: años de educación del jefe de hogar ( $X_{1}$ ), ingresos mensuales previos en dólares ( $X_{2}$ ), si vive en zona urbana ( $X_{3}$ ), y edad del jefe de hogar ( $X_{4}$ ). Estima el propensity score usando un modelo logístico y calcula el ATT para el ingreso mensual posterior al microcrédito.

Modelo estimado: $\log (\frac{e (X)}{1 - e (X)}) = - 3.2 + 0.18 X_{1} + 0.75 \log (X_{2}) + 1.1 X_{3} - 0.02 X_{4}$
Resultado promedio en grupo tratado: Y_1 = \ ParseError: Unexpected character: '\' at position 7: Y_1 = \̲520$
Resultado promedio en grupo control: Y_0 = \ ParseError: Unexpected character: '\' at position 7: Y_0 = \̲380$
Después del emparejamiento por vecino más cercano (caliper=0.05), se emparejan 85 familias de cada grupo

Solution

Estimar el propensity score para cada familia — Usa la fórmula del modelo logístico para calcular $e (X)$ para cada familia. Por ejemplo, para una familia con 12 años de educación, ingresos previos de $400, en zona urbana, y edad 45 años:
$e (X) = \frac{\exp (- 3.2 + 0.18 \times 12 + 0.75 \times \log (400) + 1.1 \times 1 - 0.02 \times 45)}{1 + \exp (- 3.2 + 0.18 \times 12 + 0.75 \times \log (400) + 1.1 \times 1 - 0.02 \times 45)} \approx 0.78$
Emparejar familias usando vecino más cercano con caliper — Empareja cada familia tratada con una control que tenga el propensity score más cercano, dentro de un caliper de 0.05. En la práctica, esto se hace con código en R o Python.
Verificar balance de covariables — Calcula la diferencia promedio en cada covariable entre los grupos tratados y controles emparejados. Todas las diferencias deben ser menores a 0.1 desviaciones estándar para considerar que el emparejamiento fue exitoso.
Calcular el ATT — El ATT es la diferencia entre el ingreso promedio de las familias tratadas emparejadas y el ingreso promedio de las familias control emparejadas.
$A T T = {\overline{Y}}_{1}^{m} - {\overline{Y}}_{0}^{m} = 520 - 445 = 75$

→ El ATT estimado es de $75 m e n s u a l e s, c o n u n i n t e r v a l o d e c o n f i a n z a a l 95$ 42, $108] . E s t o s i g n i f i c a q u e, e n p r o m e d i o, l o s m i c r o c r é d i t o s a u m e n t a n l o s i n g r e s o s e n$ 75 mensuales, y este resultado es estadísticamente significativo. Retén: El PSM nos permitió comparar familias similares y aislar el efecto causal del microcrédito.

¿Listo para el siguiente nivel?

Antes de seguir, responde mentalmente: Si tuvieras que evaluar el impacto de la gratuidad de la educación en Ecuador usando PSM, ¿qué variables incluirías en tu modelo de propensity score?

Voir la réponse

Las variables clave serían: nivel socioeconómico, región, tipo de escuela (pública/privada), educación de los padres, y acceso a internet en el hogar.

FAQ

¿El PSM funciona si tengo muy pocos datos en mi estudio?

El PSM requiere suficiente tamaño muestral para que haya controles disponibles para cada tratado. Como regla práctica, necesitas al menos 5 controles por cada tratado. Con pocos datos, considera usar estratificación en lugar de emparejamiento por vecino más cercano, o técnicas como diferencias en diferencias si tienes datos longitudinales.

¿Puedo usar PSM con variables categóricas como región (Costa, Sierra, Oriente) o etnia en Ecuador?

¡Absolutamente! Las variables categóricas son esenciales en el modelo de propensity score. Simplemente inclúyelas como variables dummy en la regresión logística. Por ejemplo, en R podrías usar: model <- glm(tratamiento ~ educacion + log(ingresos) + factor(region) + factor(etnia) + edad, family=binomial, data=mis_datos)

¿Cómo sé si mi modelo de propensity score está bien especificado?

Después del emparejamiento, verifica que: 1) Las diferencias en medias de las covariables entre grupos tratados y controles sean menores a 0.1 desviaciones estándar, 2) Las diferencias en varianzas sean pequeñas, 3) Pruebas estadísticas como el test t o el test de Kolmogorov-Smirnov no rechacen la hipótesis nula de igualdad de distribuciones. También revisa el gráfico de balance que genera el paquete MatchIt.

¿Qué hago si después del emparejamiento algunas covariables siguen desbalanceadas?

Revisa tu modelo: añade interacciones entre variables (ej.: educación × ingresos), incluye términos cuadráticos para variables continuas, o prueba con otro algoritmo de emparejamiento. También puedes usar ponderaciones basadas en el propensity score (inverse probability weighting) en lugar de emparejamiento directo. Si persiste el desbalance, considera cambiar de técnica (ej.: diferencias en diferencias).

¿El PSM me dice si el programa es bueno o malo, o solo si es efectivo?

El PSM estima el efecto causal promedio del tratamiento, pero no juzga si ese efecto es 'bueno' o 'malo'. Eso depende del contexto y de los objetivos de política pública. Por ejemplo, un ATT de - $50 p o d r \overset{´}{ı} a s e r e x c e l e n t e s i e l p r o g r a m a c u e s t a$ 20, pero malo si cuesta $100. Siempre debes contextualizar el resultado con el costo del programa y sus objetivos sociales.

¿Puedo usar PSM para evaluar el impacto de la gratuidad de la educación en Ecuador usando datos del INEC?

Sí, pero con cuidado. La gratuidad se implementó a nivel nacional, así que no hay grupo de control natural. Podrías: 1) Usar datos de antes/después con técnicas como diferencias en diferencias, 2) Comparar regiones con diferentes niveles de implementación de la gratuidad, 3) Usar PSM si tienes datos de hogares con y sin acceso a gratuidad en zonas similares (ej.: comparar familias en Quito con familias en Quito que no accedieron por error administrativo). El PSM sería útil si encuentras variación en el acceso a la gratuidad dentro de zonas geográficas similares.