Propensity Score Matching: ¡Empareja como un profesional! | ORBITECH

ORBITECH AI Academy

¡Imagina que eres un cupido estadístico!

¿Sabías que puedes usar técnicas estadísticas para emparejar personas, no por amor, sino por datos? ¡Así es! Con el Propensity Score Matching (PSM), puedes crear grupos comparables y sacar conclusiones más precisas. ¿Listo para aprender a emparejar como un profesional?

¿Qué es el Propensity Score Matching?

El PSM es una técnica estadística que se utiliza para reducir el sesgo en la selección de grupos de comparación. Es como si estuvieras tratando de comparar manzanas con manzanas, en lugar de manzanas con naranjas.

Definition: El Propensity Score es la probabilidad condicional de recibir un tratamiento dado un conjunto de covariables observadas.

La magia detrás del PSM

El PSM funciona calculando una probabilidad (el propensity score) para cada individuo. Esta probabilidad representa la chance de que ese individuo reciba un tratamiento basado en sus características. Luego, los individuos se emparejan según sus scores.

Formula: El propensity score $ e(x) $ se calcula típicamente usando un modelo de regresión logística: $$ e(x) = \frac{1}{1 + e^{-(\beta_0 + \beta_1 x_1 + ... + \beta_p x_p)}} $$

Pasos para realizar PSM

Estima el propensity score: Usa un modelo de regresión logística para calcular la probabilidad de recibir tratamiento.
Empareja los individuos: Usa un método de emparejamiento (como el nearest neighbor) para emparejar individuos tratados y no tratados con scores similares.
Evalúa el balance: Verifica que las covariables estén balanceadas entre los grupos emparejados.
Analiza los resultados: Compara los resultados entre los grupos emparejados.

Métodos de emparejamiento

Método	Descripción	Ventajas	Desventajas
Nearest Neighbor	Empareja cada individuo tratado con el no tratado más cercano en términos de propensity score	Simple y fácil de implementar	Puede dejar individuos sin emparejar
Stratification	Divide los individuos en estratos basados en el propensity score y luego compara dentro de cada estrato	Útil para grandes conjuntos de datos	Puede perder precisión
Radius Matching	Empareja individuos dentro de un radio específico de propensity score	Incluye más individuos en el emparejamiento	Puede incluir emparejamientos pobres

Errores comunes en PSM

Warning: No verifiques el balance después del emparejamiento. Siempre debes asegurarte de que las covariables estén balanceadas entre los grupos emparejados. Si no lo están, tus resultados pueden ser sesgados.

No incluir todas las covariables relevantes en el modelo de propensity score.
Usar un método de emparejamiento inadecuado para tus datos.
No verificar el balance después del emparejamiento.

Ejercicio práctico

Imagina que estás estudiando el efecto de un nuevo programa de capacitación en el salario de los empleados. Tienes datos de 200 empleados, 100 de los cuales participaron en el programa y 100 que no. Tus covariables incluyen edad, educación, años de experiencia y salario inicial.

Calcula el propensity score para cada empleado.
Empareja los empleados usando el método nearest neighbor.
Verifica el balance de las covariables entre los grupos emparejados.
Compara el salario final entre los grupos emparejados para evaluar el efecto del programa de capacitación.

Resumen

Key point: El Propensity Score Matching es una técnica poderosa para reducir el sesgo en estudios observacionales. Recuerda siempre verificar el balance de las covariables después del emparejamiento y elegir el método de emparejamiento adecuado para tus datos.

El PSM ayuda a crear grupos comparables en estudios observacionales.
El propensity score es la probabilidad de recibir tratamiento basado en covariables.
Hay varios métodos de emparejamiento, cada uno con sus ventajas y desventajas.
Siempre verifica el balance de las covariables después del emparejamiento.