Fundamentos de causalidad estadística
Conceptos básicos para diferenciar asociación estadística de relación causal en datos ecuatorianos
Formes alternatives
- — Forma alternativa usando covarianza y desviaciones estándar
| Symbole | Signification | Unité |
|---|---|---|
| r | coeficiente de correlación de Pearson Valores entre -1 y 1. r=0 indica ausencia de correlación lineal. | |
| x_i | valor de la variable x en la observación i Ejemplo: precio del banano en mercado de Quito | |
| y_i | valor de la variable y en la observación i Ejemplo: precio del banano en mercado de Guayaquil | |
| n | número de observaciones Ejemplo: 12 meses de datos | |
| \bar{x} | media de la variable x | |
| \bar{y} | media de la variable y |
Exemple : Datos mensuales de precio de banano en mercados de Quito () y Guayaquil (): (0.75, 0.72), (0.80, 0.78), (0.85, 0.83). Calcula r y determina si hay correlación lineal.
Formes alternatives
- — Caso de varianzas iguales y muestras de igual tamaño
| Symbole | Signification | Unité |
|---|---|---|
| t | estadístico t de Student Se compara con valor crítico de tabla t-Student | |
| \bar{x}_1 | media de la muestra 1 Ejemplo: promedio de notas Ser Bachiller en colegios fiscales | |
| \bar{x}_2 | media de la muestra 2 Ejemplo: promedio de notas Ser Bachiller en colegios particulares | |
| s_1 | desviación estándar muestra 1 | |
| s_2 | desviación estándar muestra 2 | |
| n_1 | tamaño muestra 1 Ejemplo: 50 estudiantes | |
| n_2 | tamaño muestra 2 Ejemplo: 50 estudiantes |
Exemple : Comparación de notas promedio en Ser Bachiller entre estudiantes de Ambato (n=45, media=720, desviación=50) y Cuenca (n=48, media=745, desviación=45). Calcula t y determina si hay diferencia significativa.
| Symbole | Signification | Unité |
|---|---|---|
| \chi^2 | estadístico chi-cuadrado Se compara con valor crítico de tabla chi-cuadrado | |
| O_i | frecuencia observada en categoría i Ejemplo: número de estudiantes que eligen carreras STEM en Sierra | |
| E_i | frecuencia esperada en categoría i Calculada bajo hipótesis de independencia | |
| k | número de categorías Ejemplo: 3 regiones (Costa, Sierra, Amazonía) |
Exemple : Tabla de preferencia de carrera universitaria (STEM vs no STEM) por región (Costa vs Sierra). Frecuencias observadas: [120, 80, 90, 110]. Calcula chi-cuadrado para probar independencia.
Modelos de regresión para inferencia causal
Herramientas estadísticas para modelar y evaluar relaciones causales con datos de Ecuador
Formes alternatives
- — Valor esperado de y dado x
| Symbole | Signification | Unité |
|---|---|---|
| y | variable respuesta o dependiente Ejemplo: consumo de energía eléctrica en hogares (kWh/mes) | |
| x | variable explicativa o independiente Ejemplo: temperatura media mensual en Quito (°C) | |
| \beta_0 | intercepto Valor de y cuando x=0 | |
| \beta_1 | pendiente Cambio en y por unidad de x. Interpretación causal solo si x es causa de y | |
| \varepsilon | error aleatorio Distribuido normal(0, σ²) |
Exemple : Modela la relación entre temperatura media mensual en Quito (°C) y consumo de energía eléctrica en 20 hogares (kWh/mes). Datos: (14, 120), (16, 135), (12, 105).
| Symbole | Signification | Unité |
|---|---|---|
| R^2 | coeficiente de determinación Valores entre 0 y 1. 0.8 significa que 80% de variabilidad en y es explicada por x | |
| SS_{res} | suma de cuadrados de residuos Variabilidad no explicada por el modelo | |
| SS_{tot} | suma total de cuadrados Variabilidad total en y | |
| SS_{reg} | suma de cuadrados de regresión Variabilidad explicada por el modelo |
Exemple : En el modelo de temperatura vs consumo eléctrico, si S=2500 y S=12500, calcula R² e interpreta su significado.
| Symbole | Signification | Unité |
|---|---|---|
| F | estadístico F de Fisher Se compara con valor crítico F(p, n-p-1) | |
| MS_{reg} | cuadrado medio de regresión S dividido por grados de libertad (p) | |
| MS_{res} | cuadrado medio de residuos S dividido por grados de libertad (n-p-1) | |
| p | número de variables explicativas Ejemplo: p=1 en regresión simple | |
| n | tamaño de la muestra Ejemplo: n=20 hogares |
Exemple : En el modelo de temperatura vs consumo eléctrico (n=20), si S=10000 y S=2500, calcula F y determina si el modelo es significativo.
| Symbole | Signification | Unité |
|---|---|---|
| OR | odds ratio OR=1 indica no asociación. OR>1 asociación positiva. OR<1 asociación negativa | |
| a | casos expuestos con resultado positivo Ejemplo: estudiantes con acceso a internet que aprueban Ser Bachiller | |
| b | casos expuestos con resultado negativo Ejemplo: estudiantes con acceso a internet que no aprueban Ser Bachiller | |
| c | controles con resultado positivo Ejemplo: estudiantes sin acceso a internet que aprueban Ser Bachiller | |
| d | controles con resultado negativo Ejemplo: estudiantes sin acceso a internet que no aprueban Ser Bachiller |
Exemple : Estudio sobre impacto de tutorías extracurriculares en aprobación del Ser Bachiller. Tabla: [aprueban=85, reprueban=15] para grupo con tutorías y [aprueban=60, reprueban=40] para grupo sin tutorías. Calcula OR.
Aplicaciones prácticas con datos ecuatorianos
Ejemplos concretos usando precios, distancias y resultados educativos de Ecuador
| Symbole | Signification | Unité |
|---|---|---|
| IPC_t | índice de precios en período t Base 100 en período 0 | |
| P_t | precio en período t Ejemplo: precio del banano en mercado de Guayaquil | USD |
| P_0 | precio en período base Ejemplo: precio del banano en enero 2023 | USD |
Exemple : En enero 2023 el banano costaba 0.85/kg. Calcula IPC para diciembre 2023 (base enero 2023=100).
Formes alternatives
- — Cálculo para ruta Quito-Ambato-Cuenca-Guayaquil con pesos típicos
| Symbole | Signification | Unité |
|---|---|---|
| D | distancia ponderada Distancia ajustada por factores como tráfico o topografía | km |
| d_i | distancia directa entre ciudad i y ciudad i+1 Ejemplo: Quito-Ambato = 140 km | km |
| w_i | peso o factor de ajuste Ejemplo: w=1.2 para ruta con mucho tráfico |
Dimensions :
Exemple : Calcula la distancia ponderada de Quito a Guayaquil pasando por Ambato (140 km) y Cuenca (280 km), con pesos 1.4, 1.2 y 1.1 respectivamente.
| Symbole | Signification | Unité |
|---|---|---|
| R | rendimiento por hectárea Ejemplo: rendimiento de cacao en Esmeraldas | kg/ha |
| P | producción total Ejemplo: 15000 kg de cacao | kg |
| A | área cultivada Ejemplo: 5 ha | ha |
Dimensions :
Exemple : Una finca en Los Ríos produce 12000 kg de banano en 4 hectáreas. Calcula el rendimiento por hectárea.
| Symbole | Signification | Unité |
|---|---|---|
| T | tasa de aprobación Porcentaje de estudiantes que aprueban | % |
| A | número de estudiantes que aprueban Ejemplo: 4500 estudiantes | |
| T | total de estudiantes evaluados Ejemplo: 5000 estudiantes |
Dimensions :
Exemple : En la provincia de Tungurahua, 4200 de 4800 estudiantes aprobaron el Ser Bachiller. Calcula la tasa de aprobación.