Skip to content
Este artículo tiene fines educativos. Te animamos a verificar con fuentes oficiales.

Fundamentos de causalidad estadística

Conceptos básicos para diferenciar asociación estadística de relación causal en datos ecuatorianos

Coeficiente de correlación de Pearson definition
r=i=1n(xix)(yiy)i=1n(xix)2i=1n(yiy)2
Formes alternatives
  • r=Cov(x,y)σxσy — Forma alternativa usando covarianza y desviaciones estándar
SymboleSignificationUnité
rcoeficiente de correlación de Pearson
Valores entre -1 y 1. r=0 indica ausencia de correlación lineal.
x_ivalor de la variable x en la observación i
Ejemplo: precio del banano en mercado de Quito
y_ivalor de la variable y en la observación i
Ejemplo: precio del banano en mercado de Guayaquil
nnúmero de observaciones
Ejemplo: 12 meses de datos
\bar{x}media de la variable x
\bar{y}media de la variable y

Exemple : Datos mensuales de precio de banano en mercados de Quito (x) y Guayaquil (y): (0.75, 0.72), (0.80, 0.78), (0.85, 0.83). Calcula r y determina si hay correlación lineal.

Prueba t para diferencia de medias independientes law
t=x1x2s12n1+s22n2
Formes alternatives
  • t=x1x2sp2nsin1=n2=nys1=s2=sp — Caso de varianzas iguales y muestras de igual tamaño
SymboleSignificationUnité
testadístico t de Student
Se compara con valor crítico de tabla t-Student
\bar{x}_1media de la muestra 1
Ejemplo: promedio de notas Ser Bachiller en colegios fiscales
\bar{x}_2media de la muestra 2
Ejemplo: promedio de notas Ser Bachiller en colegios particulares
s_1desviación estándar muestra 1
s_2desviación estándar muestra 2
n_1tamaño muestra 1
Ejemplo: 50 estudiantes
n_2tamaño muestra 2
Ejemplo: 50 estudiantes

Exemple : Comparación de notas promedio en Ser Bachiller entre estudiantes de Ambato (n=45, media=720, desviación=50) y Cuenca (n=48, media=745, desviación=45). Calcula t y determina si hay diferencia significativa.

Prueba de chi-cuadrado para independencia law
χ2=i=1k(OiEi)2Ei
SymboleSignificationUnité
\chi^2estadístico chi-cuadrado
Se compara con valor crítico de tabla chi-cuadrado
O_ifrecuencia observada en categoría i
Ejemplo: número de estudiantes que eligen carreras STEM en Sierra
E_ifrecuencia esperada en categoría i
Calculada bajo hipótesis de independencia
knúmero de categorías
Ejemplo: 3 regiones (Costa, Sierra, Amazonía)

Exemple : Tabla de preferencia de carrera universitaria (STEM vs no STEM) por región (Costa vs Sierra). Frecuencias observadas: [120, 80, 90, 110]. Calcula chi-cuadrado para probar independencia.

Modelos de regresión para inferencia causal

Herramientas estadísticas para modelar y evaluar relaciones causales con datos de Ecuador

Modelo de regresión lineal simple law
y=β0+β1x+ε
Formes alternatives
  • E[y|x]=β0+β1x — Valor esperado de y dado x
SymboleSignificationUnité
yvariable respuesta o dependiente
Ejemplo: consumo de energía eléctrica en hogares (kWh/mes)
xvariable explicativa o independiente
Ejemplo: temperatura media mensual en Quito (°C)
\beta_0intercepto
Valor de y cuando x=0
\beta_1pendiente
Cambio en y por unidad de x. Interpretación causal solo si x es causa de y
\varepsilonerror aleatorio
Distribuido normal(0, σ²)

Exemple : Modela la relación entre temperatura media mensual en Quito (°C) y consumo de energía eléctrica en 20 hogares (kWh/mes). Datos: (14, 120), (16, 135), (12, 105).

Coeficiente de determinación R² definition
R2=1SSresSStot=SSregSStot
SymboleSignificationUnité
R^2coeficiente de determinación
Valores entre 0 y 1. 0.8 significa que 80% de variabilidad en y es explicada por x
SS_{res}suma de cuadrados de residuos
Variabilidad no explicada por el modelo
SS_{tot}suma total de cuadrados
Variabilidad total en y
SS_{reg}suma de cuadrados de regresión
Variabilidad explicada por el modelo

Exemple : En el modelo de temperatura vs consumo eléctrico, si SSres=2500 y SStot=12500, calcula R² e interpreta su significado.

Prueba F para significancia global law
F=MSregMSres=SSreg/pSSres/(np1)
SymboleSignificationUnité
Festadístico F de Fisher
Se compara con valor crítico F(p, n-p-1)
MS_{reg}cuadrado medio de regresión
SSreg dividido por grados de libertad (p)
MS_{res}cuadrado medio de residuos
SSres dividido por grados de libertad (n-p-1)
pnúmero de variables explicativas
Ejemplo: p=1 en regresión simple
ntamaño de la muestra
Ejemplo: n=20 hogares

Exemple : En el modelo de temperatura vs consumo eléctrico (n=20), si SSreg=10000 y SSres=2500, calcula F y determina si el modelo es significativo.

Odds ratio para asociación causal definition
OR=a/cb/d=adbc
SymboleSignificationUnité
ORodds ratio
OR=1 indica no asociación. OR>1 asociación positiva. OR<1 asociación negativa
acasos expuestos con resultado positivo
Ejemplo: estudiantes con acceso a internet que aprueban Ser Bachiller
bcasos expuestos con resultado negativo
Ejemplo: estudiantes con acceso a internet que no aprueban Ser Bachiller
ccontroles con resultado positivo
Ejemplo: estudiantes sin acceso a internet que aprueban Ser Bachiller
dcontroles con resultado negativo
Ejemplo: estudiantes sin acceso a internet que no aprueban Ser Bachiller

Exemple : Estudio sobre impacto de tutorías extracurriculares en aprobación del Ser Bachiller. Tabla: [aprueban=85, reprueban=15] para grupo con tutorías y [aprueban=60, reprueban=40] para grupo sin tutorías. Calcula OR.

Aplicaciones prácticas con datos ecuatorianos

Ejemplos concretos usando precios, distancias y resultados educativos de Ecuador

Índice de precios al consumidor (IPC) simple definition
IPCt=PtP0×100
SymboleSignificationUnité
IPC_tíndice de precios en período t
Base 100 en período 0
P_tprecio en período t
Ejemplo: precio del banano en mercado de Guayaquil
USD
P_0precio en período base
Ejemplo: precio del banano en enero 2023
USD

Exemple : En enero 2023 el banano costaba 0.75/kgyendiciembre2023costaba0.85/kg. Calcula IPC para diciembre 2023 (base enero 2023=100).

Distancia ponderada entre ciudades definition
D=i=1ndiwi
Formes alternatives
  • D=1.4×140+1.2×280+1.1×180 — Cálculo para ruta Quito-Ambato-Cuenca-Guayaquil con pesos típicos
SymboleSignificationUnité
Ddistancia ponderada
Distancia ajustada por factores como tráfico o topografía
km
d_idistancia directa entre ciudad i y ciudad i+1
Ejemplo: Quito-Ambato = 140 km
km
w_ipeso o factor de ajuste
Ejemplo: w=1.2 para ruta con mucho tráfico

Dimensions : [L]

Exemple : Calcula la distancia ponderada de Quito a Guayaquil pasando por Ambato (140 km) y Cuenca (280 km), con pesos 1.4, 1.2 y 1.1 respectivamente.

Rendimiento agrícola por hectárea definition
R=PA
SymboleSignificationUnité
Rrendimiento por hectárea
Ejemplo: rendimiento de cacao en Esmeraldas
kg/ha
Pproducción total
Ejemplo: 15000 kg de cacao
kg
Aárea cultivada
Ejemplo: 5 ha
ha

Dimensions : [M][L]2

Exemple : Una finca en Los Ríos produce 12000 kg de banano en 4 hectáreas. Calcula el rendimiento por hectárea.

Tasa de aprobación en Ser Bachiller definition
T=AT×100
SymboleSignificationUnité
Ttasa de aprobación
Porcentaje de estudiantes que aprueban
%
Anúmero de estudiantes que aprueban
Ejemplo: 4500 estudiantes
Ttotal de estudiantes evaluados
Ejemplo: 5000 estudiantes

Dimensions : 1

Exemple : En la provincia de Tungurahua, 4200 de 4800 estudiantes aprobaron el Ser Bachiller. Calcula la tasa de aprobación.

Fuentes

  1. en.wikipedia.org
  2. www.jstor.org
  3. www.bhagavad-gita.org
  4. doi.org
  5. api.semanticscholar.org
  6. dictionary.cambridge.org
  7. archive.org
  8. ui.adsabs.harvard.edu
  9. web.archive.org
  10. www.istarassessment.org
  11. pubmed.ncbi.nlm.nih.gov
  12. plato.stanford.edu
  13. link.springer.com
  14. search.worldcat.org
  15. onlinelibrary.wiley.com