¿Alguna vez te has preguntado cómo los investigadores ecuatorianos miden fenómenos complejos como la calidad educativa en las escuelas de Ambato o la satisfacción turística en las Galápagos? El modelo de ecuaciones estructurales (SEM) es la herramienta que usan para analizar relaciones entre variables que no se pueden medir directamente, como 'motivación estudiantil' o 'confianza en las instituciones'. En este glosario encontrarás los 30 términos clave que necesitas dominar para aplicar SEM en proyectos reales, desde tu tesis hasta análisis de datos del Ser Bachiller. ¡Vamos a desglosar la teoría con ejemplos que te harán decir '¡Ah, ya entiendo!'
Conceptos Fundamentales
- error de medición (noun) /eˈroɾ ðe me.ðjaˈsjon/
- Diferencia entre el valor verdadero de una variable latente y su valor estimado a partir de variables observadas. Incluye errores aleatorios (desviaciones impredecibles) y sistemáticos (sesgos en la medición).
Sinónimos : error de medición, medición errónea, sesgo de respuesta
Es el 'ruido' que distorsiona tu señal: cuanto menor sea, más preciso será tu modelo.
Si mides 'satisfacción turística en Galápagos' con una encuesta de 5 preguntas y un turista responde '5' a todas, el error de medición podría deberse a que el turista no leyó bien las preguntas o respondió por costumbre.
- matriz de covarianza (noun) /maˈtɾis ðe ko.βaɾˈjan.θa/
- Matriz cuadrada que contiene las covarianzas entre todas las variables observadas en un modelo SEM. Diagonal principal muestra las varianzas, y elementos fuera de la diagonal muestran cómo varían juntas las variables.
Sinónimos : matriz de varianzas-covarianzas
Es la 'foto grupal' de tus variables: te dice cómo se relacionan entre sí y con qué intensidad.
Si analizas datos de estudiantes de Ambato, la matriz de covarianza te dirá si 'horas de estudio' y 'puntaje en matemáticas' varían juntas (covarianza positiva) o si 'ausentismo' y 'rendimiento' están inversamente relacionados.
- variable latente (noun) /baɾˈja.βle laˈten.te/
- Constructo teórico no observable directamente que se infiere a partir de variables observadas. Por ejemplo, 'satisfacción con la vida en Guayaquil' no se mide con una sola pregunta, sino con múltiples indicadores como transporte, seguridad y servicios públicos.
Sinónimos : constructo, variable no observable, factor latente
Son los 'fantasmas' que queremos atrapar: no los vemos, pero sabemos que existen por sus huellas en los datos.
El constructo 'calidad docente' en escuelas de Ambato se mide con preguntas sobre metodología, evaluación y relación profesor-alumno en encuestas a estudiantes.
- variable observada (noun) /baɾˈja.βle ob.seɾˈβa.ða/
- Variable que se mide directamente en un estudio, como respuestas a preguntas de una encuesta, puntajes de exámenes o datos demográficos. Son los 'testigos' que nos ayudan a inferir la existencia de variables latentes.
Sinónimos : variable manifiesta, indicador, variable medida
Son los datos duros que recolectas en el campo: respuestas de encuestas, mediciones físicas o registros administrativos.
Las preguntas '¿Cómo calificarías el transporte público en Quito?' (escala 1-5) o '¿Cuántos libros hay en tu hogar?' son variables observadas que ayudan a medir 'calidad de vida urbana'.
Diagnóstico del Modelo
- matriz residual (noun) /maˈtɾis re.siˈdu.al/
- Matriz que contiene las diferencias entre la matriz de covarianza observada y la matriz de covarianza estimada por el modelo. Valores pequeños indican un buen ajuste, mientras que valores grandes señalan áreas donde el modelo no captura bien la estructura de los datos.
Sinónimos : matriz de residuos, residual matrix
Es el 'informe de discrepancias' de tu modelo: si hay muchos residuos grandes, tu modelo necesita ajustes.
Al analizar datos de turismo en las Galápagos, la matriz residual muestra que el modelo sobreestima la relación entre 'precio del tour' y 'satisfacción del turista', indicando que necesitas revisar esa parte del modelo.
- multicolinealidad (noun) /mul.ti.ko.li.ne.a.liˈðað/
- Situación en la que dos o más variables predictoras en un modelo están altamente correlacionadas, lo que dificulta la estimación precisa de sus efectos individuales. En SEM se evalúa con el factor de inflación de varianza (VIF) mayor a 5 o 10.
Sinónimos : multicolinearity
Es como tener dos 'faros' apuntando al mismo lugar en la noche: confunden tu camino y debilitan tu modelo.
En un modelo que analiza cómo 'ingresos familiares' y 'nivel educativo de los padres' afectan 'puntaje Ser Bachiller', un VIF de 8.2 para 'ingresos' indica multicolinealidad severa, requiriendo que combines variables o uses técnicas como SEM.
Diseño Muestral
- muestreo por conglomerados (noun) /mwes.tɾe.o por kon.ɡlo.meɾˈa.ðos/
- Técnica de muestreo en la que la población se divide en grupos naturales (conglomerados) como escuelas, barrios o provincias, y se seleccionan aleatoriamente algunos conglomerados para incluir a todos sus miembros en la muestra.
Sinónimos : cluster sampling
Es como elegir provincias enteras en lugar de estudiantes individuales: útil cuando no puedes llegar a todos, pero debes ser cuidadoso con los errores de estimación.
Para estudiar 'satisfacción con servicios públicos' en Équateur, seleccionas aleatoriamente 5 provincias (Quito, Guayaquil, Cuenca, Ambato, Esmeraldas) y encuestas a todos los hogares en esas provincias, usando muestreo por conglomerados.
Modelos Estadísticos
- coeficiente de trayectoria (noun) /ko.eˈfi.sjen.te ðe tɾa.ek.toˈɾi.a/
- Parámetro que cuantifica la fuerza y dirección de la relación entre dos variables en un modelo SEM. Se interpreta como un coeficiente de regresión estandarizado, donde valores cercanos a 1 indican una relación fuerte y positiva.
Sinónimos : beta, coeficiente estandarizado, path coefficient
Es el 'tamaño del efecto' en tu teoría: te dice cuánto cambia una variable cuando otra varía en una unidad.
En un modelo que analiza cómo 'inversión en educación' (en USD) afecta 'puntaje Ser Bachiller', un coeficiente de 0.45 significa que por cada 100 USD adicionales invertidos, el puntaje aumenta en 4.5 puntos en promedio.
- modelo de ecuaciones estructurales (noun) /moˈðe.lo ðe e.kwa.sjo.nes es.tɾuk.tuˈɾa.les/
- Técnica estadística que combina análisis factorial y modelos de ecuaciones simultáneas para analizar relaciones entre variables observadas y latentes. Permite probar teorías complejas sobre cómo factores como 'calidad educativa' influyen en resultados como 'puntaje Ser Bachiller'.
Sinónimos : SEM, modelo SEM, análisis de ecuaciones estructurales
Es como un mapa de carreteras que conecta variables invisibles (latentes) con lo que sí medimos (observadas).
Un investigador en Quito usa SEM para analizar cómo variables latentes como 'recursos escolares' y 'clima escolar' afectan el puntaje en matemáticas de estudiantes de Cuenca, usando datos del Ser Bachiller.
- modelo de medición (noun) /moˈðe.lo ðe me.ðjaˈsjon/
- Parte del modelo SEM que especifica cómo las variables latentes se relacionan con las variables observadas mediante cargas factoriales y errores de medición. Define la validez de los constructos.
Sinónimos : modelo factorial confirmatorio, CFA
Es el 'diccionario' que traduce tus constructos abstractos a preguntas concretas en tu encuesta.
En un estudio sobre 'clima escolar en Cuenca', el modelo de medición especifica que el constructo 'clima' se mide con preguntas sobre relaciones entre estudiantes, relaciones con profesores y percepción de seguridad, cada una con su carga factorial respectiva.
- modelo estructural (noun) /moˈðe.lo es.tɾuk.tuˈɾal/
- Parte del modelo SEM que especifica las relaciones causales entre variables latentes mediante coeficientes de trayectoria. Representa la teoría que se quiere probar.
Sinónimos : modelo teórico, parte estructural
Es la 'historia' que cuentas con tus datos: cómo tus constructos se influyen entre sí.
En un modelo que analiza cómo 'calidad docente' y 'recursos escolares' afectan 'rendimiento académico' en estudiantes de Ambato, el modelo estructural especifica que 'calidad docente' tiene un efecto directo de 0.60 sobre 'rendimiento', mientras que 'recursos' tiene un efecto indirecto a través de 'calidad docente'.
- path analysis (noun) /ˈpaθ əˈnæləsɪs/
- Técnica estadística que analiza relaciones causales entre variables observadas mediante diagramas de senderos. Es un caso especial de SEM donde todas las variables son observables y no hay variables latentes.
Sinónimos : análisis de senderos, análisis de trayectorias
Es como un árbol genealógico de relaciones: te muestra quién influye en quién y cuánto.
Un investigador en Quito usa path analysis para analizar cómo 'inversión en infraestructura escolar' (en USD) y 'formación docente' afectan directamente el 'puntaje Ser Bachiller' en estudiantes de Guayaquil.
Modelos de Medición
- carga factorial (noun) /ˈkaɾ.ɣa fak.toˈɾjal/
- Coeficiente que representa la fuerza de la relación entre una variable latente y una variable observada en un modelo de medición. Valores absolutos mayores a 0.70 se consideran fuertes, mientras que valores menores a 0.40 sugieren que el indicador no mide bien el constructo.
Sinónimos : lambda, factor loading
Es el 'peso' de cada pregunta en tu encuesta: si una pregunta tiene carga baja, no está midiendo bien lo que quieres medir.
En una encuesta sobre 'calidad educativa en Cuenca', la pregunta 'Los profesores explican claramente los contenidos' tiene una carga factorial de 0.85, indicando que es un buen indicador del constructo.
Métodos de Estimación
- máxima verosimilitud (noun) /ˈmak.si.ma ve.ɾo.si.miˈtuð/
- Método de estimación que busca los valores de los parámetros que maximizan la probabilidad de observar los datos obtenidos. Asume normalidad multivariada y es el método más utilizado en SEM.
Sinónimos : maximum likelihood, ML
Es como ajustar un traje a tu modelo: busca los parámetros que hacen que tus datos sean lo más probables posible.
Al analizar datos de estudiantes de Cuenca, usas máxima verosimilitud para estimar los coeficientes de trayectoria en tu modelo de 'factores que influyen en el rendimiento académico', asumiendo que los datos siguen una distribución normal.
- mínimos cuadrados parciales (noun) /ˈmi.ni.mos kwaˈðɾa.ðos paɾˈsja.les/
- Método de estimación que prioriza la predicción sobre la inferencia, minimizando la varianza de los errores en los modelos de medición y estructural sin asumir distribución normal. Ideal para muestras pequeñas o datos no normales.
Sinónimos : PLS, PLS-SEM, partial least squares
Es como dibujar la línea que mejor se ajusta a tus puntos sin preocuparte por si los datos están 'bonitos' o no.
Para analizar datos de turismo en las Galápagos donde las respuestas no siguen una distribución normal, usas mínimos cuadrados parciales (PLS-SEM) para estimar cómo 'precio del tour' y 'calidad del guía' afectan 'satisfacción del turista'.
Métricas de Evaluación
- bondad de ajuste (noun) /bonˈdað ðe a.xus.te/
- Conjunto de índices que evalúan qué tan bien el modelo SEM se ajusta a los datos observados. Incluye métricas como CFI, RMSEA y chi-cuadrado, donde valores específicos indican un buen ajuste según estándares estadísticos.
Sinónimos : goodness-of-fit, ajuste del modelo, calidad del modelo
Es el 'informe de salud' de tu modelo: si los índices son buenos, tu teoría es sólida; si no, necesitas revisar el diseño.
Cuando analizas datos de estudiantes de Cuenca y obtienes un CFI de 0.97 y RMSEA de 0.04, puedes confiar en que tu modelo de 'factores que influyen en el rendimiento académico' explica bien los datos.
- CFI (noun) /se.eˈfe.i/
- Índice de Ajuste Comparativo (Comparative Fit Index) que compara el modelo propuesto con un modelo nulo (sin relaciones). Valores cercanos a 1 indican un excelente ajuste, mientras que valores menores a 0.90 sugieren que el modelo necesita revisión.
Sinónimos : Índice de Ajuste Comparativo, Comparative Fit Index
Es como comparar tu modelo con la hipótesis de que 'todo está conectado al azar': si ganas por mucho, tu modelo es bueno.
En un estudio sobre 'factores socioeconómicos y rendimiento en matemáticas' con datos de estudiantes de Ambato, un CFI de 0.96 confirma que el modelo explica mejor los datos que el modelo nulo.
- chi-cuadrado (noun) /ˈtʃi kuaˈðɾa.ðo/
- Estadístico que evalúa la discrepancia entre la matriz de covarianza observada y la matriz de covarianza estimada por el modelo. Valores pequeños (p > 0.05) indican que el modelo se ajusta bien a los datos.
Sinónimos : χ², chi-square
Es la 'prueba de realidad' de tu modelo: si el valor p es alto, tu teoría coincide con los datos.
En un modelo que analiza cómo 'acceso a tecnología' afecta 'rendimiento en ciencias' con datos de Quito, un valor p de 0.12 en el chi-cuadrado significa que no hay diferencias significativas entre lo observado y lo predicho por el modelo.
- RMSEA (noun) /ˈɾaɾ.me.sa/
- Raíz Cuadrada Media del Error de Aproximación (Root Mean Square Error of Approximation) que mide el error de aproximación por grado de libertad. Valores menores a 0.05 indican un excelente ajuste, mientras que valores entre 0.08 y 0.10 sugieren un ajuste mediocre.
Sinónimos : Root Mean Square Error of Approximation
Es el 'promedio de errores' en tu modelo ajustado por complejidad: cuanto menor, mejor.
Al analizar datos de turismo en las Galápagos, un RMSEA de 0.03 te dice que tu modelo de 'factores que influyen en la satisfacción del turista' tiene un error mínimo.
Relaciones Causales
- efecto directo (noun) /eˈfek.to diˈɾek.to/
- Relación causal directa entre dos variables latentes en un modelo estructural, representada por un coeficiente de trayectoria. Por ejemplo, el efecto directo de 'calidad docente' en 'rendimiento académico'.
Sinónimos : efecto simple, relación directa
Es la 'flecha recta' en tu diagrama de senderos: la influencia más simple y clara entre dos variables.
En un modelo que analiza factores que influyen en el rendimiento académico de estudiantes de Cuenca, el efecto directo de 'horas de estudio semanales' en 'puntaje en matemáticas' es 0.35, significando que por cada hora adicional de estudio, el puntaje aumenta en 3.5 puntos en promedio.
- efecto indirecto (noun) /eˈfek.to in.diˈɾek.to/
- Relación causal que ocurre a través de una o más variables mediadoras. Por ejemplo, el efecto de 'inversión en educación' en 'rendimiento académico' que pasa primero por 'calidad docente'.
Sinónimos : efecto mediado, relación indirecta
Es la 'ruta alternativa' en tu modelo: la influencia que toma un desvío antes de llegar a su destino final.
En un estudio sobre educación en Quito, el efecto indirecto de 'formación docente' en 'puntaje Ser Bachiller' a través de 'calidad de recursos escolares' es 0.22, indicando que mejorar la formación de profesores impacta indirectamente en el rendimiento estudiantil.
- mediación (noun) /me.ðjaˈsjon/
- Proceso en el que una variable (mediadora) explica la relación entre una variable independiente y una variable dependiente. Se evalúa mediante modelos SEM donde la variable mediadora está entre las otras dos.
Sinónimos : efecto mediado, variable mediadora
Es el 'mensajero' en tu historia causal: sin él, la influencia directa no existiría o sería más débil.
En un modelo que analiza cómo 'acceso a tecnología' (X) afecta 'rendimiento en ciencias' (Y), la variable 'calidad de la enseñanza' (M) actúa como mediadora, explicando parte de esa relación.
Software Estadístico
- JASP (acronym) /xasp/
- Software estadístico de código abierto con interfaz gráfica intuitiva que incluye módulos para modelado de ecuaciones estructurales. Combina facilidad de uso con rigor estadístico, siendo una alternativa a SPSS y jamovi.
Sinónimos : JASP statistics
Es el 'Photoshop' de la estadística: potente pero fácil de usar, ideal para estudiantes que no quieren aprender código complicado.
Un estudiante de la Universidad de Cuenca usa JASP para analizar datos de encuestas sobre 'percepción de seguridad ciudadana' y obtiene resultados de SEM con gráficos profesionales para su tesis.
- lavaan (noun) /laˈvan/
- Paquete de R para modelado de ecuaciones estructurales que permite especificar, estimar y evaluar modelos SEM de manera flexible y con sintaxis intuitiva. Es de código abierto y ampliamente utilizado en investigación académica.
Sinónimos : lavaan R package
Es tu 'navaja suiza' para SEM: gratis, potente y con comunidad activa que te ayuda cuando te quedas atascado.
Para analizar cómo 'acceso a tecnología' y 'formación docente' afectan 'rendimiento en matemáticas' con datos de estudiantes de Quito, escribes un script en R usando lavaan y obtienes los coeficientes de trayectoria y métricas de ajuste en segundos.
- SPSS Amos (acronym) /es.pe.e.se.es ˈa.mos/
- Software comercial para modelado de ecuaciones estructurales con interfaz gráfica y sintaxis, desarrollado por IBM. Permite dibujar modelos SEM, estimar parámetros y evaluar bondad de ajuste de manera visual e intuitiva.
Sinónimos : IBM SPSS Amos
Es el 'AutoCAD' de los modelos SEM: si prefieres arrastrar y soltar en lugar de escribir código, este es tu software.
Un investigador en Guayaquil usa SPSS Amos para dibujar un modelo que analiza cómo 'inversión en educación' (en USD) y 'participación comunitaria' afectan 'puntaje Ser Bachiller', obteniendo gráficos profesionales para su informe.
Supuestos Estadísticos
- normalidad multivariada (noun) /nor.ma.liˈðað mul.ti.βaɾˈja.ða/
- Supuesto en SEM que requiere que las variables observadas sigan una distribución normal multivariada. Se evalúa con pruebas como Mardia y gráficos de asimetría y curtosis. La violación de este supuesto puede afectar la estimación por máxima verosimilitud.
Sinónimos : multivariate normality
Es el 'certificado de buena conducta' de tus datos: si no lo tienen, debes usar métodos robustos como mínimos cuadrados parciales.
Al analizar datos de turismo en las Galápagos, pruebas de normalidad multivariada muestran que las respuestas no siguen una distribución normal, por lo que decides usar mínimos cuadrados parciales (PLS-SEM) en lugar de máxima verosimilitud.
Técnicas Estadísticas
- bootstrapping (noun) /ˈbut.stɾa.pin/
- Método de remuestreo que genera múltiples muestras aleatorias con reemplazo a partir de los datos originales para estimar la distribución muestral de un estadístico (como un coeficiente de trayectoria) y calcular intervalos de confianza robustos.
Sinónimos : remuestreo, bootstrap
Es como repetir tu experimento 1000 veces sin salir de tu oficina: te da más confianza en tus resultados.
Para estimar la precisión del efecto de 'acceso a tecnología' en 'rendimiento en ciencias' con datos de Quito, aplicas bootstrapping y obtienes un intervalo de confianza de [0.30, 0.55] para el coeficiente, indicando que el efecto es significativo.
Validez y Confiabilidad
- confiabilidad compuesta (noun) /kom.po.si.βi.liˈðað komˈpwes.ta/
- Medida de consistencia interna de un constructo que considera las cargas factoriales y los errores de medición. Valores mayores a 0.70 se consideran aceptables, y mayores a 0.80 son buenos. Es más robusta que el alpha de Cronbach en modelos SEM.
Sinónimos : composite reliability, CC
Es el 'termómetro' de la consistencia de tu constructo: si es alto, tus preguntas miden lo mismo de manera confiable.
En una encuesta sobre 'motivación estudiantil' en Ambato, la confiabilidad compuesta es 0.88, indicando que las preguntas sobre interés, esfuerzo y persistencia miden el constructo de manera consistente.
- validez (noun) /baˈli.ðeθ/
- Grado en que un instrumento mide lo que realmente pretende medir. Incluye validez de contenido, de criterio y de constructo. En SEM, se evalúa mediante validez convergente, discriminante y nomológica.
Sinónimos : validity
Es el 'pasaporte' de tu instrumento: sin validez, no puedes confiar en lo que mides.
Una encuesta sobre 'calidad educativa' en escuelas de Ambato tiene validez de contenido (expertos revisan las preguntas), validez de criterio (correlaciona con puntajes Ser Bachiller) y validez de constructo (validez convergente y discriminante confirmadas).
- validez convergente (noun) /baˈli.ðeθ kon.beɾˈxen.te/
- Grado en que múltiples indicadores de un mismo constructo están altamente correlacionados entre sí, indicando que miden el mismo fenómeno. Se evalúa con cargas factoriales altas y varianza extraída media (AVE) mayor a 0.50.
Sinónimos : convergent validity
Es la 'consistencia interna' de tu constructo: si todos tus indicadores apuntan al mismo lugar, tienes validez convergente.
En una encuesta sobre 'satisfacción con servicios públicos en Quito', todas las preguntas sobre transporte, seguridad y limpieza tienen cargas factoriales mayores a 0.70 y un AVE de 0.65, confirmando que miden el mismo constructo.
- validez discriminante (noun) /baˈli.ðeθ dis.kɾi.miˈnan.te/
- Grado en que un constructo es distinto de otros constructos en el modelo. Se evalúa comparando la varianza extraída media (AVE) con las correlaciones entre constructos: el AVE debe ser mayor que la correlación al cuadrado entre constructos.
Sinónimos : discriminant validity
Es el 'diferencial' entre tus constructos: si 'calidad docente' y 'recursos escolares' miden cosas diferentes, tienes validez discriminante.
En un modelo que analiza 'calidad docente' y 'satisfacción estudiantil' en escuelas de Cuenca, el AVE para 'calidad docente' es 0.70 y para 'satisfacción' es 0.65, mientras que la correlación entre ambos es 0.40 (r²=0.16), confirmando validez discriminante.