Skip to content
Este artículo tiene fines educativos. Te animamos a verificar con fuentes oficiales.

¿Alguna vez te has preguntado por qué algunas encuestas en Ecuador parecen fallar en predecir resultados? ¡El problema no es la encuesta, sino el tamaño de la muestra! Imagina que quieres saber cuántos quiteños prefieren el transporte público sobre el auto particular. Si solo encuestas a 10 personas en el Centro Histórico, ¿crees que los resultados reflejarán la realidad de 2 millones de habitantes? Aquí descubrirás por qué el tamaño de muestra y la potencia estadística son la diferencia entre una investigación útil y un simple desperdicio de recursos. Desde las fórmulas de Cochran hasta los errores que arruinan estudios en Guayaquil, este glosario te dará las herramientas para investigar como un profesional.

Diseño de investigación

Aleatorización (noun) /a.le.a.to.ɾi.sa.ˈsjon/
Proceso de asignar aleatoriamente participantes a diferentes grupos en un estudio experimental para evitar sesgos.

Sinónimos : Randomización

La aleatorización equilibra las características entre grupos, haciendo que las diferencias observadas se deban al tratamiento, no a otros factores.

Asignar aleatoriamente estudiantes a dos grupos: uno recibe tutorías y el otro no, usando una tabla de números aleatorios.

Margen de error (noun) /maɾ.ˈxe.nen ðe e.ˈɾoɾ/
Rango máximo dentro del cual se espera que esté el parámetro poblacional, expresado como porcentaje o valor absoluto.

Sinónimos : Error máximo, Incertidumbre

Un margen del 5% significa que si encuentras 40% de aprobación, el verdadero valor está entre 35% y 45%.

E=Zp(1p)n

En una encuesta política con margen de error del 3%, si tu candidato tiene 45% de intención de voto, el rango real es 42% a 48%.

Nivel de confianza (noun) /ni.ˈβel ðe kon.fi.ˈan.sja/
Probabilidad de que el intervalo de confianza contenga el parámetro poblacional verdadero, expresado como porcentaje (ej. 90%, 95%, 99%).

Sinónimos : Confianza estadística

Un nivel del 95% significa que si repitieras el estudio 100 veces, 95 de ellas capturarían el parámetro real.

Nivel=1α

Para Ser Bachiller, un nivel de confianza del 95% significa que los resultados tienen un 5% de probabilidad de no reflejar la realidad.

Pilotaje (noun) /pi.lo.ˈta.xe/
Estudio pequeño realizado antes del estudio principal para probar instrumentos, procedimientos y calcular tamaño de muestra más preciso.

Sinónimos : Estudio piloto

El pilotaje ayuda a identificar problemas logísticos y ajustar el diseño antes de invertir en un estudio grande.

Antes de encuestar a 1000 personas en Cuenca, realizas un pilotaje con 50 personas para probar el cuestionario.

Tamaño de muestra (noun) /ta.ˈma.no ðe ˈmwe.sa/
Número de individuos u observaciones que se incluyen en el estudio. Determina la precisión y confiabilidad de los resultados.

Sinónimos : n, Tamaño muestral

Un tamaño de muestra demasiado pequeño genera resultados poco confiables; uno demasiado grande desperdicia recursos.

n=NZ2p(1p)(N1)e2+Z2p(1p)

Para una encuesta sobre preferencias políticas en Quito con margen de error del 4% y nivel de confianza del 95%, necesitas aproximadamente 600 personas.

Diseño experimental

Grupo control (noun) /ˈɡɾu.po kon.ˈtɾol/
Grupo de participantes que no recibe el tratamiento o intervención que se está probando, usado como punto de comparación.

Sinónimos : Grupo placebo

Sin grupo control, no puedes saber si los cambios observados se deben al tratamiento o a otros factores.

En un estudio sobre el efecto de un nuevo fertilizante en el rendimiento de maíz en Ambato, el grupo control usa el fertilizante tradicional.

Grupo experimental (noun) /ˈɡɾu.po eks.pe.ɾi.ˈmen.tal/
Grupo de participantes que recibe la intervención o tratamiento que se está evaluando en un estudio.

Sinónimos : Grupo de tratamiento

La comparación entre grupo experimental y control permite medir el efecto real del tratamiento.

En el mismo estudio de fertilizantes, el grupo experimental usa el nuevo fertilizante orgánico en sus parcelas.

Variable de confusión (noun) /ba.ˈɾja.βle ðe kon.ˈfu.sjon/
Variable que influye tanto en la variable independiente como en la dependiente, distorsionando la relación entre ellas.

Sinónimos : Confundidor

Las variables de confusión son el 'enemigo silencioso' que puede arruinar la interpretación de un estudio.

En un estudio sobre el efecto de fumar en cáncer de pulmón, la edad podría ser una variable de confusión si no se controla.

Variable dependiente (noun) /ba.ˈɾja.βle ðe.pen.ˈdjen.te/
Resultado o efecto que se mide en un estudio y que se espera que cambie como resultado de la variable independiente.

Sinónimos : Variable de respuesta

La variable dependiente es lo que realmente te interesa medir para responder tu pregunta de investigación.

En el mismo estudio, la variable dependiente es 'nota promedio en el examen Ser Bachiller'.

Variable independiente (noun) /ba.ˈɾja.βle in.de.pen.ˈdjen.te/
Factor o tratamiento que el investigador manipula o cambia para observar su efecto en la variable dependiente.

Sinónimos : Factor experimental

En un experimento, la variable independiente es la 'causa' que produces; la dependiente es el 'efecto' que mides.

En un estudio sobre el efecto de horas de estudio en notas, la variable independiente es 'horas de estudio diarias'.

Distribuciones

Distribución normal (noun) /dis.tɾi.βu.ˈsjon nor.ˈmal/
Distribución de probabilidad simétrica en forma de campana donde la mayoría de los datos se concentran alrededor de la media.

Sinónimos : Campana de Gauss

Muchas variables naturales y sociales en Ecuador (como ingresos o alturas) siguen una distribución aproximadamente normal.

f(x)=1σ2πe12(xμσ)2

La distribución de alturas de estudiantes de bachillerato en Guayaquil sigue una distribución normal con media 165 cm y desviación estándar 10 cm.

Valor Z (noun) /ˈva.lor θe/
Número de desviaciones estándar que separan un valor de la media en una distribución normal estándar. Usado para calcular márgenes de error.

Sinónimos : Puntuación Z, Cuantil normal

Para un nivel de confianza del 95%, el valor Z es 1.96; para 90% es 1.645.

Z=Xμσ

Si quieres un nivel de confianza del 99%, usas Z=2.576 para calcular tu margen de error.

Errores en investigación

Error de muestreo (noun) /e.ˈɾoɾ ðe mwe.ˈsa.xe.o/
Diferencia entre el estadístico muestral y el parámetro poblacional debido a que solo se observa una parte de la población.

Sinónimos : Error muestral

El error de muestreo es inevitable pero se puede controlar con un tamaño de muestra adecuado.

E=|xμ|

Si el ingreso promedio real en Guayaquil es 450perotumuestrada430, el error de muestreo es $20.

Sesgo de cobertura (noun) /ˈse.sjo ðe ko.βeɾ.ˈtu.ɾa/
Error que ocurre cuando el marco muestral no cubre completamente la población objetivo, excluyendo ciertos grupos.

Sinónimos : Sesgo de omisión

En Ecuador, el sesgo de cobertura es común en estudios que usan listas telefónicas o registros incompletos.

Si usas la guía telefónica para encuestar sobre hábitos de consumo, excluyes a personas sin teléfono fijo o móvil.

Sesgo de respuesta (noun) /ˈse.sjo ðe res.ˈpwes.ta/
Error que ocurre cuando los participantes responden de manera sistemáticamente distinta a la realidad, ya sea por memoria, deseabilidad social o malentendidos.

Sinónimos : Sesgo de reporte

El sesgo de respuesta es común en encuestas sobre temas sensibles como ingresos o hábitos de consumo en Ecuador.

En una encuesta sobre consumo de alcohol, los participantes pueden subreportar su consumo por vergüenza.

Sesgo de selección (noun) /ˈse.sjo ðe se.lek.ˈsjon/
Error que ocurre cuando la muestra no es representativa de la población debido a la forma en que se seleccionan los participantes.

Sinónimos : Sesgo muestral

El sesgo de selección es el enemigo número uno de la validez externa de un estudio.

Si solo encuestas a personas en centros comerciales para estudiar hábitos alimenticios, excluyes a quienes no pueden acceder a ellos.

General

Estadístico (noun) /es.ta.ˈði.sti.ko/
Valor calculado a partir de los datos de la muestra que estima un parámetro poblacional, como la media o proporción muestral.

Sinónimos : Valor muestral

Los estadísticos son nuestros 'ojos' para ver los parámetros poblacionales, pero tienen error inherente.

Si calculas que el 62% de 300 estudiantes encuestados en Cuenca prefieren el fútbol sobre el básquet, ese 62% es un estadístico que estima el parámetro poblacional.

Muestra (noun) /ˈmwe.sa/
Subconjunto representativo de la población que se selecciona para el estudio. Debe reflejar las características clave de la población total.

Sinónimos : Subconjunto, Submuestra

Una muestra mal seleccionada lleva a resultados engañosos, incluso con cálculos perfectos.

Para estudiar el consumo de ceviche en Guayaquil, una muestra de 500 personas en el mercado de La Bahía puede ser representativa si se elige aleatoriamente.

Parámetro (noun) /pa.ˈɾa.me.tɾo/
Valor numérico que describe una característica de la población completa, como el promedio de ingresos mensuales de todos los habitantes de Ambato.

Sinónimos : Valor poblacional

Los parámetros son desconocidos en la práctica; los estadísticos de la muestra son nuestras mejores estimaciones.

Si el parámetro es 'promedio de altura de estudiantes de bachillerato en Ecuador', un estadístico sería 'promedio de altura de 500 estudiantes medidos en 10 colegios'.

Población (noun) /po.βla.ˈsjon/
Conjunto completo de elementos que se desea estudiar, como todos los estudiantes de bachillerato en Ecuador o todos los turistas que visitan las Islas Galápagos en un año.

Sinónimos : Universo, Total

La población es el universo completo de interés; el tamaño de muestra depende de cuánto se desvía de la población real.

La población para un estudio sobre preferencias musicales en Cuenca serían todos los jóvenes entre 15 y 25 años que viven en esa ciudad.

Proporción (noun) /pɾo.poɾ.ˈsjon/
Fracción o porcentaje que representa una parte del total en una categoría específica, como el porcentaje de estudiantes que usan transporte público en Quito.

Sinónimos : Porcentaje, Razón

En estadística, p representa la proporción de éxitos en una población; 1-p es la proporción de fracasos.

p=XN

Si en una muestra de 200 estudiantes, 120 usan el trolebús, la proporción es p=0.6 o 60%.

Inferencia estadística

Error tipo I (noun) /e.ˈɾoɾ ˈti.po ˈu.no/
Rechazar incorrectamente la hipótesis nula cuando en realidad es verdadera. Se denota con la letra griega α (alfa).

Sinónimos : Falso positivo, α

Es el 'falso positivo': concluir que hay un efecto cuando en realidad no lo hay.

α=P(rechazarH0|H0esverdadera)

Decir que un nuevo método de enseñanza mejora las notas cuando en realidad no tiene efecto, es un error tipo I.

Error tipo II (noun) /e.ˈɾoɾ ˈti.po ˈðu.si/
No rechazar la hipótesis nula cuando en realidad es falsa. Se denota con la letra griega β (beta).

Sinónimos : Falso negativo, β

Es el 'falso negativo': no detectar un efecto real que sí existe.

β=P(norechazarH0|H0esfalsa)

No detectar que un nuevo medicamento realmente cura una enfermedad, es un error tipo II.

Hipótesis alternativa (noun) /i.po.ˈte.sis al.ter.na.ˈti.βa/
Afirmación que se acepta si los datos proporcionan suficiente evidencia para rechazar la hipótesis nula, generalmente indicando un efecto o diferencia.

Sinónimos : H_1

La hipótesis alternativa es lo que el investigador espera demostrar con su estudio.

H1:μ1μ2

En el mismo estudio, la hipótesis alternativa sería 'hay diferencia en notas entre estudiantes que desayunan y los que no'.

Hipótesis nula (noun) /i.po.ˈte.sis ˈnu.la/
Afirmación inicial que se prueba en un estudio estadístico, generalmente asumiendo que no hay efecto o diferencia (ej. 'no hay diferencia entre grupos').

Sinónimos : H_0

Se rechaza la hipótesis nula cuando los datos proporcionan suficiente evidencia en contra de ella.

H0:μ1=μ2

En un estudio sobre rendimiento académico, la hipótesis nula podría ser 'no hay diferencia en notas entre estudiantes que desayunan y los que no'.

Intervalo de confianza (noun) /in.ˈteɾ.va.lo ðe kon.fi.ˈan.sja/
Rango de valores dentro del cual se estima que se encuentra el parámetro poblacional con un nivel de confianza dado.

Sinónimos : IC

Un intervalo de confianza del 95% significa que si repitieras el estudio muchas veces, el 95% de los intervalos contendrían el parámetro real.

IC=x±Zsn

Si el ingreso promedio en una muestra es 400conmargendeerrorde20, el intervalo de confianza es [380,420].

Potencia estadística (noun) /po.ˈten.sja es.ta.ðis.ˈti.ka/
Probabilidad de rechazar correctamente la hipótesis nula cuando es falsa. Se calcula como 1-β y mide la capacidad de un estudio para detectar un efecto real.

Sinónimos : Poder estadístico

Una potencia del 80% o más se considera adecuada en la mayoría de investigaciones.

Potencia=1β

Si un estudio tiene potencia del 90%, hay un 90% de probabilidad de detectar un efecto real si existe.

Tamaño de efecto (noun) /ta.ˈma.no ðe e.ˈfek.to/
Medida de la fuerza de un fenómeno o diferencia entre grupos, independiente del tamaño de la muestra. Puede ser pequeño, mediano o grande.

Sinónimos : Efecto

Un tamaño de efecto grande es más fácil de detectar que uno pequeño, incluso con muestras pequeñas.

d=x1x2sp

Si la diferencia en notas entre dos grupos es de 5 puntos sobre una desviación estándar de 10, el tamaño de efecto es d=0.5 (efecto mediano).

Instrumentos de medición

Cuestionario estructurado (noun) /kwes.tjo.na.ˈɾi.o es.tɾuk.tu.ˈɾa.ðo/
Instrumento de recolección de datos con preguntas estandarizadas y opciones de respuesta fijas, usado en encuestas cuantitativas.

Sinónimos : Encuesta cerrada

Los cuestionarios estructurados permiten análisis estadísticos pero limitan la profundidad de las respuestas.

Un formulario de Google con preguntas de opción múltiple sobre hábitos de movilidad en Quito es un cuestionario estructurado.

Medidas de dispersión

Desviación estándar (noun) /des.bja.sjon es.tan.ˈdaɾ/
Medida de cuánto se desvían los valores individuales de la media en un conjunto de datos. Cuanto mayor es, más dispersos están los datos.

Sinónimos : s, σ

Una desviación estándar pequeña indica que los datos están cerca de la media; una grande indica mucha variabilidad.

s=(xix)2n1

Si las notas de un examen tienen desviación estándar de 5 puntos, la mayoría de estudiantes están dentro de 5 puntos arriba o abajo de la media.

Varianza (noun) /ba.ˈɾjan.sja/
Medida de dispersión que indica cuánto varían los datos respecto a la media. Es el cuadrado de la desviación estándar.

Sinónimos : σ²

La varianza es útil en cálculos estadísticos pero difícil de interpretar directamente por sus unidades al cuadrado.

s2=(xix)2n1

Si la varianza de ingresos mensuales es 10000 (USD)², la desviación estándar es $100.

Metodologías

Enfoque cualitativo (noun) /en.ˈfo.ke kwa.li.ta.ˈti.βo/
Enfoque de investigación que busca comprender fenómenos desde la perspectiva de los participantes, usando datos no numéricos como entrevistas o observaciones.

Sinónimos : Investigación cualitativa

El enfoque cualitativo es útil para explorar temas complejos pero no permite generalizar resultados a poblaciones grandes.

Entrevistar a 20 vendedores de mercados en Ambato para entender sus estrategias de negocio durante la pandemia.

Enfoque cuantitativo (noun) /en.ˈfo.ke kwan.ti.ta.ˈti.βo/
Enfoque de investigación que busca medir y analizar datos numéricos para probar hipótesis y generalizar resultados a poblaciones.

Sinónimos : Investigación cuantitativa

El enfoque cuantitativo es esencial para estudios que requieren precisión estadística, como los basados en Ser Bachiller.

Analizar los resultados de 5000 estudiantes en la prueba Ser Bachiller para identificar factores asociados al rendimiento.

Muestreo

Marco muestral (noun) /ˈma.ɾko mwe.ˈstɾal/
Lista completa y actualizada de todos los elementos de la población de la cual se extraerá la muestra.

Sinónimos : Lista muestral

Un marco muestral incompleto o desactualizado es una de las principales fuentes de sesgo en estudios en Ecuador.

Para una encuesta en Guayaquil, el marco muestral podría ser el registro electoral del CNE o la lista de abonados de CNT.

Muestra no probabilística (noun) /ˈmwe.sa no pro.ba.bi.ˈlis.ti.ka/
Método de selección donde la probabilidad de incluir un elemento no es conocida o no es igual para todos, lo que limita la generalización.

Sinónimos : Muestreo por conveniencia

Útil para estudios exploratorios pero no para hacer inferencias poblacionales confiables.

Encuestar solo a los estudiantes que asisten a un taller voluntario sobre emprendimiento en Cuenca.

Muestra probabilística (noun) /ˈmwe.sa pro.ba.bi.ˈlis.ti.ka/
Método de selección donde cada elemento de la población tiene una probabilidad conocida y no nula de ser incluido en la muestra.

Sinónimos : Muestreo aleatorio

Permite generalizar los resultados a toda la población con confiabilidad estadística.

Seleccionar aleatoriamente 100 estudiantes de una lista de todos los colegios fiscales de Quito usando números aleatorios.

Tamaño de muestra

Fórmula de Cochran (noun) /foɾ.ˈmu.la ðe ˈko.kɾan/
Ecuación para calcular el tamaño de muestra cuando se conoce el tamaño de la población y se busca estimar una proporción.

Sinónimos : Ecuación de Cochran

Es la fórmula más usada en encuestas sociales y de mercado en Ecuador por su simplicidad y precisión.

n=NZ2p(1p)(N1)e2+Z2p(1p)

Para estudiar el consumo de café en Quito (población ~2.7M), con p=0.5, margen de error 5% y nivel 95%, n≈384 personas.

Teoremas estadísticos

Teorema central del límite (concept) /te.o.ˈɾe.ma sen.ˈtɾal ðel ˈli.mi.te/
Teorema que establece que la distribución de las medias muestrales se aproxima a una distribución normal, independientemente de la forma de la distribución poblacional, cuando el tamaño de muestra es suficientemente grande.

Sinónimos : TCL

Este teorema justifica el uso de métodos estadísticos basados en la normalidad, incluso cuando los datos originales no son normales.

Aunque el ingreso mensual en Quito no sigue una distribución normal, la media de muestras de 100 personas sí se distribuye normalmente.

Tipos de estudio

Encuesta longitudinal (noun) /en.ˈkweɾ.sa lon.ɡi.tu.ˈdi.nal/
Estudio que recopila datos de los mismos participantes en múltiples momentos en el tiempo, permitiendo analizar cambios y tendencias.

Sinónimos : Estudio longitudinal

Los estudios longitudinales son más costosos y requieren más tiempo, pero proporcionan información valiosa sobre evolución.

Seguir a 200 estudiantes de bachillerato en Quito durante 3 años para estudiar cómo cambia su rendimiento académico.

Encuesta transversal (noun) /en.ˈkweɾ.sa tɾans.ˈver.sal/
Estudio que recopila datos en un solo momento en el tiempo, proporcionando una 'foto' de la situación en ese instante.

Sinónimos : Estudio transversal

Las encuestas transversales son comunes en estudios de opinión pública y de mercado en Ecuador.

Una encuesta sobre preferencias de bebidas en Guayaquil realizada en octubre de 2023 es un estudio transversal.

Validez

Validez externa (noun) /ba.ˈli.ðes ek.ˈter.na/
Grado en que los resultados de un estudio pueden generalizarse a otras poblaciones, contextos o momentos en el tiempo.

Sinónimos : Generalizabilidad

Una alta validez externa permite aplicar los resultados más allá del contexto específico del estudio.

Si un estudio sobre rendimiento académico en colegios fiscales de Quito se puede aplicar a colegios particulares de Guayaquil, tiene alta validez externa.

Validez interna (noun) /ba.ˈli.ðes in.ˈter.na/
Grado en que los resultados de un estudio reflejan realmente el efecto de la variable independiente, sin influencia de variables extrañas.

Sinónimos : Validez causal

Una alta validez interna significa que puedes estar seguro de que los cambios observados se deben al tratamiento, no a otros factores.

Si en un estudio sobre el efecto de un nuevo método de enseñanza controlas por horas de estudio, aumentas la validez interna.

Fuentes

  1. en.wikipedia.org
  2. www.itl.nist.gov
  3. www.utdallas.edu
  4. doi.org
  5. pubmed.ncbi.nlm.nih.gov
  6. api.semanticscholar.org
  7. www.ncbi.nlm.nih.gov
  8. archive.org
  9. www.academia.edu
  10. books.google.com
  11. www.isogenic.info
  12. www.qualitative-research.net
  13. www.qualtrics.com
  14. www.mathworks.com
  15. wnarifin.github.io