Skip to content
Este artículo tiene fines educativos. Te animamos a verificar con fuentes oficiales.

Tamaño de muestra

Fórmulas para calcular cuántas personas o elementos necesitas encuestar o medir en una investigación ecuatoriana.

Fórmula de Cochran para poblaciones infinitas approximation
n=Z2p(1p)e2
SymboleSignificationUnité
ntamaño de muestra requerido
número entero de encuestados; redondear al alza
unidad
Zvalor crítico de distribución normal
1.96 para 95% de confianza, 2.58 para 99%
pproporción esperada en la población
usar 0.5 si no hay estimación previa (máxima variabilidad)
emargen de error aceptable
valor entre 0 y 1; ej. 0.05 para 5%

Exemple : En Quito, para una encuesta sobre preferencias de movilidad urbana con 95% de confianza y 5% de margen de error, se necesita una muestra de 385 personas (población infinita).

Fórmula de Yamane para poblaciones finitas approximation
n=N1+Ne2
SymboleSignificationUnité
ntamaño de muestra
número de encuestados para población finita
unidad
Ntamaño de la población
número total de individuos; ej. 50 000 habitantes
unidad
emargen de error
valor decimal; ej. 0.05

Exemple : En una parroquia rural de Cuenca con 5 000 habitantes, para una encuesta con 5% de margen de error, se requiere una muestra de 398 personas.

Fórmula para poblaciones pequeñas approximation
n=NZ2p(1p)(N1)e2+Z2p(1p)
SymboleSignificationUnité
ntamaño de muestra
para poblaciones menores a 1 000 individuos
unidad
Ntamaño de la población
ej. 200 productores de café en Loja
unidad
Zvalor Z
1.96 para 95% de confianza
pproporción esperada
usar 0.5 si no hay datos previos
emargen de error
ej. 0.05 para 5%

Exemple : En una comunidad de 150 artesanos en Otavalo, para una encuesta con 5% de margen de error, se necesita una muestra de 108 personas.

Margen de error e intervalos de confianza

Fórmulas para cuantificar la incertidumbre en tus mediciones y encuestas.

Margen de error en proporciones law
e=Zp(1p)n
SymboleSignificationUnité
emargen de error
valor entre 0 y 1; ej. 0.03 = 3%
Zvalor Z
1.96 para 95% de confianza, 2.58 para 99%
pproporción observada
valor entre 0 y 1; ej. 0.6 para 60%
ntamaño de la muestra
número de observaciones
unidad

Exemple : En una muestra de 1 000 estudiantes de Guayaquil, con p=0.6 de preferencia por el fútbol, el margen de error es 3.1% a 95% de confianza.

Intervalo de confianza para una proporción law
IC=p^±Zp^(1p^)n
SymboleSignificationUnité
ICintervalo de confianza
rango [límite inferior, límite superior]
\hat{p}proporción muestral
proporción observada en la muestra
Zvalor Z
nivel de confianza (1.96 para 95%)
ntamaño de la muestra
número de observaciones
unidad

Exemple : Para una muestra de 800 votantes en Ambato con p^=0.55, el intervalo de confianza al 95% es [0.516, 0.584].

Margen de error en medias law
e=Zσn
SymboleSignificationUnité
emargen de error
en las mismas unidades que la variable medida
Zvalor Z
1.96 para 95% de confianza
\sigmadesviación estándar poblacional
ej. en cm de altura
depende de la variable
ntamaño de la muestra
número de observaciones
unidad

Exemple : Para medir la altura de estudiantes en Cuenca con σ=10 cm y n=200, el margen de error es 1.4 cm a 95% de confianza.

Sesgo de muestreo y corrección

Fórmulas para identificar y corregir errores sistemáticos en la recolección de datos.

Cálculo del sesgo de muestreo definition
Sesgo=xmuestraμpoblación
SymboleSignificationUnité
\text{Sesgo}sesgo de muestreo
valor positivo indica sobreestimación, negativo subestimación
misma que la variable medida
\bar{x}_{\text{muestra}}media de la muestra
ej. en kg de papas
depende de la variable
\mu_{\text{población}}media real de la población
valor verdadero desconocido en la mayoría de casos
depende de la variable

Exemple : En un mercado de Guayaquil, si la media de peso de 100 papas seleccionadas es 1.8 kg pero la media real es 2.0 kg, el sesgo es -0.2 kg.

Corrección del sesgo en la muestra approximation
xcorregido=xobservadoSesgo
SymboleSignificationUnité
x_{\text{corregido}}valor corregido
valor ajustado para reducir el sesgo
misma que x
x_{\text{observado}}valor observado en la muestra
valor medido directamente
misma que x
\text{Sesgo}sesgo calculado
valor obtenido con la fórmula anterior
misma que x

Exemple : Si en una muestra de 50 kg de café de Loja se observa un promedio de 68 kg pero el sesgo es +3 kg, el valor corregido es 65 kg.

Índice de sesgo relativo definition
ISR=Sesgoμpoblación×100%
SymboleSignificationUnité
\text{ISR}índice de sesgo relativo
porcentaje de error relativo al valor verdadero
%
\text{Sesgo}sesgo de muestreo
valor del sesgo calculado
misma que la variable
\mu_{\text{población}}media poblacional
valor de referencia verdadero
misma que la variable

Exemple : Si el sesgo es -0.2 kg y la media poblacional es 2.0 kg, el ISR es -10%, indicando un submuestreo del 10%.

Correlación entre variables

Fórmulas para medir la relación lineal entre dos variables cuantitativas en investigaciones ecuatorianas.

Coeficiente de correlación de Pearson law
r=nxy(x)(y)[nx2(x)2][ny2(y)2]
SymboleSignificationUnité
rcoeficiente de correlación de Pearson
-1 ≤ r ≤ 1; r=0 sin correlación lineal
nnúmero de pares de datos
número de observaciones emparejadas
unidad
x, yvariables cuantitativas
ej. ingresos (USD) y gasto en turismo (USD)
depende de las variables
\sum xysuma de productos xy
producto de cada par de valores
(unidad_x × unidad_y)
\sum x, \sum ysumas de x e y
suma de todos los valores de cada variable
unidad_x, unidad_y
\sum x^2, \sum y^2sumas de cuadrados
suma de los valores al cuadrado
(unidad_x)², (unidad_y)²

Exemple : Para 10 turistas en Galápagos, con r=0.87 entre ingresos mensuales (USD) y gasto en tours (USD), hay una correlación positiva fuerte.

Coeficiente de determinación definition
R2=r2
SymboleSignificationUnité
R^2coeficiente de determinación
porcentaje de variabilidad explicada (0 ≤ R² ≤ 1)
rcoeficiente de correlación de Pearson
valor entre -1 y 1

Exemple : Si r=0.87, entonces R²=0.757, lo que significa que el 75.7% de la variabilidad en el gasto turístico se explica por los ingresos.

Error estándar de la estimación law
SEE=(yy^)2n2
SymboleSignificationUnité
SEEerror estándar de la estimación
medida de la precisión del modelo de regresión
misma que y
yvalor observado de la variable dependiente
valor real medido
depende de y
\hat{y}valor predicho por el modelo
valor estimado por la línea de regresión
misma que y
ntamaño de la muestra
número de observaciones
unidad

Exemple : Para un modelo que predice el gasto turístico en Galápagos, con SEE=120 USD, el error promedio de predicción es 120 USD.

Distribución normal y puntuaciones Z

Fórmulas para analizar datos que siguen una distribución normal, común en mediciones antropométricas y académicas.

Función de densidad de la distribución normal definition
f(x)=1σ2πe12(xμσ)2
SymboleSignificationUnité
f(x)función de densidad normal
área bajo la curva = 1
1/(unidad_x)
\mumedia de la población
centro de la distribución
depende de x
\sigmadesviación estándar
medida de dispersión
misma que x
xvalor de la variable
punto donde se evalúa la función
depende de x
econstante matemática
base del logaritmo natural (~2.718)
\piconstante matemática
pi (~3.1416)

Dimensions : [M][L]1

Exemple : La altura de estudiantes en Cuenca sigue una distribución normal con μ=165 cm y σ=10 cm; la probabilidad de medir 180 cm es f(180).

Puntuación Z (estandarización) definition
z=xμσ
SymboleSignificationUnité
zpuntuación Z
número de desviaciones estándar desde la media
xvalor observado
ej. 180 cm de altura
misma que la variable
\mumedia poblacional
ej. 165 cm
misma que x
\sigmadesviación estándar poblacional
ej. 10 cm
misma que x

Exemple : Un estudiante de Cuenca con 185 cm de altura tiene z=(185-165)/10=2.0, lo que significa 2 desviaciones estándar por encima de la media.

Probabilidad acumulada bajo la curva normal definition
P(Xx)=Φ(z)=12[1+erf(z2)]
SymboleSignificationUnité
P(X \leq x)probabilidad acumulada
probabilidad de que X sea menor o igual a x
zpuntuación Z
calculada con la fórmula anterior
\Phi(z)función de distribución normal estándar
tabulada en tablas Z
erffunción error
función matemática especial

Exemple : Para z=1.96, P(X≤x)=0.975, lo que significa que el 97.5% de los datos están por debajo de ese valor en una distribución normal.

Fuentes

  1. en.wikipedia.org
  2. www.jstor.org
  3. www.ncbi.nlm.nih.gov
  4. ui.adsabs.harvard.edu
  5. doi.org
  6. pubmed.ncbi.nlm.nih.gov
  7. ori.hhs.gov
  8. www.google.com
  9. scholar.google.com
  10. books.google.com
  11. www.nbcnews.com
  12. www.techtarget.com
  13. d-nb.info
  14. aleph.nkp.cz