Métodos clave de recolección de datos en Ecuador | ORBITECH

ORBITECH AI Academy

Tamaño de muestra

Fórmulas para calcular cuántas personas o elementos necesitas encuestar o medir en una investigación ecuatoriana.

Fórmula de Cochran para poblaciones infinitas approximation

n = \frac{Z^{2} \cdot p \cdot (1 - p)}{e^{2}}

Symbole	Signification	Unité
`n`	tamaño de muestra requerido número entero de encuestados; redondear al alza	unidad
`Z`	valor crítico de distribución normal 1.96 para 95% de confianza, 2.58 para 99%
`p`	proporción esperada en la población usar 0.5 si no hay estimación previa (máxima variabilidad)
`e`	margen de error aceptable valor entre 0 y 1; ej. 0.05 para 5%

Exemple : En Quito, para una encuesta sobre preferencias de movilidad urbana con 95% de confianza y 5% de margen de error, se necesita una muestra de 385 personas (población infinita).

Fórmula de Yamane para poblaciones finitas approximation

n = \frac{N}{1 + N \cdot e^{2}}

Symbole	Signification	Unité
`n`	tamaño de muestra número de encuestados para población finita	unidad
`N`	tamaño de la población número total de individuos; ej. 50 000 habitantes	unidad
`e`	margen de error valor decimal; ej. 0.05

Exemple : En una parroquia rural de Cuenca con 5 000 habitantes, para una encuesta con 5% de margen de error, se requiere una muestra de 398 personas.

Fórmula para poblaciones pequeñas approximation

n = \frac{N \cdot Z^{2} \cdot p \cdot (1 - p)}{(N - 1) \cdot e^{2} + Z^{2} \cdot p \cdot (1 - p)}

Symbole	Signification	Unité
`n`	tamaño de muestra para poblaciones menores a 1 000 individuos	unidad
`N`	tamaño de la población ej. 200 productores de café en Loja	unidad
`Z`	valor Z 1.96 para 95% de confianza
`p`	proporción esperada usar 0.5 si no hay datos previos
`e`	margen de error ej. 0.05 para 5%

Exemple : En una comunidad de 150 artesanos en Otavalo, para una encuesta con 5% de margen de error, se necesita una muestra de 108 personas.

Margen de error e intervalos de confianza

Fórmulas para cuantificar la incertidumbre en tus mediciones y encuestas.

Margen de error en proporciones law

e = Z \cdot \sqrt{\frac{p \cdot (1 - p)}{n}}

Symbole	Signification	Unité
`e`	margen de error valor entre 0 y 1; ej. 0.03 = 3%
`Z`	valor Z 1.96 para 95% de confianza, 2.58 para 99%
`p`	proporción observada valor entre 0 y 1; ej. 0.6 para 60%
`n`	tamaño de la muestra número de observaciones	unidad

Exemple : En una muestra de 1 000 estudiantes de Guayaquil, con p=0.6 de preferencia por el fútbol, el margen de error es 3.1% a 95% de confianza.

Intervalo de confianza para una proporción law

I C = \hat{p} \pm Z \cdot \sqrt{\frac{\hat{p} \cdot (1 - \hat{p})}{n}}

Symbole	Signification	Unité
`IC`	intervalo de confianza rango [límite inferior, límite superior]
`\hat{p}`	proporción muestral proporción observada en la muestra
`Z`	valor Z nivel de confianza (1.96 para 95%)
`n`	tamaño de la muestra número de observaciones	unidad

Exemple : Para una muestra de 800 votantes en Ambato con $\hat{p}$ =0.55, el intervalo de confianza al 95% es [0.516, 0.584].

Margen de error en medias law

e = Z \cdot \frac{σ}{\sqrt{n}}

Symbole	Signification	Unité
`e`	margen de error en las mismas unidades que la variable medida
`Z`	valor Z 1.96 para 95% de confianza
`\sigma`	desviación estándar poblacional ej. en cm de altura	depende de la variable
`n`	tamaño de la muestra número de observaciones	unidad

Exemple : Para medir la altura de estudiantes en Cuenca con $σ$ =10 cm y n=200, el margen de error es 1.4 cm a 95% de confianza.

Sesgo de muestreo y corrección

Fórmulas para identificar y corregir errores sistemáticos en la recolección de datos.

Cálculo del sesgo de muestreo definition

Sesgo = {\overline{x}}_{muestra} - μ_{población}

Symbole	Signification	Unité
`\text{Sesgo}`	sesgo de muestreo valor positivo indica sobreestimación, negativo subestimación	misma que la variable medida
`\bar{x}_{\text{muestra}}`	media de la muestra ej. en kg de papas	depende de la variable
`\mu_{\text{población}}`	media real de la población valor verdadero desconocido en la mayoría de casos	depende de la variable

Exemple : En un mercado de Guayaquil, si la media de peso de 100 papas seleccionadas es 1.8 kg pero la media real es 2.0 kg, el sesgo es -0.2 kg.

Corrección del sesgo en la muestra approximation

x_{corregido} = x_{observado} - Sesgo

Symbole	Signification	Unité
`x_{\text{corregido}}`	valor corregido valor ajustado para reducir el sesgo	misma que x
`x_{\text{observado}}`	valor observado en la muestra valor medido directamente	misma que x
`\text{Sesgo}`	sesgo calculado valor obtenido con la fórmula anterior	misma que x

Exemple : Si en una muestra de 50 kg de café de Loja se observa un promedio de 68 kg pero el sesgo es +3 kg, el valor corregido es 65 kg.

Índice de sesgo relativo definition

ISR = \frac{Sesgo}{μ_{población}} \times 100 %

Symbole	Signification	Unité
`\text{ISR}`	índice de sesgo relativo porcentaje de error relativo al valor verdadero	%
`\text{Sesgo}`	sesgo de muestreo valor del sesgo calculado	misma que la variable
`\mu_{\text{población}}`	media poblacional valor de referencia verdadero	misma que la variable

Exemple : Si el sesgo es -0.2 kg y la media poblacional es 2.0 kg, el ISR es -10%, indicando un submuestreo del 10%.

Correlación entre variables

Fórmulas para medir la relación lineal entre dos variables cuantitativas en investigaciones ecuatorianas.

Coeficiente de correlación de Pearson law

r = \frac{n \sum x y - (\sum x) (\sum y)}{\sqrt{[n \sum x^{2} - {(\sum x)}^{2}] [n \sum y^{2} - {(\sum y)}^{2}]}}

Symbole	Signification	Unité
`r`	coeficiente de correlación de Pearson -1 ≤ r ≤ 1; r=0 sin correlación lineal
`n`	número de pares de datos número de observaciones emparejadas	unidad
`x, y`	variables cuantitativas ej. ingresos (USD) y gasto en turismo (USD)	depende de las variables
`\sum xy`	suma de productos xy producto de cada par de valores	(unidad_x × unidad_y)
`\sum x, \sum y`	sumas de x e y suma de todos los valores de cada variable	unidad_x, unidad_y
`\sum x^2, \sum y^2`	sumas de cuadrados suma de los valores al cuadrado	(unidad_x)², (unidad_y)²

Exemple : Para 10 turistas en Galápagos, con r=0.87 entre ingresos mensuales (USD) y gasto en tours (USD), hay una correlación positiva fuerte.

Coeficiente de determinación definition

R^{2} = r^{2}

Symbole	Signification	Unité
`R^2`	coeficiente de determinación porcentaje de variabilidad explicada (0 ≤ R² ≤ 1)
`r`	coeficiente de correlación de Pearson valor entre -1 y 1

Exemple : Si r=0.87, entonces R²=0.757, lo que significa que el 75.7% de la variabilidad en el gasto turístico se explica por los ingresos.

Error estándar de la estimación law

S E E = \sqrt{\frac{\sum {(y - \hat{y})}^{2}}{n - 2}}

Symbole	Signification	Unité
`SEE`	error estándar de la estimación medida de la precisión del modelo de regresión	misma que y
`y`	valor observado de la variable dependiente valor real medido	depende de y
`\hat{y}`	valor predicho por el modelo valor estimado por la línea de regresión	misma que y
`n`	tamaño de la muestra número de observaciones	unidad

Exemple : Para un modelo que predice el gasto turístico en Galápagos, con SEE=120 USD, el error promedio de predicción es 120 USD.

Distribución normal y puntuaciones Z

Fórmulas para analizar datos que siguen una distribución normal, común en mediciones antropométricas y académicas.

Función de densidad de la distribución normal definition

f (x) = \frac{1}{σ \sqrt{2 π}} e^{- \frac{1}{2} {(\frac{x - μ}{σ})}^{2}}

Symbole	Signification	Unité
`f(x)`	función de densidad normal área bajo la curva = 1	1/(unidad_x)
`\mu`	media de la población centro de la distribución	depende de x
`\sigma`	desviación estándar medida de dispersión	misma que x
`x`	valor de la variable punto donde se evalúa la función	depende de x
`e`	constante matemática base del logaritmo natural (~2.718)
`\pi`	constante matemática pi (~3.1416)

Dimensions : $[M] {[L]}^{- 1}$

Exemple : La altura de estudiantes en Cuenca sigue una distribución normal con μ=165 cm y σ=10 cm; la probabilidad de medir 180 cm es f(180).

Puntuación Z (estandarización) definition

z = \frac{x - μ}{σ}

Symbole	Signification	Unité
`z`	puntuación Z número de desviaciones estándar desde la media
`x`	valor observado ej. 180 cm de altura	misma que la variable
`\mu`	media poblacional ej. 165 cm	misma que x
`\sigma`	desviación estándar poblacional ej. 10 cm	misma que x

Exemple : Un estudiante de Cuenca con 185 cm de altura tiene z=(185-165)/10=2.0, lo que significa 2 desviaciones estándar por encima de la media.

Probabilidad acumulada bajo la curva normal definition

P (X \leq x) = Φ (z) = \frac{1}{2} [1 + erf (\frac{z}{\sqrt{2}})]

Symbole	Signification	Unité
`P(X \leq x)`	probabilidad acumulada probabilidad de que X sea menor o igual a x
`z`	puntuación Z calculada con la fórmula anterior
`\Phi(z)`	función de distribución normal estándar tabulada en tablas Z
`erf`	función error función matemática especial

Exemple : Para z=1.96, P(X≤x)=0.975, lo que significa que el 97.5% de los datos están por debajo de ese valor en una distribución normal.

Tamaño de muestra

Margen de error e intervalos de confianza

Sesgo de muestreo y corrección

Correlación entre variables

Distribución normal y puntuaciones Z

Fuentes