Diseño Experimental en Ecuador: Fórmulas Clave para Investigar | ORBITECH

ORBITECH AI Academy

Modelos Lineales y ANOVA

Ecuaciones fundamentales para analizar la variabilidad en diseños experimentales clásicos.

Modelo Lineal General law

Y = X β + ε

Formes alternatives

$E [Y] = X β$ — Valor esperado de la respuesta para predicción.

Symbole	Signification	Unité
`Y`	vector de respuestas Variable dependiente medida en el experimento (ej: rendimiento en kg/ha).
`X`	matriz de diseño Contiene columnas para el término constante, efectos de tratamientos y variables de bloqueo.
`\beta`	vector de parámetros Incluye efectos de tratamientos, bloques y término de interacción si aplica.
`\varepsilon`	vector de errores Asume $ε$ $\sim$ N(0, $σ$ ^2 I). Representa variabilidad no controlada.

Exemple : Experimento con café en Manta: Y registra rendimiento (kg/ha) de 3 variedades con 5 réplicas cada una. X incluye columna de unos para el intercepto, 3 columnas para efectos de variedades y 1 columna para bloque (lote).

Descomposición de la Suma de Cuadrados Total identity

S S T = S S T R + S S E

Symbole	Signification	Unité
`SST`	suma de cuadrados total SST = $\sum$ _{i=1}^{N} ( $Y_{i}$ - $\overline{Y}$ )^2. Variabilidad total en los datos.
`SSTR`	suma de cuadrados de tratamientos SSTR = $\sum$ _{j=1}^{k} $n_{j}$ ( $\overline{Y}$ _j - $\overline{Y}$ )^2. Variabilidad explicada por los tratamientos.
`SSE`	suma de cuadrados del error SSE = $\sum$ _{j=1}^{k} $\sum$ _{i=1}^{ $n_{j}$ } ( $Y_{i j}$ - $\overline{Y}$ _j)^2. Variabilidad residual dentro de tratamientos.

Exemple : En Quevedo, pruebas 3 abonos en plátano: SST=25.3, SSTR=12.5, entonces SSE=12.8. La variabilidad no explicada por los abonos es 12.8 unidades al cuadrado.

Estadístico F para ANOVA de un factor law

F = \frac{SSTR / (k - 1)}{SSE / (N - k)}

Symbole	Signification	Unité
`F`	estadístico F Se compara con $F_{k - 1, N - k, 0.05}$ de tablas para decidir si hay diferencias entre tratamientos.
`k`	número de tratamientos Ejemplo: k=3 para fertilizantes A, B, C.
`N`	número total de observaciones N = $n_{1}$ + $n_{2}$ + ... + $n_{k}$ . En réplicas balanceadas, N = k × n.

Exemple : En Los Ríos, 3 variedades de plátano con 4 réplicas cada una (N=12). SSTR=12.5, SSE=8.2. Calcula F = (12.5/2)/(8.2/9) ≈ 6.89. Compara con $F_{2,9,0.05}$ =4.26: hay diferencias significativas.

Diseños Factoriales y de Bloques

Fórmulas para analizar efectos principales e interacciones en diseños con múltiples factores.

Efecto Principal de un Factor definition

E_{A} = {\overline{Y}}_{A +} - {\overline{Y}}_{A -}

Formes alternatives

$E_{A} = \frac{1}{n} \sum_{i = 1}^{n} (Y_{A +_{i}} - Y_{A -_{i}})$ — Para diseños con réplicas n por combinación de niveles.

Symbole	Signification	Unité
`E_A`	efecto principal del factor A Diferencia promedio entre niveles alto (+) y bajo (-) del factor A.
`\bar{Y}_{A+}`	media de respuestas con A en nivel alto Ejemplo: promedio de rendimiento con dosis alta de fertilizante.
`\bar{Y}_{A-}`	media de respuestas con A en nivel bajo Ejemplo: promedio de rendimiento sin fertilizante.

Exemple : En un experimento 2^2 con café en Santo Domingo: dosis de abono (0 vs 100 kg/ha) y riego (normal vs reducido). $E_{a} b o n o$ = 850 kg/ha - 600 kg/ha = 250 kg/ha. El abono aumenta el rendimiento en 250 kg/ha.

Interacción entre Factores definition

A B = [\frac{({\overline{Y}}_{A + B +} + {\overline{Y}}_{A - B -}) - ({\overline{Y}}_{A + B -} + {\overline{Y}}_{A - B +})}{2}]

Symbole	Signification	Unité
`AB`	interacción entre factores A y B Indica si el efecto de un factor depende del nivel del otro factor.
`\bar{Y}_{A+B+}`	media con A y B en nivel alto Ejemplo: alto abono + riego reducido.

Exemple : Con los datos del café: AB = [(900 + 550) - (800 + 650)]/2 = (1450 - 1450)/2 = 0. No hay interacción: el efecto del abono es similar con riego normal o reducido.

Modelo de Bloques Aleatorios law

Y_{i j} = μ + τ_{i} + β_{j} + ε_{i j}

Symbole	Signification	Unité
`Y_{ij}`	respuesta en bloque j y tratamiento i Ejemplo: rendimiento de variedad i en lote j.
`\mu`	media global Promedio de todas las observaciones.
`\tau_i`	efecto del tratamiento i Diferencia del tratamiento i respecto a la media global.
`\beta_j`	efecto del bloque j Variabilidad debida al bloque (ej: fertilidad del suelo en lote j).
`\varepsilon_{ij}`	error experimental Variabilidad residual dentro del bloque y tratamiento.

Exemple : En Cuenca, pruebas 4 variedades de maíz en 3 lotes con diferente pendiente. Cada lote es un bloque. $β$ _j captura la fertilidad de cada lote, reduciendo el error experimental.

Tamaño de Muestra y Potencia

Fórmulas para calcular el número mínimo de réplicas y garantizar resultados confiables.

Tamaño de Muestra para Comparación de Dos Medias approximation

n = \frac{2 {(Z_{α / 2} + Z_{β})}^{2} σ^{2}}{{(μ_{1} - μ_{2})}^{2}}

Formes alternatives

$n = \frac{{(Z_{α / 2} + Z_{β})}^{2} (σ_{1}^{2} + σ_{2}^{2})}{{(μ_{1} - μ_{2})}^{2}}$ — Para varianzas desiguales $σ$ _1^2 $\neq$ $σ$ _2^2.

Symbole	Signification	Unité
`n`	tamaño de muestra por grupo Número de réplicas por tratamiento. Total = 2n.
`Z_{\alpha/2}`	cuantil de la normal estándar $Z_{0.025}$ =1.96 para α=0.05.
`Z_{\beta}`	cuantil para potencia $Z_{0.20}$ =0.84 para potencia del 80%.
`\sigma`	desviación estándar poblacional Estimada de estudios previos o piloto.
`(\mu_1 - \mu_2)`	diferencia mínima detectable Diferencia que el experimento debe detectar como significativa.

Exemple : Para detectar una diferencia de 200 kg/ha en rendimiento de cacao entre dos clones en Esmeraldas, con $σ$ =150 kg/ha, necesitas n=25 réplicas por clone (total 50 plantas).

Potencia de un Experimento theorem

1 - β = P (Z > Z_{α / 2} - \frac{| μ_{1} - μ_{2} |}{σ \sqrt{2 / n}})

Symbole	Signification	Unité
`1-\beta`	potencia del experimento Probabilidad de detectar una diferencia $μ$ _1- $μ$ _2 como significativa.
`n`	tamaño de muestra por grupo Mismo n para ambos tratamientos.
`\sigma`	desviación estándar común Asumida igual para ambos grupos.

Exemple : Con n=20 réplicas por clone de cacao, $σ$ =150 kg/ha y diferencia de 200 kg/ha, la potencia es aproximadamente 0.85 (85%). Hay 85% de probabilidad de detectar la diferencia si existe.

Número de Réplicas en Diseños Factoriales approximation

r = \frac{{(t_{α / 2, d f_{E}})}^{2} σ^{2}}{d^{2}}

Symbole	Signification	Unité
`r`	número de réplicas por combinación de tratamientos En diseños factoriales 2^k, r réplicas por celda.
`t_{\alpha/2, df_E}`	cuantil t de Student Con grados de libertad del error d $f_{E}$ = k(n-1) para diseños balanceados.
`d`	diferencia mínima detectable Diferencia que se quiere detectar en la respuesta.
`\sigma`	desviación estándar del error Estimada de estudios previos.

Exemple : En un experimento 2^2 con café en Manabí (abono y riego), $σ$ =120 kg/ha, d=150 kg/ha y $α$ =0.05. Con d $f_{E}$ =12, $t_{0.025,12}$ =2.18, entonces r=(2.18^2 * 120^2)/150^2 ≈ 3 réplicas por combinación (total 12 plantas).

Regresión Lineal en Experimentos

Modelos para relacionar variables cuantitativas en investigaciones ecuatorianas.

Regresión Lineal Simple law

Y = β_{0} + β_{1} X + ε

Formes alternatives

$\hat{Y} = b_{0} + b_{1} X$ — Ecuación ajustada con estimadores $b_{0}$ y $b_{1}$ .

Symbole	Signification	Unité
`Y`	variable respuesta Ejemplo: rendimiento de maíz (kg/ha).
`X`	variable predictora Ejemplo: dosis de fertilizante (kg/ha).
`\beta_0`	intercepto Valor de Y cuando X=0.
`\beta_1`	pendiente Cambio en Y por unidad de X.
`\varepsilon`	error aleatorio Asume $ε$ $\sim$ N(0, $σ$ ^2).

Exemple : En Santo Domingo, mides rendimiento de maíz (Y, kg/ha) vs dosis de urea (X, kg/ha): Y=2500 + 12.5X. Cada kg de urea aumenta el rendimiento en 12.5 kg/ha.

Coeficiente de Determinación R² definition

R^{2} = 1 - \frac{S S E}{S S T}

Formes alternatives

$R^{2} = \frac{S S R}{S S T}$ — SSR = $\sum$ ( $\hat{Y}$ _i - $\overline{Y}$ )^2 (suma de cuadrados de regresión).

Symbole	Signification	Unité
`R^2`	coeficiente de determinación Proporción de variabilidad en Y explicada por X. 0 ≤ R² ≤ 1.
`SSE`	suma de cuadrados de errores SSE = $\sum$ ( $Y_{i}$ - $\hat{Y}$ _i)^2.
`SST`	suma de cuadrados total SST = $\sum$ ( $Y_{i}$ - $\overline{Y}$ )^2.

Exemple : En un experimento con banano en El Oro, R²=0.78. El 78% de la variabilidad en el peso de racimos se explica por la dosis de potasio aplicada.

Error Estándar de la Pendiente definition

S E (b_{1}) = \sqrt{\frac{M S E}{\sum_{i = 1}^{n} {(X_{i} - \overline{X})}^{2}}}

Symbole	Signification	Unité
`SE(b_1)`	error estándar de $b_{1}$ Incertidumbre en la estimación de $β$ _1.
`MSE`	cuadrado medio del error MSE = SSE/(n-2). Estimador de $σ$ ^2.
`n`	tamaño de muestra Número de pares ( $X_{i}$ , $Y_{i}$ ).

Exemple : En un experimento con cacao en Los Ríos (n=10), MSE=2500 y $\sum$ ( $X_{i}$ - $\overline{X}$ )^2=5000. Entonces SE( $b_{1}$ )=sqrt(2500/5000)=0.71. El efecto de X en Y se estima con precisión ±0.71 unidades.

Diseños Especiales y Validación

Fórmulas para diseños en parcelas divididas y pruebas de normalidad.

Modelo de Parcelas Divididas law

Y_{i j k} = μ + τ_{i} + δ_{j} + {(τ δ)}_{i j} + β_{k} + ε_{i j k}

Symbole	Signification	Unité
`Y_{ijk}`	respuesta en parcela principal i, subparcela j, bloque k Ejemplo: rendimiento de variedad i en subparcela j de lote k.
`\tau_i`	efecto de parcela principal (factor A) Ejemplo: efecto de variedad de café.
`\delta_j`	efecto de subparcela (factor B) Ejemplo: efecto de densidad de siembra.
`(\tau\delta)_{ij}`	interacción entre factores A y B Variabilidad debida a la combinación específica de niveles.
`\beta_k`	efecto del bloque k Lote o área homogénea.

Exemple : En una finca de palma africana en Esmeraldas, factor A=variedad (2 niveles), factor B=fertilizante (3 niveles). Cada bloque tiene todas las combinaciones. La interacción captura si el efecto del fertilizante depende de la variedad.

Prueba de Shapiro-Wilk para Normalidad theorem

W = \frac{{(\sum_{i = 1}^{n} a_{i} Y_{(i)})}^{2}}{\sum_{i = 1}^{n} {(Y_{i} - \overline{Y})}^{2}}

Symbole	Signification	Unité
`W`	estadístico de Shapiro-Wilk Valores cercanos a 1 indican normalidad. Comparar con tablas para n ≤ 50.
`a_i`	coeficientes tabulados Dependientes de n. Disponibles en tablas estadísticas.
`Y_{(i)}`	i-ésimo valor ordenado Datos ordenados de menor a mayor.

Exemple : En un experimento con tomate en Ambato (n=20), W=0.96. Como W > $W_{0.05,20}$ =0.94, no se rechaza normalidad de los residuos.

Prueba de Bartlett para Homocedasticidad law

B = \frac{(N - k) \ln (s_{p}^{2}) - \sum_{i = 1}^{k} (n_{i} - 1) \ln (s_{i}^{2})}{1 + \frac{1}{3 (k - 1)} (\sum_{i = 1}^{k} \frac{1}{n_{i} - 1} - \frac{1}{N - k})}

Symbole	Signification	Unité
`B`	estadístico de Bartlett Valores altos indican heterocedasticidad. Comparar con $χ$ ^2_{k-1,0.05}.
`s_p^2`	varianza pooled $s_{p}$ ^2 = $\sum$ ( $n_{i}$ - 1) $s_{i}$ ^2 / (N - k).
`s_i^2`	varianza del grupo i Varianza muestral del tratamiento i.
`k`	número de grupos Ejemplo: k=3 para 3 fertilizantes.
`N`	tamaño total de muestra N = $n_{1}$ + ... + $n_{k}$ .

Exemple : En un experimento con 3 abonos en cacao ( $n_{i}$ =10 cada uno), B=4.2. Como $χ$ ^2_{2,0.05}=5.99, no hay evidencia de heterocedasticidad en los residuos.

Modelos Lineales y ANOVA

Diseños Factoriales y de Bloques

Tamaño de Muestra y Potencia

Regresión Lineal en Experimentos

Diseños Especiales y Validación

Fuentes