Skip to content
Este artículo tiene fines educativos. Te animamos a verificar con fuentes oficiales.

Modelos Lineales y ANOVA

Ecuaciones fundamentales para analizar la variabilidad en diseños experimentales clásicos.

Modelo Lineal General law
Y=Xβ+ε
Formes alternatives
  • E[Y]=Xβ — Valor esperado de la respuesta para predicción.
SymboleSignificationUnité
Yvector de respuestas
Variable dependiente medida en el experimento (ej: rendimiento en kg/ha).
Xmatriz de diseño
Contiene columnas para el término constante, efectos de tratamientos y variables de bloqueo.
\betavector de parámetros
Incluye efectos de tratamientos, bloques y término de interacción si aplica.
\varepsilonvector de errores
Asume ε N(0, σ^2 I). Representa variabilidad no controlada.

Exemple : Experimento con café en Manta: Y registra rendimiento (kg/ha) de 3 variedades con 5 réplicas cada una. X incluye columna de unos para el intercepto, 3 columnas para efectos de variedades y 1 columna para bloque (lote).

Descomposición de la Suma de Cuadrados Total identity
SST=SSTR+SSE
SymboleSignificationUnité
SSTsuma de cuadrados total
SST = _{i=1}^{N} (Yi - Y)^2. Variabilidad total en los datos.
SSTRsuma de cuadrados de tratamientos
SSTR = _{j=1}^{k} nj(Y_j - Y)^2. Variabilidad explicada por los tratamientos.
SSEsuma de cuadrados del error
SSE = _{j=1}^{k} _{i=1}^{nj} (Yij - Y_j)^2. Variabilidad residual dentro de tratamientos.

Exemple : En Quevedo, pruebas 3 abonos en plátano: SST=25.3, SSTR=12.5, entonces SSE=12.8. La variabilidad no explicada por los abonos es 12.8 unidades al cuadrado.

Estadístico F para ANOVA de un factor law
F=SSTR/(k1)SSE/(Nk)
SymboleSignificationUnité
Festadístico F
Se compara con Fk1,Nk,0.05 de tablas para decidir si hay diferencias entre tratamientos.
knúmero de tratamientos
Ejemplo: k=3 para fertilizantes A, B, C.
Nnúmero total de observaciones
N = n1 + n2 + ... + nk. En réplicas balanceadas, N = k × n.

Exemple : En Los Ríos, 3 variedades de plátano con 4 réplicas cada una (N=12). SSTR=12.5, SSE=8.2. Calcula F = (12.5/2)/(8.2/9) ≈ 6.89. Compara con F2,9,0.05=4.26: hay diferencias significativas.

Diseños Factoriales y de Bloques

Fórmulas para analizar efectos principales e interacciones en diseños con múltiples factores.

Efecto Principal de un Factor definition
EA=YA+YA
Formes alternatives
  • EA=1ni=1n(YA+iYAi) — Para diseños con réplicas n por combinación de niveles.
SymboleSignificationUnité
E_Aefecto principal del factor A
Diferencia promedio entre niveles alto (+) y bajo (-) del factor A.
\bar{Y}_{A+}media de respuestas con A en nivel alto
Ejemplo: promedio de rendimiento con dosis alta de fertilizante.
\bar{Y}_{A-}media de respuestas con A en nivel bajo
Ejemplo: promedio de rendimiento sin fertilizante.

Exemple : En un experimento 2^2 con café en Santo Domingo: dosis de abono (0 vs 100 kg/ha) y riego (normal vs reducido). Eabono = 850 kg/ha - 600 kg/ha = 250 kg/ha. El abono aumenta el rendimiento en 250 kg/ha.

Interacción entre Factores definition
AB=[(YA+B++YAB)(YA+B+YAB+)2]
SymboleSignificationUnité
ABinteracción entre factores A y B
Indica si el efecto de un factor depende del nivel del otro factor.
\bar{Y}_{A+B+}media con A y B en nivel alto
Ejemplo: alto abono + riego reducido.

Exemple : Con los datos del café: AB = [(900 + 550) - (800 + 650)]/2 = (1450 - 1450)/2 = 0. No hay interacción: el efecto del abono es similar con riego normal o reducido.

Modelo de Bloques Aleatorios law
Yij=μ+τi+βj+εij
SymboleSignificationUnité
Y_{ij}respuesta en bloque j y tratamiento i
Ejemplo: rendimiento de variedad i en lote j.
\mumedia global
Promedio de todas las observaciones.
\tau_iefecto del tratamiento i
Diferencia del tratamiento i respecto a la media global.
\beta_jefecto del bloque j
Variabilidad debida al bloque (ej: fertilidad del suelo en lote j).
\varepsilon_{ij}error experimental
Variabilidad residual dentro del bloque y tratamiento.

Exemple : En Cuenca, pruebas 4 variedades de maíz en 3 lotes con diferente pendiente. Cada lote es un bloque. β_j captura la fertilidad de cada lote, reduciendo el error experimental.

Tamaño de Muestra y Potencia

Fórmulas para calcular el número mínimo de réplicas y garantizar resultados confiables.

Tamaño de Muestra para Comparación de Dos Medias approximation
n=2(Zα/2+Zβ)2σ2(μ1μ2)2
Formes alternatives
  • n=(Zα/2+Zβ)2(σ12+σ22)(μ1μ2)2 — Para varianzas desiguales σ_1^2 σ_2^2.
SymboleSignificationUnité
ntamaño de muestra por grupo
Número de réplicas por tratamiento. Total = 2n.
Z_{\alpha/2}cuantil de la normal estándar
Z0.025=1.96 para α=0.05.
Z_{\beta}cuantil para potencia
Z0.20=0.84 para potencia del 80%.
\sigmadesviación estándar poblacional
Estimada de estudios previos o piloto.
(\mu_1 - \mu_2)diferencia mínima detectable
Diferencia que el experimento debe detectar como significativa.

Exemple : Para detectar una diferencia de 200 kg/ha en rendimiento de cacao entre dos clones en Esmeraldas, con σ=150 kg/ha, necesitas n=25 réplicas por clone (total 50 plantas).

Potencia de un Experimento theorem
1β=P(Z>Zα/2|μ1μ2|σ2/n)
SymboleSignificationUnité
1-\betapotencia del experimento
Probabilidad de detectar una diferencia μ_1-μ_2 como significativa.
ntamaño de muestra por grupo
Mismo n para ambos tratamientos.
\sigmadesviación estándar común
Asumida igual para ambos grupos.

Exemple : Con n=20 réplicas por clone de cacao, σ=150 kg/ha y diferencia de 200 kg/ha, la potencia es aproximadamente 0.85 (85%). Hay 85% de probabilidad de detectar la diferencia si existe.

Número de Réplicas en Diseños Factoriales approximation
r=(tα/2,dfE)2σ2d2
SymboleSignificationUnité
rnúmero de réplicas por combinación de tratamientos
En diseños factoriales 2^k, r réplicas por celda.
t_{\alpha/2, df_E}cuantil t de Student
Con grados de libertad del error dfE = k(n-1) para diseños balanceados.
ddiferencia mínima detectable
Diferencia que se quiere detectar en la respuesta.
\sigmadesviación estándar del error
Estimada de estudios previos.

Exemple : En un experimento 2^2 con café en Manabí (abono y riego), σ=120 kg/ha, d=150 kg/ha y α=0.05. Con dfE=12, t0.025,12=2.18, entonces r=(2.18^2 * 120^2)/150^2 ≈ 3 réplicas por combinación (total 12 plantas).

Regresión Lineal en Experimentos

Modelos para relacionar variables cuantitativas en investigaciones ecuatorianas.

Regresión Lineal Simple law
Y=β0+β1X+ε
Formes alternatives
  • Y^=b0+b1X — Ecuación ajustada con estimadores b0 y b1.
SymboleSignificationUnité
Yvariable respuesta
Ejemplo: rendimiento de maíz (kg/ha).
Xvariable predictora
Ejemplo: dosis de fertilizante (kg/ha).
\beta_0intercepto
Valor de Y cuando X=0.
\beta_1pendiente
Cambio en Y por unidad de X.
\varepsilonerror aleatorio
Asume ε N(0, σ^2).

Exemple : En Santo Domingo, mides rendimiento de maíz (Y, kg/ha) vs dosis de urea (X, kg/ha): Y=2500 + 12.5X. Cada kg de urea aumenta el rendimiento en 12.5 kg/ha.

Coeficiente de Determinación R² definition
R2=1SSESST
Formes alternatives
  • R2=SSRSST — SSR = (Y^_i - Y)^2 (suma de cuadrados de regresión).
SymboleSignificationUnité
R^2coeficiente de determinación
Proporción de variabilidad en Y explicada por X. 0 ≤ R² ≤ 1.
SSEsuma de cuadrados de errores
SSE = (Yi - Y^_i)^2.
SSTsuma de cuadrados total
SST = (Yi - Y)^2.

Exemple : En un experimento con banano en El Oro, R²=0.78. El 78% de la variabilidad en el peso de racimos se explica por la dosis de potasio aplicada.

Error Estándar de la Pendiente definition
SE(b1)=MSEi=1n(XiX)2
SymboleSignificationUnité
SE(b_1)error estándar de b1
Incertidumbre en la estimación de β_1.
MSEcuadrado medio del error
MSE = SSE/(n-2). Estimador de σ^2.
ntamaño de muestra
Número de pares (Xi, Yi).

Exemple : En un experimento con cacao en Los Ríos (n=10), MSE=2500 y (Xi - X)^2=5000. Entonces SE(b1)=sqrt(2500/5000)=0.71. El efecto de X en Y se estima con precisión ±0.71 unidades.

Diseños Especiales y Validación

Fórmulas para diseños en parcelas divididas y pruebas de normalidad.

Modelo de Parcelas Divididas law
Yijk=μ+τi+δj+(τδ)ij+βk+εijk
SymboleSignificationUnité
Y_{ijk}respuesta en parcela principal i, subparcela j, bloque k
Ejemplo: rendimiento de variedad i en subparcela j de lote k.
\tau_iefecto de parcela principal (factor A)
Ejemplo: efecto de variedad de café.
\delta_jefecto de subparcela (factor B)
Ejemplo: efecto de densidad de siembra.
(\tau\delta)_{ij}interacción entre factores A y B
Variabilidad debida a la combinación específica de niveles.
\beta_kefecto del bloque k
Lote o área homogénea.

Exemple : En una finca de palma africana en Esmeraldas, factor A=variedad (2 niveles), factor B=fertilizante (3 niveles). Cada bloque tiene todas las combinaciones. La interacción captura si el efecto del fertilizante depende de la variedad.

Prueba de Shapiro-Wilk para Normalidad theorem
W=(i=1naiY(i))2i=1n(YiY)2
SymboleSignificationUnité
Westadístico de Shapiro-Wilk
Valores cercanos a 1 indican normalidad. Comparar con tablas para n ≤ 50.
a_icoeficientes tabulados
Dependientes de n. Disponibles en tablas estadísticas.
Y_{(i)}i-ésimo valor ordenado
Datos ordenados de menor a mayor.

Exemple : En un experimento con tomate en Ambato (n=20), W=0.96. Como W > W0.05,20=0.94, no se rechaza normalidad de los residuos.

Prueba de Bartlett para Homocedasticidad law
B=(Nk)ln(sp2)i=1k(ni1)ln(si2)1+13(k1)(i=1k1ni11Nk)
SymboleSignificationUnité
Bestadístico de Bartlett
Valores altos indican heterocedasticidad. Comparar con χ^2_{k-1,0.05}.
s_p^2varianza pooled
sp^2 = (ni - 1)si^2 / (N - k).
s_i^2varianza del grupo i
Varianza muestral del tratamiento i.
knúmero de grupos
Ejemplo: k=3 para 3 fertilizantes.
Ntamaño total de muestra
N = n1 + ... + nk.

Exemple : En un experimento con 3 abonos en cacao (ni=10 cada uno), B=4.2. Como χ^2_{2,0.05}=5.99, no hay evidencia de heterocedasticidad en los residuos.

Fuentes

  1. en.wikipedia.org
  2. asq.org
  3. projecteuclid.org
  4. doi.org
  5. www.jstor.org
  6. mathscinet.ams.org
  7. api.semanticscholar.org
  8. pubmed.ncbi.nlm.nih.gov
  9. docs.lib.noaa.gov
  10. web.archive.org
  11. citeseerx.ist.psu.edu
  12. search.worldcat.org
  13. prismtc.co.uk
  14. psychclassics.yorku.ca