Skip to content
Este artículo tiene fines educativos. Te animamos a verificar con fuentes oficiales.

¿Cómo empezar con análisis multivariado para mi proyecto de grado?

@KarinaEspejo · · answered
#estadística#ecuador#bachillerato#proyecto de grado

Chicos, necesito ayuda URGENTE con mi proyecto de grado para el Ser Bachiller. Tengo datos de ventas de productos en el mercado de Guayaquil, ingresos familiares y precios de alimentos... pero no sé ni por dónde empezar. ¿Alguien me puede explicar cómo aplicar análisis multivariado con ejemplos ecuatorianos? ¡Me estoy volviendo loco con tantas variables!

@LuisCevallos student ·

¡Tranquila Karina! Empieza con regresión múltiple. Por ejemplo, analiza cómo el precio del plátano en el mercado de Guayaquil afecta los ingresos de los vendedores. Usa Excel o R Studio, es más fácil de lo que parece.

@ProfMora teacher ·
@LuisCevallos a dicho: ¡Tranquila Karina! Empieza con regresión múltiple...

@LuisCevallos casi aciertas, pero mejor usa Análisis de Componentes Principales (ACP) primero para reducir tus 15 variables a 3 o 4. Así evitas el problema de multicolinealidad que mencionas.

@JokerCarlos student ·

¡Cuidado con el plátano! Si lo pones en la regresión, te va a salir correlación con TODO... incluso con el precio del petróleo 🍌💥

@MaríaGómez student ·

¿Y si mis datos tienen variables como producción de cacao en Esmeraldas y consumo de chocolate en Quito? ¿Eso cuenta como multivariado?

@IngenieroPérez expert ·
@MaríaGómez a dicho: ¿Y si mis datos tienen variables como producción de cacao...

@MaríaGómez sí, eso es multivariado. Pero ojo: primero limpia tus datos (valores faltantes, outliers) y luego aplica regresión múltiple o ACP según tu objetivo.

@EstebanQuizhpe student ·
@IngenieroPérez a dicho: @MaríaGómez sí, eso es multivariado...

¿Y cómo interpreto los coeficientes de la regresión? ¿Los valores absolutos o los estandarizados? Me confunden siempre esos números.

@MaríaGómez student ·
@EstebanQuizhpe a dicho: ¿Y cómo interpreto los coeficientes...

¿Y cómo presento esto para el Ser Bachiller? ¿Solo con tablas o necesito gráficos también?

@ProfLarrea teacher ·
@MaríaGómez a dicho: ¿Y cómo presento esto para el Ser Bachiller...

@MaríaGómez ¡Gráficos SIEMPRE! Usa biplot del ACP y diagrama de residuos de la regresión. En R: autoplot(prcomp()) y plot(modelo). Para el Ser Bachiller, incluye: objetivo, metodología, resultados (gráficos + tabla) y conclusiones.

@ProfLarrea teacher ·

¡Buenos días! Vamos paso a paso: 1) Define tu objetivo (¿predecir ventas? ¿entender relaciones?). 2) Usa ACP para reducir variables. 3) Aplica regresión múltiple. Ejemplo: Datos de 2023 de ventas en Mercado Mayorista de Quito. Variables: precio plátano (1.20/kg),ingresosfamilia(450/mes), consumo arroz (kg/mes).

@JokerMaría student ·
@ProfLarrea a dicho: ¡Buenos días! Vamos paso a paso...

@ProfLarrea ¿y si mi ACP me dice que el plátano y el arroz son lo mismo? ¡Entonces solo como plátano de ahora en adelante! 🍚→🍌

@ProfToapanta teacher · Mejor respuesta
@ProfLarrea a dicho: ¡Buenos días! Vamos paso a paso...

¡Exacto! Primero haz ACP para ver qué variables se agrupan. Luego usa regresión múltiple con las componentes principales. En R Studio usa: prcomp() para ACP y lm() para regresión. Recuerda: las variables deben estar estandarizadas (media=0, desviación=1).

Xestandarizada=Xmedia(X)desviación(X)
@KarinaEspejo student ·
@ProfToapanta a dicho: ¡Exacto! Primero haz ACP...

¡Gracias @ProfToapanta! ¿Y si mis datos tienen valores faltantes? ¿Los elimino o los completo con la media?

@ProfMora teacher ·
@KarinaEspejo a dicho: ¡Gracias @ProfToapanta! ¿Y si mis datos tienen valores faltantes...

@KarinaEspejo depende del porcentaje de datos faltantes. Si es menos del 5%, elimina las filas. Si es más, usa imputación múltiple con mice en R. ¡Nunca uses la media si tienes patrones en los datos!

@LuisCevallos student ·
@KarinaEspejo a dicho: ¡Gracias @ProfToapanta! ¿Y si mis datos tienen valores faltantes...

@KarinaEspejo aquí tienes un ejemplo de código R para empezar:

\nlibrary(ggplot2)\ndatos <- read.csv("ventas_quito.csv")\ndatos_estandarizados <- scale(datos)\nmodelo_acp <- prcomp(datos_estandarizados)\nsummary(modelo_acp)\n

@JokerCarlos student ·
@ProfToapanta a dicho: ¡Exacto! Primero haz ACP...

¡Con la media no! Si completas con la media, tu plátano va a ser más aburrido que una clase de estadística a las 7 AM 😴

Fuentes

  1. en.wikipedia.org
  2. www.sciencedirect.com
  3. www.ncbi.nlm.nih.gov
  4. doi.org
  5. pubmed.ncbi.nlm.nih.gov
  6. www.dioi.org
  7. ui.adsabs.harvard.edu
  8. search.worldcat.org
  9. www.jstor.org
  10. arxiv.org
  11. stats.oarc.ucla.edu
  12. cran.r-project.org
  13. ggobi.org
  14. ordination.okstate.edu
  15. archive.today