Argel Gastélum Arellánez
2013-Aug-27 21:14 UTC
[R-es] Encontrar las variables más importantes en componentes principales
Hola compañeros de la lista. Qué tal. Tengo un análisis de componentes principales, en el que se evalúan aproximadamente 1000 variables. Usando la función dudi.pca e inertia.dudi obtengo una cantidad de información sobre la influencia de las variables sobre los dos componentes principales. Me gustaría saber si existe alguna función que sobre esta información me arrojara la lista de cuáles son las variables que más influyen sobre el resultado. Revisando la información que arroja inertia.dudi, creo que con las contribuciones a los ejes podría conseguirlo. Los comandos que utilizo son los siguientes: acp <- dudi.pca(df = DATOS[,(2:1013)], scannf = FALSE, nf = 2) acpI <- inertia.dudi(acp, row.inertia = T, col.inertia = T) #CONTRIBUCIONES DE LAS COLUMNAS A LOS EJES acpI$col.abs/100 Con esto obtengo una lista similar a: Comp1 Comp2 X0 0.02 0.03 X1 0.04 0.00 X2 0.25 0.08 X3 0.12 0.07 X4 0.08 0.10 X5 0.09 0.03 . . . De estos valores parece ser que, por ejemplo, las variables X2 y X3 contribuyen en mayor grado al componente principal 1, y que la variable X4 contribuye en mayor grado al componente principal 2... ¿Cómo podría, usando un criterio objetivo, obtener aquéllas variables X que estén afectando en mayor medida al resultado del análisis de componentes principales? De antemano muchas gracias por la ayuda. Saludos. -- Argel.
Carlos Ortega
2013-Aug-29 09:56 UTC
[R-es] Encontrar las variables más importantes en componentes principales
Hola Argel, Puedes encontrar un par de ejemplos que cómo conseguir una valoración (qualitativa y cuantitativa) de la contribución de cada variable a cada componente principal, en el libro "Exploratory Multivariate Analysis by Example Using R". Este libro está basado en la librería "FactoMineR". Los ejemplos están en el capítulo primero. No he mirado como se haría esto con "ade4", que es la librería que entiendo estás utilizando. Saludos, Carlos Ortega www.qualityexcellence.es El 27 de agosto de 2013 23:14, Argel Gastélum Arellánez < argel.gastelum@gmail.com> escribió:> Hola compañeros de la lista. Qué tal. > > Tengo un análisis de componentes principales, en el que se evalúan > aproximadamente 1000 variables. Usando la función dudi.pca e inertia.dudi > obtengo una cantidad de información sobre la influencia de las variables > sobre los dos componentes principales. Me gustaría saber si existe alguna > función que sobre esta información me arrojara la lista de cuáles son las > variables que más influyen sobre el resultado. > > Revisando la información que arroja inertia.dudi, creo que con las > contribuciones a los ejes podría conseguirlo. Los comandos que utilizo son > los siguientes: > > acp <- dudi.pca(df = DATOS[,(2:1013)], scannf = FALSE, nf = 2) > > acpI <- inertia.dudi(acp, row.inertia = T, col.inertia = T) > > #CONTRIBUCIONES DE LAS COLUMNAS A LOS EJES > acpI$col.abs/100 > > Con esto obtengo una lista similar a: > > Comp1 Comp2 > X0 0.02 0.03 > X1 0.04 0.00 > X2 0.25 0.08 > X3 0.12 0.07 > X4 0.08 0.10 > X5 0.09 0.03 > . > . > . > > De estos valores parece ser que, por ejemplo, las variables X2 y X3 > contribuyen en mayor grado al componente principal 1, y que la variable X4 > contribuye en mayor grado al componente principal 2... ¿Cómo podría, usando > un criterio objetivo, obtener aquéllas variables X que estén afectando en > mayor medida al resultado del análisis de componentes principales? > > De antemano muchas gracias por la ayuda. > > Saludos. > > -- > > Argel. > > ______________________________**_________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es> >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Argel Gastélum Arellánez
2013-Aug-29 15:55 UTC
[R-es] Encontrar las variables más importantes en componentes principales
Hola Carlos, muchas gracias por la recomendación. Por el momento no tengo acceso a este libro, pero en cuanto pueda lo revisaré y también la documentación de la librería FactoMineR. Saludos. -- Argel. El 29/08/13 04:56, Carlos Ortega escribió:> Hola Argel, > > Puedes encontrar un par de ejemplos que cómo conseguir una valoración > (qualitativa y cuantitativa) de la contribución de cada variable a > cada componente principal, en el libro "Exploratory Multivariate > Analysis by Example Using R". > Este libro está basado en la librería "FactoMineR". > > Los ejemplos están en el capítulo primero. > > No he mirado como se haría esto con "ade4", que es la librería que > entiendo estás utilizando. > > Saludos, > Carlos Ortega > www.qualityexcellence.es <http://www.qualityexcellence.es> > > > El 27 de agosto de 2013 23:14, Argel Gastélum Arellánez > <argel.gastelum@gmail.com <mailto:argel.gastelum@gmail.com>> escribió: > > Hola compañeros de la lista. Qué tal. > > Tengo un análisis de componentes principales, en el que se > evalúan aproximadamente 1000 variables. Usando la función dudi.pca > e inertia.dudi obtengo una cantidad de información sobre la > influencia de las variables sobre los dos componentes principales. > Me gustaría saber si existe alguna función que sobre esta > información me arrojara la lista de cuáles son las variables que > más influyen sobre el resultado. > > Revisando la información que arroja inertia.dudi, creo que con > las contribuciones a los ejes podría conseguirlo. Los comandos que > utilizo son los siguientes: > > acp <- dudi.pca(df = DATOS[,(2:1013)], scannf = FALSE, nf = 2) > > acpI <- inertia.dudi(acp, row.inertia = T, col.inertia = T) > > #CONTRIBUCIONES DE LAS COLUMNAS A LOS EJES > acpI$col.abs/100 > > Con esto obtengo una lista similar a: > > Comp1 Comp2 > X0 0.02 0.03 > X1 0.04 0.00 > X2 0.25 0.08 > X3 0.12 0.07 > X4 0.08 0.10 > X5 0.09 0.03 > . > . > . > > De estos valores parece ser que, por ejemplo, las variables X2 > y X3 contribuyen en mayor grado al componente principal 1, y que > la variable X4 contribuye en mayor grado al componente principal > 2... ¿Cómo podría, usando un criterio objetivo, obtener aquéllas > variables X que estén afectando en mayor medida al resultado del > análisis de componentes principales? > > De antemano muchas gracias por la ayuda. > > Saludos. > > -- > > Argel. > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org <mailto:R-help-es@r-project.org> > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es <http://www.qualityexcellence.es>[[alternative HTML version deleted]]
Possibly Parallel Threads
- Encontrar las variables más importantes en componentes principales
- Resumen de R-help-es, Vol 54, Envío 22
- Análisis de componentes principales con ade4 y FactoMineR
- Análisis de componentes principales con ade4 y FactoMineR
- Análisis de componentes principales con ade4 y FactoMineR