Pedro Concejero Cerezo
2011-Jan-07 11:54 UTC
[R-es] Resumen de R-help-es, Vol 23, Envío 10
Una técnica recomendable para evitar el problema de la colinealidad es la regresión sobre componentes principales (Principal Component Regression). http://cran.r-project.org/web/packages/pls/ http://en.wikipedia.org/wiki/Principal_component_regression Los procedimientos tipo stepwise pueden no ser óptimos, en función de la complejidad de los efectos que estemos introduciendo. Pero ése es otro tema. En general, debiéramos evitar tener colinealidad antes de finalizar el modelo. Saludos, Pedro Concejero El 2011-01-06 12:00, r-help-es-request@r-project.org<mailto:r-help-es-request@r-project.org> escribió: Message: 3 Date: Wed, 5 Jan 2011 22:36:38 +0100 From: "Lola Ferrer" <lfcastan@usal.es><mailto:lfcastan@usal.es> To: <R-help-es@r-project.org><mailto:R-help-es@r-project.org> Subject: Re: [R-es] colinearidad Message-ID: <001901cbad20$a3112680$e9337380$@es> Content-Type: text/plain; charset="iso-8859-1" Hola, Es cierto que la colinealidad tiende a considerarse un problema. Para curarte en salud, si tienes variables fuertemente correlacionadas entre sí (por ejemplo, cuando r > 0.8), podrías excluir algunas de ellas (información redundante) y quedarte sólo con la que explique una mayor variación de los datos. Otra cosa que podrías hacer, teniendo en cuenta la existencia de colinealidad (collinearity, en inglés) y las dificultades que esto podría causar en la selección de variables (???), sería evitar utilizar procedimientos automáticos de selección de las mismas. Yo te aconsejaría que utilizaras un proceso de eliminación de variables paso a paso hacia atrás (backward elimination), además de la selección de variables paso a paso hacia delante (forward selection) que normalmente se usa. En principio, el resultado final debería ser el mismo, aunque no necesariamente. Cuando incluyes todos los términos en el modelo y luego vas quitando uno a uno los no significativos (backward elimination), todos aquellos que no explican nada, los que son redundantes (están fuertemente correlacionados con otros), también se quitan; o sea, que al final se caen ellos "solitos" del modelo. En cambio, mediante una selección paso a paso hacia delante, la inclusión de una determinada variable podría impedir que luego otras variables, que en conjunto explicaran más que esa primera, entraran en el modelo. Por eso, el modelo obtenido por forward podría ser diferente del modelo obtenido por backward. Si con los dos procedimientos obtuvieras el mismo modelo, entonces, estupendo; eso le daría más solidez a tu modelo. Y si obtienes dos modelos diferentes, no desestimes ninguno y piensa que todos los modelos son incorrectos (al fin y al cabo, no son más que una simplificación de la realidad). Un saludo, y Feliz Año 2011 Lola -- Dr. Dolores Ferrer-Castán Área de Ecología, Facultad de Biología Universidad de Salamanca C.U. Miguel de Unamuno E-37007 Salamanca, Spain Tel: +34 923 294 464 Fax: +34 923 294 515 -----Mensaje original----- De: r-help-es-bounces@r-project.org<mailto:r-help-es-bounces@r-project.org> [mailto:r-help-es-bounces@r-project.org] En nombre de Miguel Lázaro Enviado el: miércoles, 05 de enero de 2011 20:14 Para: r-help-es@r-project.org<mailto:r-help-es@r-project.org> Asunto: [R-es] colinearidad Hola quería preguntaros acerca de un problema que se me ha planteado. Normalmente he realizado estudios con diseños factoriales, pero en este caso, por distintos motivos, quería hacer un estudio de regresión, En la tabla que pego se observa (a ojo incluso) cómo varias variables correlacionan fuertemente (principalmente el problema está en las variables frq, basefq y cumfrq), introduciendo en los análisis colinearidad. Estudios de otros colegas en este sentido suelen hablar de un procedimiento que en inglés llaman "partial out" para eliminar la colinearidad y que consiste en obtener de las variables que correlacionan fuertemente otros valores que, mientras que correlacioonan muy fuertemente con los valores originales, sin embargo pasan a correlacionar muy poco con los otros con los que antes correlacionaban. De esta manera disminuye la colinearidad aunque los nuevos valores son fieles a los originales. He leído bastantes documentos sobre R, alguno de los cuales trata sobre la colinearidad, pero no observo pistas que me ayuden en este problema tan práctico. Quizá alguno de vosotros pueda ayudarme. Pego la tabla por si os guiara en algo. Gracias y un saludo -- Pedro Concejero Telefónica I+D <http://www.tid.es/> User Modelling - Analytic Models E-mail: pedro.concejero@tid.es<mailto:pedro.concejero@tid.es> ________________________________ Este mensaje se dirige exclusivamente a su destinatario. Puede consultar nuestra política de envío y recepción de correo electrónico en el enlace situado más abajo. This message is intended exclusively for its addressee. We only send and receive email on the basis of the terms set out at. http://www.tid.es/ES/PAGINAS/disclaimer.aspx [[alternative HTML version deleted]]