Estimados les escribo para consultar por una duda que tengo utilizo la siguiente función: lda(esp~.,Iris) para hacer un análisis de discriminante con el data set Iris. Mi pregunta es la siguiente ¿Porqué la función de discriminación no incluye a la constante del término indempendiente? Desde ya muchas gracias por todo. Mauro Colombini [[alternative HTML version deleted]]
Hola, ¿qué tal? La función lda pertenece al paquete MASS. El paquete MASS está asociado al libro Modern Applied Statistics with S-Plus. Es la referencia primera de toda función del paquete MASS. En resumen, lda(esp~.,Iris)$scaling es la matriz de una transformación lineal de R^4 en R^2 (2 es el número de clases menos uno) tal que la separación entre las clases en el nuevo espacio es "máxima". Para obtener los hiperplanos separadores (que son tres, no dos) en el espacio original tienes que resolver un pequeño problema de álgebra lineal. Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com Mauro Alexis wrote:> Estimados les escribo para consultar por una duda que tengo utilizo la > siguiente función: lda(esp~.,Iris) para hacer un análisis de discriminante > con el data set Iris. > Mi pregunta es la siguiente ¿Porqué la función de discriminación no incluye > a la constante del término indempendiente? > Desde ya muchas gracias por todo. > Mauro Colombini > > [[alternative HTML version deleted]] > > > > ------------------------------------------------------------------------ > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es
La razon por la cual la funcion "lda()" no incluye a la constante del termino independiente es ... porque **no hay una constante del termino independiente** Como bien apunta Carlos, "lda()" resuelve el problema de discriminacion lineal clasico. Si te sentis mas comodo resolviendo un problema de clasificacion a partir de un modelo de regresion (donde si tenes la constante del termino independiente) entonces podes utilizar regresion logistica. La funcion glm( y~x, family=binomial) te resuelve el problema. Pablo ----- Original Message ----- From: "Carlos J. Gil Bellosta" <cgb en datanalytics.com> To: "Mauro Alexis" <mauroalexis en gmail.com> Cc: <r-help-es en r-project.org> Sent: Saturday, December 12, 2009 2:25 PM Subject: Re: [R-es] Analisis de discrimiante lineal Hola, ¿qué tal? La función lda pertenece al paquete MASS. El paquete MASS está asociado al libro Modern Applied Statistics with S-Plus. Es la referencia primera de toda función del paquete MASS. En resumen, lda(esp~.,Iris)$scaling es la matriz de una transformación lineal de R^4 en R^2 (2 es el número de clases menos uno) tal que la separación entre las clases en el nuevo espacio es "máxima". Para obtener los hiperplanos separadores (que son tres, no dos) en el espacio original tienes que resolver un pequeño problema de álgebra lineal. Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com Mauro Alexis wrote:> Estimados les escribo para consultar por una duda que tengo utilizo la > siguiente función: lda(esp~.,Iris) para hacer un análisis de discriminante > con el data set Iris. > Mi pregunta es la siguiente ¿Porqué la función de discriminación noincluye> a la constante del término indempendiente? > Desde ya muchas gracias por todo. > Mauro Colombini > > [[alternative HTML version deleted]] > > > > ------------------------------------------------------------------------ > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es_______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
En realidad, el Análisis Discriminate Lineal es una técnica de separación de puntos mediante hiperplanos(en R2 separa conjunto de puntos (x,y) mediante rectas a*x+b*y, nota que basta el vector normal a la recta para determiarla). De hecho, con los datos de Iris tu obtienes "dos hiperplanos" que separan "tres" clases de flores. Hay dos formas de representar linealmente las funciones discriminantes: la primera es la que se obtiene con lda(), hiperplanos separadores(hay k-1 siendo k el número de clases), básicamente se clasifican los puntos mirando a qué lado del hiperplano está un punto (signo de a*x+b*y), y la segunda: utilizando hiperplanos (en R2 rectas c*z+d*y+e) que se obtienen a partir de los hiperplanos separadores, se clasifica cada dato según cuál de las funciones discriminantes (hay k) da un valor mayor al evaluarla en el dato. Jorge. Mauro Alexis escribió:> Estimados les escribo para consultar por una duda que tengo utilizo la > siguiente función: lda(esp~.,Iris) para hacer un análisis de discriminante > con el data set Iris. > Mi pregunta es la siguiente ¿Porqué la función de discriminación no incluye > a la constante del término indempendiente? > Desde ya muchas gracias por todo. > Mauro Colombini > > [[alternative HTML version deleted]] > > > > ------------------------------------------------------------------------ > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es