Fulgencio Cánovas García
2010-Dec-10 10:22 UTC
[R-es] superficies de solape en funciones de densidad de probabilidad
Hola a todos. Mi pregunta es la siguiente, ¿conocéis algún paquete o función que, de forma analítica, calcule la superficie de solape de dos funciones de densidad de probabilidad para dos modelos de distribución de probabilidad conocidos?. Los modelos serían los más habituales en estadística: normal, uniforme, exponencial, logística, beta, lognormal y gamma. Gracias de antemano. Fulgencio Cánovas INUAMA (Universidad de Murcia)
Olivier Nuñez
2010-Dec-10 10:32 UTC
[R-es] superficies de solape en funciones de densidad de probabilidad
Perdona mi ignorancia, pero ¿a qué te refieres? a intervalos de confianza? Da un ejemplo y tal vez te podremos ayudar. Un saludo. Olivier -- ____________________________________ Olivier G. Nuñez Email: onunez@iberstat.es Tel : +34 663 03 69 09 Web: http://www.iberstat.es ____________________________________ El 10/12/2010, a las 11:22, Fulgencio Cánovas García escribió:> superficie de solape de dos funciones de densidad de probabilidad[[alternative HTML version deleted]]
Fulgencio Cánovas García
2010-Dec-10 11:09 UTC
[R-es] superficies de solape en funciones de densidad de probabilidad
No, Olivier, perdona tú mi falta de concreción, la pregunta ha sido demasiado abstracta. Mi objetivo es calcular una medida de separabilidad, que creo se puede llamar paramétrica, entre dos clases para la misma variable. Pero claro, lo tengo que hacer para un número muy elevado de combinaciones de clases y variables. Lo importante es que siempre comparo dos clases y una variable. En un paso anterior he determinado el modelo de distribución teórico de probabilidad que siguen mis datos (para esto me ha servido mucho el histórico de correros de la lista). En un principio no se puede asumir que para la misma variable las dos clases sigan la misma distribución, pero podría ser que sí. Los parámetros de las dos distribuciones están estimados por máxima verosimilitud. Si pinto las dos funciones de densidad de probabilidad, pienso que puedo utilizar la superficie de solape (o de intersección) de las dos curvas como medida de separabilidad, teniendo un máximo de superfice de 1 (misma distribución, iguales parámetros, separabilidad nula) y un mínimo de superfice de 0 (separabilidad total). Os adjunto un pdf en el que se ve esto de forma gráfica. Es un ejemplo para dos distribuciones normales, pero como os digo, en mi caso ni tienen porque ser normales ni tiene que ser el mismo modelo teórico. Además creo que los gráficos tienen el error de las superficies bajo las curvas no son iguales. A parte de esto pienso que os podéis hacer una idea de mi objetivo. Me gustaría que el método fuese analítico, creo que de forma numérica puedo resolverlo, aunque, claro está, siempre se aceptan sugerencias. Saludos Fulgencio Cánovas INUAMA (Universidad de Murcia) El 10/12/2010 11:32, Olivier Nuñez escribió:> Perdona mi ignorancia, pero ¿a qué te refieres? a intervalos de > confianza? > Da un ejemplo y tal vez te podremos ayudar. > Un saludo. Olivier > -- > ____________________________________ > > Olivier G. Nuñez > Email: onunez en iberstat.es <mailto:onunez en iberstat.es> > Tel : +34 663 03 69 09 > Web: http://www.iberstat.es > > ____________________________________ > > > > > El 10/12/2010, a las 11:22, Fulgencio Cánovas García escribió: > >> superficie de solape de dos funciones de densidad de probabilidad >> >------------ próxima parte ------------ Se ha borrado un adjunto en formato HTML... URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20101210/b7404a17/attachment-0001.html> ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: ejemplo_separabilidad.pdf Type: application/pdf Size: 23110 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20101210/b7404a17/attachment-0001.pdf>
Olivier Nuñez
2010-Dec-10 11:59 UTC
[R-es] superficies de solape en funciones de densidad de probabilidad
Me parece que tu problema se puede ver como el calculo de la intersección entre dos intervalos de predicción de variables con distribuciones (en principio) distintas. Si es así, una vez ajustado el modelo, la función predict() con la opción interval="prediction" debería serte útil. El modelo puede ser lineal, lineal generalizado, no lineal, etc.... (ver ayuda ?predict). Para un calculo analítico (o formal) de esta intersección, me temo que R no sea (en principio) el lenguaje adecuado. Como alternativa, te sugiero el papel y el lápiz o el uso de Sage : http://www.sagemath.org Un saludo. Olivier -- ____________________________________ Olivier G. Nuñez Email: onunez en iberstat.es Tel : +34 663 03 69 09 Web: http://www.iberstat.es ____________________________________ El 10/12/2010, a las 12:09, Fulgencio Cánovas García escribió:> No, Olivier, perdona tú mi falta de concreción, la pregunta ha sido > demasiado abstracta. > Mi objetivo es calcular una medida de separabilidad, que creo se > puede llamar paramétrica, entre dos clases para la misma variable. > Pero claro, lo tengo que hacer para un número muy elevado de > combinaciones de clases y variables. Lo importante es que siempre > comparo dos clases y una variable. En un paso anterior he > determinado el modelo de distribución teórico de probabilidad que > siguen mis datos (para esto me ha servido mucho el histórico de > correros de la lista). En un principio no se puede asumir que para > la misma variable las dos clases sigan la misma distribución, pero > podría ser que sí. Los parámetros de las dos distribuciones están > estimados por máxima verosimilitud. Si pinto las dos funciones de > densidad de probabilidad, pienso que puedo utilizar la superficie > de solape (o de intersección) de las dos curvas como medida de > separabilidad, teniendo un máximo de superfice de 1 (misma > distribución, iguales parámetros, separabilidad nula) y un mínimo > de superfice de 0 (separabilidad total). > > Os adjunto un pdf en el que se ve esto de forma gráfica. Es un > ejemplo para dos distribuciones normales, pero como os digo, en mi > caso ni tienen porque ser normales ni tiene que ser el mismo modelo > teórico. Además creo que los gráficos tienen el error de las > superficies bajo las curvas no son iguales. A parte de esto pienso > que os podéis hacer una idea de mi objetivo. > > Me gustaría que el método fuese analítico, creo que de forma > numérica puedo resolverlo, aunque, claro está, siempre se aceptan > sugerencias. > > Saludos > Fulgencio Cánovas > INUAMA (Universidad de Murcia) > > El 10/12/2010 11:32, Olivier Nuñez escribió: >> >> Perdona mi ignorancia, pero ¿a qué te refieres? a intervalos de >> confianza? >> Da un ejemplo y tal vez te podremos ayudar. >> Un saludo. Olivier >> -- >> ____________________________________ >> >> Olivier G. Nuñez >> Email: onunez en iberstat.es >> Tel : +34 663 03 69 09 >> Web: http://www.iberstat.es >> >> ____________________________________ >> >> >> >> >> El 10/12/2010, a las 11:22, Fulgencio Cánovas García escribió: >> >>> superficie de solape de dos funciones de densidad de probabilidad >> > <ejemplo_separabilidad.pdf> > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es
Gregorio R. Serrano
2010-Dec-10 12:18 UTC
[R-es] superficies de solape en funciones de densidad de probabilidad
Buenas. Analíticamente yo tampoco veo manera, pero numéricamente puede integrar para calcular el área. La función sería el mínimo de las dos densidades en cada punto en el que estén definidas ambas. Algo del siguiente estilo: # Otra densidad, para el ejemplo dnorm1 <- function(x) dnorm(x, mean=-1.5, sd=0.5) # "Separabilidad" de la N(0,1) y la N(-1.5, 0.5^2) intersect.area <- function(x) apply(cbind(dnorm(x), dnorm1(x)), 1, min) integrate(intersect.area, -3, 3) No sé si será de ayuda ... Un saludo Gregorio R. Serrano El 10 de diciembre de 2010 12:59, Olivier Nuñez <onunez@iberstat.es>escribió:> Me parece que tu problema se puede ver como el calculo de la intersección > entre dos intervalos de predicción de variables con distribuciones (en > principio) distintas. > Si es así, una vez ajustado el modelo, la función predict() con la opción > interval="prediction" debería serte útil. > El modelo puede ser lineal, lineal generalizado, no lineal, etc.... (ver > ayuda ?predict). > Para un calculo analítico (o formal) de esta intersección, me temo que R no > sea (en principio) el lenguaje adecuado. > Como alternativa, te sugiero el papel y el lápiz o el uso de Sage : > http://www.sagemath.org > > > Un saludo. Olivier > > -- ____________________________________ > > Olivier G. Nuñez > Email: onunez@iberstat.es > Tel : +34 663 03 69 09 > Web: http://www.iberstat.es > > ____________________________________ > > > > > El 10/12/2010, a las 12:09, Fulgencio Cánovas García escribió: > > No, Olivier, perdona tú mi falta de concreción, la pregunta ha sido >> demasiado abstracta. >> Mi objetivo es calcular una medida de separabilidad, que creo se puede >> llamar paramétrica, entre dos clases para la misma variable. Pero claro, lo >> tengo que hacer para un número muy elevado de combinaciones de clases y >> variables. Lo importante es que siempre comparo dos clases y una variable. >> En un paso anterior he determinado el modelo de distribución teórico de >> probabilidad que siguen mis datos (para esto me ha servido mucho el >> histórico de correros de la lista). En un principio no se puede asumir que >> para la misma variable las dos clases sigan la misma distribución, pero >> podría ser que sí. Los parámetros de las dos distribuciones están estimados >> por máxima verosimilitud. Si pinto las dos funciones de densidad de >> probabilidad, pienso que puedo utilizar la superficie de solape (o de >> intersección) de las dos curvas como medida de separabilidad, teniendo un >> máximo de superfice de 1 (misma distribución, iguales parámetros, >> separabilidad nula) y un mínimode superfice de 0 (separabilidad total). >> >> >> Os adjunto un pdf en el que se ve esto de forma gráfica. Es un ejemplo >> para dos distribuciones normales, pero como os digo, en mi caso ni tienen >> porque ser normales ni tiene que ser el mismo modelo teórico. Además creo >> que los gráficos tienen el error de las superficies bajo las curvas no son >> iguales. A parte de esto pienso que os podéis hacer una idea de mi objetivo. >> >> Me gustaría que el método fuese analítico, creo que de forma numérica >> puedo resolverlo, aunque, claro está, siempre se aceptan sugerencias. >> >> Saludos >> Fulgencio Cánovas >> INUAMA (Universidad de Murcia) >> >> El 10/12/2010 11:32, Olivier Nuñez escribió: >> >>> >>> Perdona mi ignorancia, pero ¿a qué te refieres? a intervalos de >>> confianza? >>> Da un ejemplo y tal vez te podremos ayudar. >>> Un saludo. Olivier >>> -- ____________________________________ >>> >>> Olivier G. Nuñez >>> Email: onunez@iberstat.es >>> Tel : +34 663 03 69 09 >>> Web: http://www.iberstat.es >>> >>> ____________________________________ >>> >>> >>> >>> >>> El 10/12/2010, a las 11:22, Fulgencio Cánovas García escribió: >>> >>> superficie de solape de dos funciones de densidad de probabilidad >>>> >>> >>> <ejemplo_separabilidad.pdf> >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es@r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- Dr. Gregorio R. Serrano Dpto. Economía Cuantitativa (UCM) Voz:+34 91394 2361 Fax:+34 91394 2591 http://www.grserrano.es [[alternative HTML version deleted]]
Oscar Perpiñan Lamigueiro
2010-Dec-10 12:59 UTC
[R-es] superficies de solape en funciones de densidad de probabilidad
No dan soluciones analíticas, y tampoco tengo claro que resuelvan tu problema, pero al menos como aproximación quizás te sean útiles los paquetes mclust (http://cran.r-project.org/web/packages/mclust/) y kernlab (http://cran.r-project.org/web/packages/kernlab). Saludos. Oscar. El Fri, 10 Dec 2010 12:09:47 +0100 Fulgencio Cánovas García <fulgencio.canovas en um.es> escribió:> No, Olivier, perdona tú mi falta de concreción, la pregunta ha sido > demasiado abstracta. > Mi objetivo es calcular una medida de separabilidad, que creo se > puede llamar paramétrica, entre dos clases para la misma variable. > Pero claro, lo tengo que hacer para un número muy elevado de > combinaciones de clases y variables. Lo importante es que siempre > comparo dos clases y una variable. En un paso anterior he determinado > el modelo de distribución teórico de probabilidad que siguen mis > datos (para esto me ha servido mucho el histórico de correros de la > lista). En un principio no se puede asumir que para la misma variable > las dos clases sigan la misma distribución, pero podría ser que sí. > Los parámetros de las dos distribuciones están estimados por máxima > verosimilitud. Si pinto las dos funciones de densidad de > probabilidad, pienso que puedo utilizar la superficie de solape (o de > intersección) de las dos curvas como medida de separabilidad, > teniendo un máximo de superfice de 1 (misma distribución, iguales > parámetros, separabilidad nula) y un mínimo de superfice de 0 > (separabilidad total). > > Os adjunto un pdf en el que se ve esto de forma gráfica. Es un > ejemplo para dos distribuciones normales, pero como os digo, en mi > caso ni tienen porque ser normales ni tiene que ser el mismo modelo > teórico. Además creo que los gráficos tienen el error de las > superficies bajo las curvas no son iguales. A parte de esto pienso > que os podéis hacer una idea de mi objetivo. > > Me gustaría que el método fuese analítico, creo que de forma numérica > puedo resolverlo, aunque, claro está, siempre se aceptan sugerencias. > > Saludos > Fulgencio Cánovas > INUAMA (Universidad de Murcia) > > El 10/12/2010 11:32, Olivier Nuñez escribió: > > Perdona mi ignorancia, pero ¿a qué te refieres? a intervalos de > > confianza? > > Da un ejemplo y tal vez te podremos ayudar. > > Un saludo. Olivier > > -- > > ____________________________________ > > > > Olivier G. Nuñez > > Email: onunez en iberstat.es <mailto:onunez en iberstat.es> > > Tel : +34 663 03 69 09 > > Web: http://www.iberstat.es > > > > ____________________________________ > > > > > > > > > > El 10/12/2010, a las 11:22, Fulgencio Cánovas García escribió: > > > >> superficie de solape de dos funciones de densidad de probabilidad > >> > >------------------- Oscar Perpiñán Lamigueiro Profesor Ayudante Doctor Dpto. Ingeniería Eléctrica EUITI-UPM
Fulgencio Cánovas García
2010-Dec-11 14:13 UTC
[R-es] superficies de solape en funciones de densidad de probabilidad
Muchas gracias, es lo que necesitaba. Saludos Fulgencio Cánovas INUAMA (Universidad de Murcia) El 10/12/2010 13:18, Gregorio R. Serrano escribió:> Buenas. > > Analíticamente yo tampoco veo manera, pero numéricamente puede > integrar para calcular el área. La función sería el mínimo de las dos > densidades en cada punto en el que estén definidas ambas. Algo del > siguiente estilo: > > # Otra densidad, para el ejemplo > dnorm1 <- function(x) dnorm(x, mean=-1.5, sd=0.5) > # "Separabilidad" de la N(0,1) y la N(-1.5, 0.5^2) > intersect.area <- function(x) apply(cbind(dnorm(x), dnorm1(x)), 1, min) > integrate(intersect.area, -3, 3) > > No sé si será de ayuda ... > > Un saludo > Gregorio R. Serrano > > > El 10 de diciembre de 2010 12:59, Olivier Nuñez <onunez@iberstat.es > <mailto:onunez@iberstat.es>> escribió: > > Me parece que tu problema se puede ver como el calculo de la > intersección entre dos intervalos de predicción de variables con > distribuciones (en principio) distintas. > Si es así, una vez ajustado el modelo, la función predict() con > la opción interval="prediction" debería serte útil. > El modelo puede ser lineal, lineal generalizado, no lineal, > etc.... (ver ayuda ?predict). > Para un calculo analítico (o formal) de esta intersección, me temo > que R no sea (en principio) el lenguaje adecuado. > Como alternativa, te sugiero el papel y el lápiz o el uso de Sage > : http://www.sagemath.org > > > Un saludo. Olivier > > -- ____________________________________ > > Olivier G. Nuñez > Email: onunez@iberstat.es <mailto:onunez@iberstat.es> > Tel : +34 663 03 69 09 > Web: http://www.iberstat.es > > ____________________________________ > > > > > El 10/12/2010, a las 12:09, Fulgencio Cánovas García escribió: > > No, Olivier, perdona tú mi falta de concreción, la pregunta ha > sido demasiado abstracta. > Mi objetivo es calcular una medida de separabilidad, que creo > se puede llamar paramétrica, entre dos clases para la misma > variable. Pero claro, lo tengo que hacer para un número muy > elevado de combinaciones de clases y variables. Lo importante > es que siempre comparo dos clases y una variable. En un paso > anterior he determinado el modelo de distribución teórico de > probabilidad que siguen mis datos (para esto me ha servido > mucho el histórico de correros de la lista). En un principio > no se puede asumir que para la misma variable las dos clases > sigan la misma distribución, pero podría ser que sí. Los > parámetros de las dos distribuciones están estimados por > máxima verosimilitud. Si pinto las dos funciones de densidad > de probabilidad, pienso que puedo utilizar la superficie de > solape (o de intersección) de las dos curvas como medida de > separabilidad, teniendo un máximo de superfice de 1 (misma > distribución, iguales parámetros, separabilidad nula) y un > mínimode superfice de 0 (separabilidad total). > > > Os adjunto un pdf en el que se ve esto de forma gráfica. Es un > ejemplo para dos distribuciones normales, pero como os digo, > en mi caso ni tienen porque ser normales ni tiene que ser el > mismo modelo teórico. Además creo que los gráficos tienen el > error de las superficies bajo las curvas no son iguales. A > parte de esto pienso que os podéis hacer una idea de mi objetivo. > > Me gustaría que el método fuese analítico, creo que de forma > numérica puedo resolverlo, aunque, claro está, siempre se > aceptan sugerencias. > > Saludos > Fulgencio Cánovas > INUAMA (Universidad de Murcia) > > El 10/12/2010 11:32, Olivier Nuñez escribió: > > > Perdona mi ignorancia, pero ¿a qué te refieres? a > intervalos de confianza? > Da un ejemplo y tal vez te podremos ayudar. > Un saludo. Olivier > -- ____________________________________ > > Olivier G. Nuñez > Email: onunez@iberstat.es <mailto:onunez@iberstat.es> > Tel : +34 663 03 69 09 > Web: http://www.iberstat.es > > ____________________________________ > > > > > El 10/12/2010, a las 11:22, Fulgencio Cánovas García escribió: > > superficie de solape de dos funciones de densidad de > probabilidad > > > <ejemplo_separabilidad.pdf> > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org <mailto:R-help-es@r-project.org> > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org <mailto:R-help-es@r-project.org> > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > > > -- > Dr. Gregorio R. Serrano > Dpto. Economía Cuantitativa (UCM) > Voz:+34 91394 2361 > Fax:+34 91394 2591 > http://www.grserrano.es[[alternative HTML version deleted]]