Hola a todos, en estos momentos me encuentro inmerso en laresolución del siguiente problema. Resulta que dispongo de una variable categóricadenominada Severity y que consta de tres categorías (low, medium, high). Además,tengo otra variable que se denomina ZX y que puede tomar cualquier valorcomprendido entre 0 y 10. Quiero determinar los dos puntos de corte óptimos demanera que me dividan a la variable ZX en tres categorías (llamadas tambiénlow, medium y high) y que exista el máximo nivel de acuerdo entre las variablesZX y Severity. Por acuerdo me refiero a que el porcentaje de casos (filas) queen ambas variables caiga en la misma categoría sea el máximo posible.Dado que no se me ocurría cómo resolverlo de formasistemática, he hecho un pequeño código en R que fija dos puntos de cortealeatorios y calculo la tasa de acuerdo. A base de repetirlo 500.000 veces, mehe hecho una idea de hasta qué nivel de concordancia puedo llegar pero buscabauna forma más sistemática. En el caso de un único punto de corte, sé queexisten métodos y librerías en R como OptimalCutPoints que permitenhacerlo.Debajo os pongo un ejemplo de los datos que estoy manejandopara que os hagáis mejor una idea de su aspecto.ZX Severity 2.818181818 high2.084242424 high5.326666667 medium4.758484848 low4.795454545 high3.367878788 high5.734848485 high3.417575758 medium3.16000 medium4.307272727 lowCualquier sugerencia es bienvenida. Si mi código le puedeayudar a alguien, estaré encantado en pasárselo. [[alternative HTML version deleted]]
Buenas tardes Fernando, No entiendo muy bien los detalles de tu mensaje (no hay espacios y es dificil leerlo), pero te sugiero que le des una mirada a http://biostat.mc.vanderbilt.edu/wiki/Main/CatContinuous antes de proceder. Saludos cordiales, Jorge.- 2016-01-26 14:04 GMT-05:00 Fernando Sanchez <fernandsanche en yahoo.es>:> Hola a todos, en estos momentos me encuentro inmerso en laresolución del > siguiente problema. Resulta que dispongo de una variable > categóricadenominada Severity y que consta de tres categorías (low, medium, > high). Además,tengo otra variable que se denomina ZX y que puede tomar > cualquier valorcomprendido entre 0 y 10. Quiero determinar los dos puntos > de corte óptimos demanera que me dividan a la variable ZX en tres > categorías (llamadas tambiénlow, medium y high) y que exista el máximo > nivel de acuerdo entre las variablesZX y Severity. Por acuerdo me refiero a > que el porcentaje de casos (filas) queen ambas variables caiga en la misma > categoría sea el máximo posible.Dado que no se me ocurría cómo resolverlo > de formasistemática, he hecho un pequeño código en R que fija dos puntos de > cortealeatorios y calculo la tasa de acuerdo. A base de repetirlo 500.000 > veces, mehe hecho una idea de hasta qué nivel de concordancia puedo llegar > pero buscabauna forma más sistemática. En el caso de un único punto de > corte, sé queexisten métodos y librerías en R como OptimalCutPoints que > permitenhacerlo.Debajo os pongo un ejemplo de los datos que estoy > manejandopara que os hagáis mejor una idea de su > aspecto.ZX Severity 2.818181818 high2.084242424 high5.326666667 medium4.758484848 low4.795454545 high3.367878788 high5.734848485 high3.417575758 medium3.16000 > medium4.307272727 lowCualquier sugerencia es bienvenida. Si mi > código le puedeayudar a alguien, estaré encantado en pasárselo. > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
Carlos J. Gil Bellosta
2016-Jan-26 20:04 UTC
[R-es] Determinación del punto de corte óptimo
Hola, ¿qué tal? Yo haría un árbol para predecir Severity en términos de XY. Luego me quedaría con los dos primeros cortes (para crear tres grupos). Los cortes serían óptimos en el sentido en que optimice el árbol. Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com El día 26 de enero de 2016, 20:12, Jorge I Velez <jorgeivanvelez en gmail.com> escribió:> Buenas tardes Fernando, > > No entiendo muy bien los detalles de tu mensaje (no hay espacios y es > dificil leerlo), pero te sugiero que le des una mirada a > http://biostat.mc.vanderbilt.edu/wiki/Main/CatContinuous antes de proceder. > > Saludos cordiales, > Jorge.- > > > 2016-01-26 14:04 GMT-05:00 Fernando Sanchez <fernandsanche en yahoo.es>: > >> Hola a todos, en estos momentos me encuentro inmerso en laresolución del >> siguiente problema. Resulta que dispongo de una variable >> categóricadenominada Severity y que consta de tres categorías (low, medium, >> high). Además,tengo otra variable que se denomina ZX y que puede tomar >> cualquier valorcomprendido entre 0 y 10. Quiero determinar los dos puntos >> de corte óptimos demanera que me dividan a la variable ZX en tres >> categorías (llamadas tambiénlow, medium y high) y que exista el máximo >> nivel de acuerdo entre las variablesZX y Severity. Por acuerdo me refiero a >> que el porcentaje de casos (filas) queen ambas variables caiga en la misma >> categoría sea el máximo posible.Dado que no se me ocurría cómo resolverlo >> de formasistemática, he hecho un pequeño código en R que fija dos puntos de >> cortealeatorios y calculo la tasa de acuerdo. A base de repetirlo 500.000 >> veces, mehe hecho una idea de hasta qué nivel de concordancia puedo llegar >> pero buscabauna forma más sistemática. En el caso de un único punto de >> corte, sé queexisten métodos y librerías en R como OptimalCutPoints que >> permitenhacerlo.Debajo os pongo un ejemplo de los datos que estoy >> manejandopara que os hagáis mejor una idea de su >> aspecto.ZX Severity 2.818181818 high2.084242424 high5.326666667 medium4.758484848 low4.795454545 high3.367878788 high5.734848485 high3.417575758 medium3.16000 >> medium4.307272727 lowCualquier sugerencia es bienvenida. Si mi >> código le puedeayudar a alguien, estaré encantado en pasárselo. >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es