Manuel Mendoza
2021-Feb-24 17:59 UTC
[R-es] Dos cuestiones relacionadas con rpart y printcp
Muy buenas, tengo dos cuestiones relacionadas con rpart para regresión y printcp. Entreno el algoritmo con fitrp <- rpart(nspp ~ ., data=data, cp=0) y obtengo el error relativo, xerror, del mejor árbol con min(fitrp$cptable[,"xerror"]). Hasta ahí muy fácil. 1. Para calcular mse, multiplico ese valor de xerror por el error del nodo raíz. ¿es correcto? 2. Necesito el % de varianza (R2) de la variable objetivo explicada por el mejor árbol, pero no está en ninguno de los objetos incluídos fitrp. En la documentación encontré que rsq.rpart(fitrp) te representa directamente la evolución de R2 tal y como se van añadiendo nuevas divisiones (también te representa la evolución de xerror, pero esa ya la tenía con plotcp(fitrp)). Mi pregunta es: ¿cómo puedo obtener esa secuencia de valores de R2, cuyo máximo sería el R2 que busco? Gracias, una vez más, Manuel [[alternative HTML version deleted]]
Manuel Mendoza
2021-Feb-25 20:00 UTC
[R-es] Fwd: Dos cuestiones relacionadas con rpart y printcp
---------- Forwarded message --------- De: Manuel Mendoza <mmendoza en fulbrightmail.org> Date: mié, 24 feb 2021 a las 18:59 Subject: Dos cuestiones relacionadas con rpart y printcp To: Lista R <r-help-es en r-project.org> Muy buenas, tengo dos cuestiones relacionadas con rpart para regresión y printcp. Entreno el algoritmo con fitrp <- rpart(nspp ~ ., data=data, cp=0) y obtengo el error relativo, xerror, del mejor árbol con min(fitrp$cptable[,"xerror"]). Hasta ahí muy fácil. 1. Para calcular mse, multiplico ese valor de xerror por el error del nodo raíz. ¿es correcto? 2. Necesito el % de varianza (R2) de la variable objetivo explicada por el mejor árbol, pero no está en ninguno de los objetos incluídos fitrp. En la documentación encontré que rsq.rpart(fitrp) te representa directamente la evolución de R2 tal y como se van añadiendo nuevas divisiones (también te representa la evolución de xerror, pero esa ya la tenía con plotcp(fitrp)). Mi pregunta es: ¿cómo puedo obtener esa secuencia de valores de R2, cuyo máximo sería el R2 que busco? Gracias, una vez más, Manuel [[alternative HTML version deleted]]