Víctor Rodríguez Galiano
2010-Mar-18 12:57 UTC
[R-es] classificacion con support vector machines en R
Hola a todos, He hecho unas cuantas pruebas y dividiendo cada archivo en varias partes funciona. Es algo laborioso pero ... Una vez qeu consigo esto me encuentro con otro PROBLEMA. Resulta que el archivo de salida clasificado que obtengo despúes de aplicar el modelo a nuevos ejemplos solo consta de una clase. Es decir todos los ejemplos han sido clasificados con la misma clase (y tengo 14). Sin embargo cuando aplico el modelo entrenado al conjunto de validación que usé sale perfectamente. Si utilizo radomForest para clasificar los nuevos ejemplos también sale perfectamente. El modelo de SVM que utilizo es el siguiente: Parameters: SVM-Type: C-classification SVM-Kernel: radial cost: 6.8 gamma: 0.08 Number of Support Vectors: 673 No se si es un fallo al utilizar la funcion svm... o que el modelo está tan sobreentrenado que no es capaz de clasificar los nuevos ejemplos.... ¿Alguien tiene experiencia con esto? Saludos Víctor _________________________________________________________________ [[elided Hotmail spam]] [[alternative HTML version deleted]]
Víctor Rodríguez Galiano
2010-Mar-18 13:30 UTC
[R-es] classificacion con support vector machines en R
Hola a todos, He hecho unas cuantas pruebas y dividiendo cada archivo en varias partes funciona. Es algo laborioso pero si no hay otra opción... Una vez qeu consigo esto y pruebo con uno de los archivos que he dividido me encuentro con otro PROBLEMA. Resulta que el archivo de salida clasificado que obtengo despúes de aplicar el modelo a nuevos ejemplos solo consta de una clase. Es decir todos los ejemplos han sido clasificados con la misma clase (y tengo 14). Sin embargo cuando aplico el modelo entrenado al conjunto de validación que usé para evaluar el modelo sale perfectamente. Si utilizo radomForest para clasificar los nuevos ejemplos también sale perfectamente. Es decir el problema no son los datos, estaría en svm El modelo de SVM optimo que obtengo al "tunear" los parámetros de cost y gamma es el siguiente: Parameters: SVM-Type: C-classification SVM-Kernel: radial cost: 6.8 gamma: 0.08 Number of Support Vectors: 673 Se me ocurren dos cosas: 1. Hay algo hago mal al aplicar svm para predecir los nuevos ejemplos 2.El modelo está tan sobreentrenado que no es capaz de clasificar los nuevos ejemplos.... En la línea de esta última posibilidad he probado a fijar cost y gamma a 1 y también me sale lo mismo ¿Alguien tiene experiencia con esto? Saludos Víctor ¿Quieres saber qué móvil eres? ¡Descúbrelo aquí! _________________________________________________________________ [[elided Hotmail spam]] [[alternative HTML version deleted]]