Víctor Rodríguez Galiano
2010-Mar-18 12:57 UTC
[R-es] classificacion con support vector machines en R
Hola a todos,
He hecho unas cuantas pruebas y dividiendo cada archivo en varias partes
funciona. Es algo laborioso pero ...
Una vez qeu consigo esto me encuentro con otro PROBLEMA. Resulta que el archivo
de salida clasificado que obtengo despúes de aplicar el modelo a nuevos ejemplos
solo consta de una clase. Es decir todos los ejemplos han sido clasificados con
la misma clase (y tengo 14). Sin embargo cuando aplico el modelo entrenado al
conjunto de validación que usé sale perfectamente. Si utilizo radomForest para
clasificar los nuevos ejemplos también sale perfectamente.
El modelo de SVM que utilizo es el siguiente:
Parameters:
SVM-Type: C-classification
SVM-Kernel: radial
cost: 6.8
gamma: 0.08
Number of Support Vectors: 673
No se si es un fallo al utilizar la funcion svm... o que el modelo está tan
sobreentrenado que no es capaz de clasificar los nuevos ejemplos....
¿Alguien tiene experiencia con esto?
Saludos
Víctor
_________________________________________________________________
[[elided Hotmail spam]]
[[alternative HTML version deleted]]
Víctor Rodríguez Galiano
2010-Mar-18 13:30 UTC
[R-es] classificacion con support vector machines en R
Hola a todos,
He hecho unas cuantas pruebas y dividiendo cada archivo en varias partes
funciona. Es algo laborioso pero si no hay otra opción...
Una vez qeu consigo esto y pruebo con uno de los archivos que he dividido me
encuentro con otro PROBLEMA. Resulta que el archivo de salida clasificado que
obtengo despúes de aplicar el modelo a nuevos ejemplos solo consta de una clase.
Es decir todos los ejemplos han sido clasificados con la misma clase (y tengo
14). Sin embargo cuando aplico el modelo entrenado al conjunto de validación que
usé para evaluar el modelo sale perfectamente. Si utilizo radomForest para
clasificar los nuevos ejemplos también sale perfectamente. Es decir el problema
no son los datos, estaría en svm
El modelo de SVM optimo que obtengo al "tunear" los parámetros de cost
y gamma es el siguiente:
Parameters:
SVM-Type: C-classification
SVM-Kernel: radial
cost: 6.8
gamma: 0.08
Number of Support Vectors: 673
Se me ocurren dos cosas:
1. Hay algo hago mal al aplicar svm para predecir los nuevos ejemplos
2.El modelo está tan sobreentrenado que no es capaz de clasificar los nuevos
ejemplos....
En la línea de esta última posibilidad he probado a fijar cost y gamma a 1 y
también me sale lo mismo
¿Alguien tiene experiencia con esto?
Saludos
Víctor
¿Quieres saber qué móvil eres? ¡Descúbrelo aquí!
_________________________________________________________________
[[elided Hotmail spam]]
[[alternative HTML version deleted]]