Estimados usarios de R: Tengo una variable que representa el mes o los meses que se inicia un curso de la cual quiero obtener algunas medidas de resumen. El problema es que por cada ocurrencia puede aparecer un mes o varios pero como fue contestado directamente por los encuestados a veces ponen el (los) mes(es) en mayúsculas, minúsculas, separados por una coma, un punto, un guión o un espacio, etc. Por ejemplo: FEBRERO Y AGOSTO julio octubre noviembre ENERO / FEBRERO mayo, diciembre Tendria que crear una nueva variable que tenga todas las combinaciones posibles de a dos meses y también por mes. ¿Se les ocurre alguna idea? Saludos, Sebastián. [[alternative HTML version deleted]]
Hola, Una posible solución podría ser esta: - Modificar todos los meses para que o bien estuvieran en mayúscula o en minúscula. Funciones tolower(), toupper() del paquete base. - Generar todas las "combinaciones" posibles dos a dos de los meses del año. Utilizar paquete "combinat", función "combn". Esta función también está en el paquete "utils". Saludos, Carlos Ortega www.qualityexcellence.es El 21 de febrero de 2013 17:39, Sebastian Kruk <residuo.solow@gmail.com>escribió:> Estimados usarios de R: > > Tengo una variable que representa el mes o los meses que se inicia un curso > de la cual quiero obtener algunas medidas de resumen. > > El problema es que por cada ocurrencia puede aparecer un mes o varios pero > como fue contestado directamente por los encuestados a veces ponen el (los) > mes(es) en mayúsculas, minúsculas, separados por una coma, un punto, un > guión o un espacio, etc. > > Por ejemplo: > > FEBRERO Y AGOSTO > julio octubre noviembre > ENERO / FEBRERO > mayo, diciembre > > Tendria que crear una nueva variable que tenga todas las combinaciones > posibles de a dos meses y también por mes. > > ¿Se les ocurre alguna idea? > > Saludos, > > Sebastián. > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Yo para dar consistencia a los datos en estos casos utilizo Google Refine. La función clúster dentro de text facet es una maravilla ^_^ Este vídeo explica como http://www.youtube.com/watch?feature=player_embedded&v=B70J_H_zAWM#at=55 Puedes descargarlo en http://code.google.com/p/google-refine/wiki/Downloads?tm=2 Una vez consolidada la exportas al formato que mejor te vaya para R *Carlos Guadián Orta* * * http://twitter.com/carlosguadian http://www.k-government.com http://www.autoritas.es http://www.ogov.eu El 21 de febrero de 2013 17:49, Carlos Ortega <cof@qualityexcellence.es>escribió:> Hola, > > Una posible solución podría ser esta: > > - Modificar todos los meses para que o bien estuvieran en mayúscula o en > minúscula. Funciones tolower(), toupper() del paquete base. > - Generar todas las "combinaciones" posibles dos a dos de los meses del > año. Utilizar paquete "combinat", función "combn". Esta función también > está en el paquete "utils". > > > > Saludos, > Carlos Ortega > www.qualityexcellence.es > > > El 21 de febrero de 2013 17:39, Sebastian Kruk > <residuo.solow@gmail.com>escribió: > > > Estimados usarios de R: > > > > Tengo una variable que representa el mes o los meses que se inicia un > curso > > de la cual quiero obtener algunas medidas de resumen. > > > > El problema es que por cada ocurrencia puede aparecer un mes o varios > pero > > como fue contestado directamente por los encuestados a veces ponen el > (los) > > mes(es) en mayúsculas, minúsculas, separados por una coma, un punto, un > > guión o un espacio, etc. > > > > Por ejemplo: > > > > FEBRERO Y AGOSTO > > julio octubre noviembre > > ENERO / FEBRERO > > mayo, diciembre > > > > Tendria que crear una nueva variable que tenga todas las combinaciones > > posibles de a dos meses y también por mes. > > > > ¿Se les ocurre alguna idea? > > > > Saludos, > > > > Sebastián. > > > > [[alternative HTML version deleted]] > > > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es@r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > > > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >[[alternative HTML version deleted]]
I have done a plot which represents itemsets as vertices and rules as directed edges between itemsets with this lines:> plot(r1, method = "graph", measure = "confidence", shading = "lift")When I try to do a plot which uses items and rules as two types of vertices and edges indicate which items occur in which rule, I use this lines:>plot(r1, method="graph",control=list(type="items"))Or>plot(r1, method="graph",control=list(type="itemsets"))But R shows this error message: “Error in matrix(mean(range), ncol = ncol(x), nrow = nrow(x), dimnames dimnames(x)) : non-numeric matrix extent” These are the items in r1: > inspect(items(r1))> items> 1 {X, Y}> 2 {Z,W}> 3 {X,T}> 4 {R,U,W}> 5 {R, U, W}> I still don’t understand why it’s a matrix issue.Muchas gracias. Saludos, Rodrigo Bastías C. Estadístico PUC, Chile http://www.mat.puc.cl/articulo94.html [[alternative HTML version deleted]]