Ricardo Alberich
2014-Jun-17 17:53 UTC
[R-es] No es un problema de tm tienes doc.corpus vacío
No es un problema de tm ni de SnowfallC ni de mcapply (por el path utilizas linux, en windows mcapply según el manual no va bien) No defines bien los objetos que pasas. Pasas doc.corpus en lugar de corpus ( o asignas a corpus en lugar de a doc.corpus) . Depura los programas cuando salga un error de objeto, como te pone en el Error que pasas . Temporalmente lo tienes arreglado en http://rpubs.com/ricardo/Temp Pero otra vez observa paso a paso los objetos y nos dirás (bueno ya lo sabrás) dónde está el error. Ricardo Alberich On 17/06/14 18:38, r-help-es-request en r-project.org wrote:> Envíe los mensajes para la lista R-help-es a > r-help-es en r-project.org > > Para subscribirse o anular su subscripción a través de la WEB > https://stat.ethz.ch/mailman/listinfo/r-help-es > > O por correo electrónico, enviando un mensaje con el texto "help" en > el asunto (subject) o en el cuerpo a: > r-help-es-request en r-project.org > > Puede contactar con el responsable de la lista escribiendo a: > r-help-es-owner en r-project.org > > Si responde a algún contenido de este mensaje, por favor, edite la > linea del asunto (subject) para que el texto sea mas especifico que: > "Re: Contents of R-help-es digest...". Además, por favor, incluya en > la respuesta sólo aquellas partes del mensaje a las que está > respondiendo. > > > Asuntos del día: > > 1. problemas con el paquete tm (Ruben Tobalina Ramirez) > > > ---------------------------------------------------------------------- > > Message: 1 > Date: Tue, 17 Jun 2014 18:37:58 +0200 > From: Ruben Tobalina Ramirez <lagrimaescrita en gmail.com> > To: Lista R <r-help-es en r-project.org> > Subject: [R-es] problemas con el paquete tm > Message-ID: > <CAKXAqm0tk9AFWcD7anRYKNDF9-KOyisu+9ZipOWQtK3MoS+t+g en mail.gmail.com> > Content-Type: text/plain; charset="utf-8" > > Hola, > > hace un tiempo que voy detrás de aprender este magnifico programa pero un > poco por miedo y otro poco por falta de tiempo nunca me animaba. He > realizado un par de cursos de introducción y, a parte de esta lista, sigo > algunos blogs sobre R. Al lio, esta introducción era mas que nada para > pedir paciencia conmigo:D > > Estoy intentando introducirme en el paquete tm para hacer análisis de > textos de canciones. Mi problema es que al intentar hacer la matriz del > corpus linguistico me da el siguiente error: > > > > > > *Error en UseMethod("meta", x) : no applicable method for 'meta' applied > to an object of class "character"Además: Mensajes de aviso perdidosIn > mclapply(unname(content(x)), termFreq, control) : all scheduled cores > encountered errors in user code* > > Os copio el script y os adjunto los datos por si acaso: > > > > > > > > > > > > > > > > > > > > > > > > > > > > > > > > *TEXTFILE = "/home/rubent/Documentos/Sociologia/Soc Musica/Black > metal/Analisis texto/Inmortal"inmortal = readLines(TEXTFILE)inmortal > readLines(TEXTFILE)length(inmortal)head(inmortal)tail(inmortal)library(tm)vec > <- VectorSource(inmortal)corpus <- > Corpus(vec)summary(corpus)inspect(corpus[1:7])corpus <- tm_map(corpus, > tolower)corpus <- tm_map(corpus, removePunctuation)corpus <- tm_map(corpus, > removeNumbers)corpus <- tm_map(corpus, removeWords, > stopwords("english"))inspect(doc.corpus[1:2])library(SnowballC)corpus <- > tm_map(corpus, stemDocument)corpus <- tm_map(corpus, > stripWhitespace)inspect(doc.corpus[1:8])TDM <- > TermDocumentMatrix(corpus)TDM* > > por adelantado, muchas gracias!!! > > ruben! > ------------ próxima parte ------------ > Se ha borrado un adjunto en formato HTML... > URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20140617/21958641/attachment.html> > ------------ próxima parte ------------ > A non-text attachment was scrubbed... > Name: Inmortal > Type: application/octet-stream > Size: 50147 bytes > Desc: no disponible > URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20140617/21958641/attachment.obj> > > ------------------------------ > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > Fin de Resumen de R-help-es, Vol 64, Envío 27 > *********************************************-- ======================================== Ricardo Alberich Martí (r.alberich en uib.es) Director del Departament de Matemàtiques i Informàtica Universitat de les Illes Balears
Ruben Tobalina Ramirez
2014-Jun-17 18:25 UTC
[R-es] No es un problema de tm tienes doc.corpus vacío
Buenas tardes Ricardo, gracias por la respuesta rápida. Pues copie tu código y me sigue dando el mismo error. Fui a mi codigo y cambie los 'doc.corpus' por 'corpus' (fue un error al limpiar el codigo) y sigue el error. No sé, he probado buscando en webs códigos similares y sigue el error:( El 17 de junio de 2014, 19:53, Ricardo Alberich <r.alberich@uib.es> escribió:> No es un problema de tm ni de SnowfallC ni de mcapply (por el path > utilizas linux, en windows mcapply según el manual no va bien) > > No defines bien los objetos que pasas. Pasas doc.corpus en lugar de > corpus ( o asignas a corpus en lugar de a doc.corpus) . > Depura los programas cuando salga un error de objeto, como te pone en el > Error que pasas . > > Temporalmente lo tienes arreglado en > > http://rpubs.com/ricardo/Temp > > Pero otra vez observa paso a paso los objetos y nos dirás (bueno ya lo > sabrás) dónde está el error. > > Ricardo Alberich > > > On 17/06/14 18:38, r-help-es-request@r-project.org wrote: > >> Envíe los mensajes para la lista R-help-es a >> r-help-es@r-project.org >> >> Para subscribirse o anular su subscripción a través de la WEB >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> >> O por correo electrónico, enviando un mensaje con el texto "help" en >> el asunto (subject) o en el cuerpo a: >> r-help-es-request@r-project.org >> >> Puede contactar con el responsable de la lista escribiendo a: >> r-help-es-owner@r-project.org >> >> Si responde a algún contenido de este mensaje, por favor, edite la >> linea del asunto (subject) para que el texto sea mas especifico que: >> "Re: Contents of R-help-es digest...". Además, por favor, incluya en >> la respuesta sólo aquellas partes del mensaje a las que está >> respondiendo. >> >> >> Asuntos del día: >> >> 1. problemas con el paquete tm (Ruben Tobalina Ramirez) >> >> >> ---------------------------------------------------------------------- >> >> Message: 1 >> Date: Tue, 17 Jun 2014 18:37:58 +0200 >> From: Ruben Tobalina Ramirez <lagrimaescrita@gmail.com> >> To: Lista R <r-help-es@r-project.org> >> Subject: [R-es] problemas con el paquete tm >> Message-ID: >> <CAKXAqm0tk9AFWcD7anRYKNDF9-KOyisu+9ZipOWQtK3MoS+t+g@mail. >> gmail.com> >> Content-Type: text/plain; charset="utf-8" >> >> Hola, >> >> hace un tiempo que voy detrás de aprender este magnifico programa pero un >> poco por miedo y otro poco por falta de tiempo nunca me animaba. He >> realizado un par de cursos de introducción y, a parte de esta lista, sigo >> algunos blogs sobre R. Al lio, esta introducción era mas que nada para >> pedir paciencia conmigo:D >> >> Estoy intentando introducirme en el paquete tm para hacer análisis de >> textos de canciones. Mi problema es que al intentar hacer la matriz del >> corpus linguistico me da el siguiente error: >> >> >> >> >> >> *Error en UseMethod("meta", x) : no applicable method for 'meta' applied >> to an object of class "character"Además: Mensajes de aviso perdidosIn >> mclapply(unname(content(x)), termFreq, control) : all scheduled cores >> encountered errors in user code* >> >> Os copio el script y os adjunto los datos por si acaso: >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> >> *TEXTFILE = "/home/rubent/Documentos/Sociologia/Soc Musica/Black >> metal/Analisis texto/Inmortal"inmortal = readLines(TEXTFILE)inmortal >> readLines(TEXTFILE)length(inmortal)head(inmortal)tail( >> inmortal)library(tm)vec >> <- VectorSource(inmortal)corpus <- >> Corpus(vec)summary(corpus)inspect(corpus[1:7])corpus <- tm_map(corpus, >> tolower)corpus <- tm_map(corpus, removePunctuation)corpus <- >> tm_map(corpus, >> removeNumbers)corpus <- tm_map(corpus, removeWords, >> stopwords("english"))inspect(doc.corpus[1:2])library(SnowballC)corpus <- >> tm_map(corpus, stemDocument)corpus <- tm_map(corpus, >> stripWhitespace)inspect(doc.corpus[1:8])TDM <- >> TermDocumentMatrix(corpus)TDM* >> >> por adelantado, muchas gracias!!! >> >> ruben! >> ------------ próxima parte ------------ >> Se ha borrado un adjunto en formato HTML... >> URL: <https://stat.ethz.ch/pipermail/r-help-es/ >> attachments/20140617/21958641/attachment.html> >> ------------ próxima parte ------------ >> A non-text attachment was scrubbed... >> Name: Inmortal >> Type: application/octet-stream >> Size: 50147 bytes >> Desc: no disponible >> URL: <https://stat.ethz.ch/pipermail/r-help-es/ >> attachments/20140617/21958641/attachment.obj> >> >> ------------------------------ >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es@r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> >> >> Fin de Resumen de R-help-es, Vol 64, Envío 27 >> ********************************************* >> > > > -- > > > ========================================> > Ricardo Alberich Martí (r.alberich@uib.es) > Director del Departament de Matemàtiques i Informàtica > Universitat de les Illes Balears > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
Isidro Hidalgo
2014-Jun-18 10:46 UTC
[R-es] No es un problema de tm tienes doc.corpus vacío
Creo que lo que quieres hacer necesita esta línea de código justo después de cargar el paquete tm: inmortal = unlist(strsplit(inmortal, " ", fixed = T)) De esta forma, trabajas con palabras, y NO con las frases enteras... Un saludo Isidro Hidalgo Arellano Observatorio Regional de Empleo Consejería de Empleo y Economía http://www.jccm.es> -----Mensaje original----- > De: r-help-es-bounces en r-project.org [mailto:r-help-es-bounces en r- > project.org] En nombre de Ruben Tobalina Ramirez > Enviado el: martes, 17 de junio de 2014 20:25 > Para: Ricardo Alberich > CC: r-help-es > Asunto: Re: [R-es] No es un problema de tm tienes doc.corpus vacío > > Buenas tardes Ricardo, > > gracias por la respuesta rápida. Pues copie tu código y me sigue > dando el mismo error. Fui a mi codigo y cambie los 'doc.corpus' por > 'corpus' (fue un error al limpiar el codigo) y sigue el error. > No sé, he probado buscando en webs códigos similares y sigue el > error:( > > > El 17 de junio de 2014, 19:53, Ricardo Alberich <r.alberich en uib.es> > escribió: > > > No es un problema de tm ni de SnowfallC ni de mcapply (por el path > > utilizas linux, en windows mcapply según el manual no va bien) > > > > No defines bien los objetos que pasas. Pasas doc.corpus en lugar de > > corpus ( o asignas a corpus en lugar de a doc.corpus) . > > Depura los programas cuando salga un error de objeto, como te pone en > > el Error que pasas . > > > > Temporalmente lo tienes arreglado en > > > > http://rpubs.com/ricardo/Temp > > > > Pero otra vez observa paso a paso los objetos y nos dirás (bueno ya > > lo > > sabrás) dónde está el error. > > > > Ricardo Alberich > > > > > > On 17/06/14 18:38, r-help-es-request en r-project.org wrote: > > > >> EnvÃe los mensajes para la lista R-help-es a > >> r-help-es en r-project.org > >> > >> Para subscribirse o anular su subscripción a través de la WEB > >> https://stat.ethz.ch/mailman/listinfo/r-help-es > >> > >> O por correo electrónico, enviando un mensaje con el texto "help" > en > >> el asunto (subject) o en el cuerpo a: > >> r-help-es-request en r-project.org > >> > >> Puede contactar con el responsable de la lista escribiendo a: > >> r-help-es-owner en r-project.org > >> > >> Si responde a algún contenido de este mensaje, por favor, edite la > >> linea del asunto (subject) para que el texto sea mas especifico que: > >> "Re: Contents of R-help-es digest...". Además, por favor, incluya > en > >> la respuesta sólo aquellas partes del mensaje a las que está > >> respondiendo. > >> > >> > >> Asuntos del dÃa: > >> > >> 1. problemas con el paquete tm (Ruben Tobalina Ramirez) > >> > >> > >> -------------------------------------------------------------------- > - > >> - > >> > >> Message: 1 > >> Date: Tue, 17 Jun 2014 18:37:58 +0200 > >> From: Ruben Tobalina Ramirez <lagrimaescrita en gmail.com> > >> To: Lista R <r-help-es en r-project.org> > >> Subject: [R-es] problemas con el paquete tm > >> Message-ID: > >> <CAKXAqm0tk9AFWcD7anRYKNDF9-KOyisu+9ZipOWQtK3MoS+t+g en mail. > >> gmail.com> > >> Content-Type: text/plain; charset="utf-8" > >> > >> Hola, > >> > >> hace un tiempo que voy detrás de aprender este magnifico programa > >> pero un poco por miedo y otro poco por falta de tiempo nunca me > >> animaba. He realizado un par de cursos de introducción y, a parte > de > >> esta lista, sigo algunos blogs sobre R. Al lio, esta introducción > >> era mas que nada para pedir paciencia conmigo:D > >> > >> Estoy intentando introducirme en el paquete tm para hacer análisis > >> de textos de canciones. Mi problema es que al intentar hacer la > >> matriz del corpus linguistico me da el siguiente error: > >> > >> > >> > >> > >> > >> *Error en UseMethod("meta", x) : no applicable method for 'meta' > applied > >> to an object of class "character"Además: Mensajes de aviso > >> perdidosIn mclapply(unname(content(x)), termFreq, control) : all > >> scheduled cores encountered errors in user code* > >> > >> Os copio el script y os adjunto los datos por si acaso: > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> > >> *TEXTFILE = "/home/rubent/Documentos/Sociologia/Soc Musica/Black > >> metal/Analisis texto/Inmortal"inmortal = readLines(TEXTFILE)inmortal > >> = readLines(TEXTFILE)length(inmortal)head(inmortal)tail( > >> inmortal)library(tm)vec > >> <- VectorSource(inmortal)corpus <- > >> Corpus(vec)summary(corpus)inspect(corpus[1:7])corpus <- > >> tm_map(corpus, tolower)corpus <- tm_map(corpus, > >> removePunctuation)corpus <- tm_map(corpus, removeNumbers)corpus <- > >> tm_map(corpus, removeWords, > >> > stopwords("english"))inspect(doc.corpus[1:2])library(SnowballC)corpus > >> <- tm_map(corpus, stemDocument)corpus <- tm_map(corpus, > >> stripWhitespace)inspect(doc.corpus[1:8])TDM <- > >> TermDocumentMatrix(corpus)TDM* > >> > >> por adelantado, muchas gracias!!! > >> > >> ruben! > >> ------------ próxima parte ------------ Se ha borrado un adjunto en > >> formato HTML... > >> URL: <https://stat.ethz.ch/pipermail/r-help-es/ > >> attachments/20140617/21958641/attachment.html> > >> ------------ próxima parte ------------ A non-text attachment was > >> scrubbed... > >> Name: Inmortal > >> Type: application/octet-stream > >> Size: 50147 bytes > >> Desc: no disponible > >> URL: <https://stat.ethz.ch/pipermail/r-help-es/ > >> attachments/20140617/21958641/attachment.obj> > >> > >> ------------------------------ > >> > >> _______________________________________________ > >> R-help-es mailing list > >> R-help-es en r-project.org > >> https://stat.ethz.ch/mailman/listinfo/r-help-es > >> > >> > >> Fin de Resumen de R-help-es, Vol 64, EnvÃo 27 > >> ********************************************* > >> > > > > > > -- > > > > > > ========================================> > > > Ricardo Alberich Martà (r.alberich en uib.es) Director del Departament > > de Matemà tiques i Informà tica Universitat de les Illes Balears > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es en r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > > [[alternative HTML version deleted]]