similar to: procesamiento de textos con R

Displaying 20 results from an estimated 500 matches similar to: "procesamiento de textos con R"

2015 Dec 10
3
SVM hadoop
Estimados Un día leí algo en el siguiente hipervínculo, pero nunca lo use. http://blog.revolutionanalytics.com/2015/06/using-hadoop-with-r-it-depends.html Javier Rubén Marcuzzi De: Carlos J. Gil Bellosta Enviado: miércoles, 9 de diciembre de 2015 14:33 Para: MªLuz Morales CC: r-help-es Asunto: Re: [R-es] SVM hadoop No, no correrán en paralelo si usas los SVM de paquetes como e1071. No
2015 Dec 09
2
SVM hadoop
Buenos días, alguien sabe si hay alguna manera de implementar una máquina de soporte vectorial (svm) con R-hadoop?? Mi interés es hacer procesamiento big data con svm. Se que en R, existen los paquetes {RtextTools} y {e1071} que permiten hacer svm. Pero no estoy segura de que el algoritmo sea paralelizable, es decir, que pueda correr en paralelo a través de la plataforma R-hadoop. Muchas
2015 Dec 10
2
SVM hadoop
Hola, Puedes poner un RStudio en Amazon, poner "caret" y a correr.... No sé si tendrás suficiente con lo que te pueda ofrecer Amazon para tu problema... creo que sí... ;-).... O directamente hacerlo aquí, que toda esta instalación ya la tienen hecha: http://www.teraproc.com/front-page-posts/r-on-demand/ Gracias, Carlos. El 10 de diciembre de 2015, 14:43, MªLuz Morales <mlzmrls
2015 Dec 11
2
SVM hadoop
Hola Mª Luz, Te cuento un poco mi visión: Lo primero de todo es tener claro qué quiero hacer exactamente en paralelo, se me ocurren 3 escenarios: (1) Aplicar un modelo en este caso SVM sobre unos datos muy grandes y por eso necesito hadoop/spark (2) Realizar muchos modelos SVM sobre datos pequeños (por ejemplo uno por usuario) y por eso necesito hadoop/spark para parelilizar estos procesos
2017 Oct 03
2
Procesamiento de Lenguaje Natural
Hola: Me gustaría que me recomendarais paquetes o alguna forma de "hincarle el diente" para empezar a investigar en la siguiente cuestión. El proyecto trata de que, a partir de un numero grande de documentos pdf que contienen, básicamente, Notas Simples del Registro de la Propiedad deseamos extraer para cada uno de esos documentos una serie de ítems de información, a saber: -Finca
2015 Jun 19
4
Sobre data.table
Uy pues con mi data.table no lo hace bien, me devuelve 0 para todas las columnas. Podría ser porque algunas columnas son char y otras num?? El 19 de junio de 2015, 13:03, Olivier Nuñez <onunez en unex.es> escribió: > Si quieres mantener el formato data.table en la salida, mejor utilizar > lapply: > > > DT[,lapply(.SD,function(x) sum(is.na(x)))] > X1 X2 > 1: 2
2015 Jun 19
4
Sobre data.table
Hola, ¿qué tal? ¿Y por qué no, simplemente, sapply(mi.data.table, function(x) sum(is.na(x)))? Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com El día 19 de junio de 2015, 14:44, Olivier Nuñez <onunez en unex.es> escribió: > Si te devuelve 0 para todas las columnas es que no hay NA's. > Tal vez son caracteres igual a "NA". > Para asegurarte de ello,
2015 Jun 19
3
Sobre data.table
Hola, quisiera determinar el número de filas distintas del valor NA para cada una de las columnas de un data.table. Probablemente se puede hacer de una forma muy compacta, pero no consigo hacerlo. Gracias Un saludo MªLuz [[alternative HTML version deleted]]
2015 Oct 01
4
sobre fread {data.table}
Hola de nuevo, parece que la última versión del paquete data.table es 1.9.6 La he probado y parece que no funciona bien, me da error: Error in fread("C:/Users/iphealthMariluz/Documents/Proyecto iphealt/ProcesamientoTexto/Adverse Drug Event/ADE-Corpus/DRUG-AE_eliminoLinea1856.rel") : 4 arguments passed to .Internal(nchar) which requires 3 El 30 de septiembre de 2015, 13:38,
2015 Jun 19
2
Sobre data.table
Mª Luz, si el comando de Carlos te devuelve 0 es que no hay NA's. Da igual que tus columnas sean caracteres o número. Lo que intuyo es que tienes celdas con la frase "NA" que interpretas como NA. Mandanos el summary de tu data.table y lo vemos... ----- Mensaje original ----- De: "MªLuz Morales" <mlzmrls en gmail.com> Para: "Carlos J. Gil Bellosta"
2015 Sep 29
4
sobre fread {data.table}
Buenas tardes, intento almacenar el contenido de un archivo .docx en un data.table, pero solo me devuelve 1855 filas cuando deberñian ser 6821. Sin embargo, el mismo archivo se me descarga completo usando read_docx {qdapTools}, pero este devuelve un vector carácter y no es lo que quiero. ¿Alguien sabe donde puede estar el problema? Nota: El docx procede de un archivo .rel que descargué de
2015 Sep 29
2
sobre fread {data.table}
Hola, usaba fread porque me devuelve data.table que es lo que quiero usar El 29 de septiembre de 2015, 17:05, Carlos Ortega <cof en qualityexcellence.es> escribió: > No sé porqué piensas que "fread" va poder leer cualquier cosa... > > Ya que lo tienes en Word, prueba con esto: > https://github.com/hrbrmstr/docxtractr > > Saludos, > Carlos Ortega >
2016 Feb 16
5
error en tarea mapreduce en Rstudio en ubuntu
Buenos días, Tengo instalado un cluster en una máquina virtual y he instalado R y Rstudio (sobre Ubuntu server 14.04 64 bits ) . Desde consola puedo entrar en R y ejecutar un ejemplo con mapreduce sin problemas. Pero cuando lo intento hacer desde Rstudio obtengo este error: 16/02/16 10:37:00 ERROR streaming.StreamJob: Job not successful! Streaming Command Failed! Error in mr(map = map, reduce =
2015 Jun 08
4
columna de un data.table puede ser data.frame?
Hola, yo quiero construir un data.table donde una columna (Parametros) son caracteres y otra el resultado de la función information.gain, que devuelve un data.frame. El código que he usado es este, pero me da error PesosParam <- data.table(,.(Parametros, Peso:= information.gain(In.hospital_death~., ParamCol))) Es posible hacer lo que digo? o debo hacer una transformación del data.frame a
2015 Sep 29
2
sobre fread {data.table}
También si nos envías el .rel nos ayudaría a ver qué pasa... Saludos, Carlos Ortega. El 29 de septiembre de 2015, 17:38, MªLuz Morales <mlzmrls en gmail.com> escribió: > De acuerdo, > voy a probarlo > Muchas gracias > > Saludos > MªLuz > > El 29 de septiembre de 2015, 17:31, Pedro Concejero Cerezo < > pedro.concejerocerezo en telefonica.com> escribió: >
2015 Sep 30
2
sobre fread {data.table}
Si en la línea 1856 de tus datos reemplazas |"cotton-wool" spots| por |cotton-wool spots| funciona (y fread lee todas las línas). Suena a bug en el paquete (porque las comillas que no son vecinas de separador las gestiona correctamente). Igual quieres comentarle al autor del paquete el problema para que le eche un ojo. De todos modos, te recomendaría que comprobases el problema
2015 Sep 29
5
sobre fread {data.table}
Hola, M. Luz. Hay infinidad de motivos por los que se te puede cortar la lectura de un archivo de datos, pero los más habituales son encontrar un "#" o unas "" en los registros, o una línea toda en blanco. Lo primero yo creo que es dejar el archivo en texto plano (lo que te recomendaba Carlos de usar el original, no el docx), y buscar esos caracteres con un editor de texto
2015 Sep 30
2
sobre fread {data.table}
Hola de nuevo, el archivo .rel esta en una carpeta comprimida .zip, yo la descomprimo con win rar. Como no sea ese el motivo por el que no me da el fichero completo? El 30 de septiembre de 2015, 10:30, MªLuz Morales <mlzmrls en gmail.com> escribió: > Pues soy gafe entonces, > no lo entiendo: > > > datIn <- fread("C:\\Users\\iphealthMariluz\\Documents\\Proyecto
2015 Jun 02
2
information.gain de la libreria FSelector
Hola Javier, yo soy licenciada en Físicas pero también tengo algo de información médica (doctorado en Neurociencia) Un saludo El 2 de junio de 2015, 15:35, <javier.ruben.marcuzzi en gmail.com> escribió: > Estimada María Luz Morales > > ¿Qué título universitario tiene usted?, es para pensar en como poder > ayudarla, si desde la parte médica o la de R > > Javier Rubén
2015 May 28
2
La ejecución de mi script R es muy lenta
Hola, Si no tienes inconveniente en compartir tu conjunto de datos (puedes dejarlo en un Dropbox y compartir enlace) o incluir una salida de la variables: "seta" y "outcomes" (función "save.image()") con eso podemos darte alguna solución mucho más rápida que la que planteas. En tu código con un bucle estás tratando de rellenar una lista que son los diferentes