Displaying 20 results from an estimated 500 matches similar to: "procesamiento de textos con R"
2015 Dec 10
3
SVM hadoop
Estimados
Un día leí algo en el siguiente hipervínculo, pero nunca lo use.
http://blog.revolutionanalytics.com/2015/06/using-hadoop-with-r-it-depends.html
Javier Rubén Marcuzzi
De: Carlos J. Gil Bellosta
Enviado: miércoles, 9 de diciembre de 2015 14:33
Para: MªLuz Morales
CC: r-help-es
Asunto: Re: [R-es] SVM hadoop
No, no correrán en paralelo si usas los SVM de paquetes como e1071.
No
2015 Dec 09
2
SVM hadoop
Buenos días,
alguien sabe si hay alguna manera de implementar una máquina de soporte
vectorial (svm) con R-hadoop??
Mi interés es hacer procesamiento big data con svm. Se que en R, existen
los paquetes {RtextTools} y {e1071} que permiten hacer svm. Pero no estoy
segura de que el algoritmo sea paralelizable, es decir, que pueda correr en
paralelo a través de la plataforma R-hadoop.
Muchas
2015 Dec 10
2
SVM hadoop
Hola,
Puedes poner un RStudio en Amazon, poner "caret" y a correr....
No sé si tendrás suficiente con lo que te pueda ofrecer Amazon para tu
problema... creo que sí... ;-)....
O directamente hacerlo aquí, que toda esta instalación ya la tienen hecha:
http://www.teraproc.com/front-page-posts/r-on-demand/
Gracias,
Carlos.
El 10 de diciembre de 2015, 14:43, MªLuz Morales <mlzmrls
2015 Dec 11
2
SVM hadoop
Hola Mª Luz,
Te cuento un poco mi visión:
Lo primero de todo es tener claro qué quiero hacer exactamente en paralelo,
se me ocurren 3 escenarios:
(1) Aplicar un modelo en este caso SVM sobre unos datos muy grandes y por
eso necesito hadoop/spark
(2) Realizar muchos modelos SVM sobre datos pequeños (por ejemplo uno por
usuario) y por eso necesito hadoop/spark para parelilizar estos procesos
2017 Oct 03
2
Procesamiento de Lenguaje Natural
Hola:
Me gustaría que me recomendarais paquetes o alguna forma de "hincarle el diente" para empezar a investigar en la siguiente cuestión.
El proyecto trata de que, a partir de un numero grande de documentos pdf que contienen, básicamente, Notas Simples del Registro de la Propiedad deseamos extraer para cada uno de esos documentos una serie de ítems de información, a saber:
-Finca
2015 Jun 19
4
Sobre data.table
Uy pues con mi data.table no lo hace bien, me devuelve 0 para todas las
columnas. Podría ser porque algunas columnas son char y otras num??
El 19 de junio de 2015, 13:03, Olivier Nuñez <onunez en unex.es> escribió:
> Si quieres mantener el formato data.table en la salida, mejor utilizar
> lapply:
>
> > DT[,lapply(.SD,function(x) sum(is.na(x)))]
> X1 X2
> 1: 2
2015 Jun 19
4
Sobre data.table
Hola, ¿qué tal?
¿Y por qué no, simplemente, sapply(mi.data.table, function(x) sum(is.na(x)))?
Un saludo,
Carlos J. Gil Bellosta
http://www.datanalytics.com
El día 19 de junio de 2015, 14:44, Olivier Nuñez <onunez en unex.es> escribió:
> Si te devuelve 0 para todas las columnas es que no hay NA's.
> Tal vez son caracteres igual a "NA".
> Para asegurarte de ello,
2015 Jun 19
3
Sobre data.table
Hola,
quisiera determinar el número de filas distintas del valor NA para cada una
de las columnas de un data.table. Probablemente se puede hacer de una forma
muy compacta, pero no consigo hacerlo.
Gracias
Un saludo
MªLuz
[[alternative HTML version deleted]]
2015 Oct 01
4
sobre fread {data.table}
Hola de nuevo,
parece que la última versión del paquete data.table es 1.9.6
La he probado y parece que no funciona bien, me da error:
Error in fread("C:/Users/iphealthMariluz/Documents/Proyecto
iphealt/ProcesamientoTexto/Adverse Drug
Event/ADE-Corpus/DRUG-AE_eliminoLinea1856.rel") :
4 arguments passed to .Internal(nchar) which requires 3
El 30 de septiembre de 2015, 13:38,
2015 Jun 19
2
Sobre data.table
Mª Luz,
si el comando de Carlos te devuelve 0 es que no hay NA's.
Da igual que tus columnas sean caracteres o número.
Lo que intuyo es que tienes celdas con la frase "NA" que interpretas como NA.
Mandanos el summary de tu data.table y lo vemos...
----- Mensaje original -----
De: "MªLuz Morales" <mlzmrls en gmail.com>
Para: "Carlos J. Gil Bellosta"
2015 Sep 29
4
sobre fread {data.table}
Buenas tardes,
intento almacenar el contenido de un archivo .docx en un data.table, pero
solo me devuelve 1855 filas cuando deberñian ser 6821.
Sin embargo, el mismo archivo se me descarga completo usando read_docx
{qdapTools}, pero este devuelve un vector carácter y no es lo que quiero.
¿Alguien sabe donde puede estar el problema?
Nota: El docx procede de un archivo .rel que descargué de
2015 Sep 29
2
sobre fread {data.table}
Hola,
usaba fread porque me devuelve data.table que es lo que quiero usar
El 29 de septiembre de 2015, 17:05, Carlos Ortega <cof en qualityexcellence.es>
escribió:
> No sé porqué piensas que "fread" va poder leer cualquier cosa...
>
> Ya que lo tienes en Word, prueba con esto:
> https://github.com/hrbrmstr/docxtractr
>
> Saludos,
> Carlos Ortega
>
2016 Feb 16
5
error en tarea mapreduce en Rstudio en ubuntu
Buenos días,
Tengo instalado un cluster en una máquina virtual y he instalado R y
Rstudio (sobre Ubuntu server 14.04 64 bits ) . Desde consola puedo entrar
en R y ejecutar un ejemplo con mapreduce sin problemas. Pero cuando lo
intento hacer desde Rstudio obtengo este error:
16/02/16 10:37:00 ERROR streaming.StreamJob: Job not successful!
Streaming Command Failed!
Error in mr(map = map, reduce =
2015 Jun 08
4
columna de un data.table puede ser data.frame?
Hola,
yo quiero construir un data.table donde una columna (Parametros) son
caracteres y otra el resultado de la función information.gain, que devuelve
un data.frame. El código que he usado es este, pero me da error
PesosParam <- data.table(,.(Parametros, Peso:=
information.gain(In.hospital_death~., ParamCol)))
Es posible hacer lo que digo? o debo hacer una transformación del
data.frame a
2015 Sep 29
2
sobre fread {data.table}
También si nos envías el .rel nos ayudaría a ver qué pasa...
Saludos,
Carlos Ortega.
El 29 de septiembre de 2015, 17:38, MªLuz Morales <mlzmrls en gmail.com>
escribió:
> De acuerdo,
> voy a probarlo
> Muchas gracias
>
> Saludos
> MªLuz
>
> El 29 de septiembre de 2015, 17:31, Pedro Concejero Cerezo <
> pedro.concejerocerezo en telefonica.com> escribió:
>
2015 Sep 30
2
sobre fread {data.table}
Si en la línea 1856 de tus datos reemplazas
|"cotton-wool" spots|
por
|cotton-wool spots|
funciona (y fread lee todas las línas).
Suena a bug en el paquete (porque las comillas que no son vecinas de
separador las gestiona correctamente).
Igual quieres comentarle al autor del paquete el problema para que le
eche un ojo. De todos modos, te recomendaría que comprobases el
problema
2015 Sep 29
5
sobre fread {data.table}
Hola, M. Luz.
Hay infinidad de motivos por los que se te puede cortar la lectura de un archivo de datos, pero los más habituales son encontrar un "#" o unas "" en los registros, o una línea toda en blanco.
Lo primero yo creo que es dejar el archivo en texto plano (lo que te recomendaba Carlos de usar el original, no el docx), y buscar esos caracteres con un editor de texto
2015 Sep 30
2
sobre fread {data.table}
Hola de nuevo,
el archivo .rel esta en una carpeta comprimida .zip, yo la descomprimo con
win rar. Como no sea ese el motivo por el que no me da el fichero completo?
El 30 de septiembre de 2015, 10:30, MªLuz Morales <mlzmrls en gmail.com>
escribió:
> Pues soy gafe entonces,
> no lo entiendo:
>
> > datIn <- fread("C:\\Users\\iphealthMariluz\\Documents\\Proyecto
2015 Jun 02
2
information.gain de la libreria FSelector
Hola Javier,
yo soy licenciada en Físicas pero también tengo algo de información médica
(doctorado en Neurociencia)
Un saludo
El 2 de junio de 2015, 15:35, <javier.ruben.marcuzzi en gmail.com> escribió:
> Estimada María Luz Morales
>
> ¿Qué título universitario tiene usted?, es para pensar en como poder
> ayudarla, si desde la parte médica o la de R
>
> Javier Rubén
2015 May 28
2
La ejecución de mi script R es muy lenta
Hola,
Si no tienes inconveniente en compartir tu conjunto de datos (puedes
dejarlo en un Dropbox y compartir enlace) o incluir una salida de la
variables: "seta" y "outcomes" (función "save.image()") con eso podemos
darte alguna solución mucho más rápida que la que planteas.
En tu código con un bucle estás tratando de rellenar una lista que son los
diferentes