Hola, usaba fread porque me devuelve data.table que es lo que quiero usar El 29 de septiembre de 2015, 17:05, Carlos Ortega <cof en qualityexcellence.es> escribió:> No sé porqué piensas que "fread" va poder leer cualquier cosa... > > Ya que lo tienes en Word, prueba con esto: > https://github.com/hrbrmstr/docxtractr > > Saludos, > Carlos Ortega > www.qualityexcellence.es > > El 29 de septiembre de 2015, 16:55, MªLuz Morales <mlzmrls en gmail.com> > escribió: > >> Buenas tardes, >> >> intento almacenar el contenido de un archivo .docx en un data.table, pero >> solo me devuelve 1855 filas cuando deberñian ser 6821. >> >> Sin embargo, el mismo archivo se me descarga completo usando read_docx >> {qdapTools}, pero este devuelve un vector carácter y no es lo que quiero. >> >> ¿Alguien sabe donde puede estar el problema? >> >> Nota: El docx procede de un archivo .rel que descargué de internet, al >> cual >> cambié la extensión por .doc y una vez abierto guardé como docx. >> >> Gracias!! >> Un saludo >> MªLuz >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es >[[alternative HTML version deleted]]
Ya, pero fread puede atacar un conjunto de ficheros determinado, con una estructura determinada. Los docx tienen una codificación que en parte fread puede entender, pero que otra parte no (esa codificación es la que te permite ver los formatos, tablas, etc, etc cuando abres un documento Word). Yendo al principio, el documento ".rel", ¿lo has llegado a abrir con un editor para ver lo que tiene dentro...? Gracias, Carlos Ortega El 29 de septiembre de 2015, 17:14, MªLuz Morales <mlzmrls en gmail.com> escribió:> Hola, > usaba fread porque me devuelve data.table que es lo que quiero usar > > El 29 de septiembre de 2015, 17:05, Carlos Ortega < > cof en qualityexcellence.es> escribió: > >> No sé porqué piensas que "fread" va poder leer cualquier cosa... >> >> Ya que lo tienes en Word, prueba con esto: >> https://github.com/hrbrmstr/docxtractr >> >> Saludos, >> Carlos Ortega >> www.qualityexcellence.es >> >> El 29 de septiembre de 2015, 16:55, MªLuz Morales <mlzmrls en gmail.com> >> escribió: >> >>> Buenas tardes, >>> >>> intento almacenar el contenido de un archivo .docx en un data.table, pero >>> solo me devuelve 1855 filas cuando deberñian ser 6821. >>> >>> Sin embargo, el mismo archivo se me descarga completo usando read_docx >>> {qdapTools}, pero este devuelve un vector carácter y no es lo que quiero. >>> >>> ¿Alguien sabe donde puede estar el problema? >>> >>> Nota: El docx procede de un archivo .rel que descargué de internet, al >>> cual >>> cambié la extensión por .doc y una vez abierto guardé como docx. >>> >>> Gracias!! >>> Un saludo >>> MªLuz >>> >>> [[alternative HTML version deleted]] >>> >>> _______________________________________________ >>> R-help-es mailing list >>> R-help-es en r-project.org >>> https://stat.ethz.ch/mailman/listinfo/r-help-es >>> >> >> >> >> -- >> Saludos, >> Carlos Ortega >> www.qualityexcellence.es >> > >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
El .rel lo transformé a .doc, manualmente cambiando la extensión. Una vez puesto como .doc, lo he abierto y he comprobado que los datos son líneas con 8 columnas separadas por salto de línea entre ellas. fread me da un data-table con esa estructura exactamente, lo hace muy bien, pero no me da todas las líneas... El 29 de septiembre de 2015, 17:20, Carlos Ortega <cof en qualityexcellence.es> escribió:> Ya, pero fread puede atacar un conjunto de ficheros determinado, con una > estructura determinada. > > Los docx tienen una codificación que en parte fread puede entender, pero > que otra parte no (esa codificación es la que te permite ver los formatos, > tablas, etc, etc cuando abres un documento Word). > > Yendo al principio, el documento ".rel", ¿lo has llegado a abrir con un > editor para ver lo que tiene dentro...? > > Gracias, > Carlos Ortega > > El 29 de septiembre de 2015, 17:14, MªLuz Morales <mlzmrls en gmail.com> > escribió: > >> Hola, >> usaba fread porque me devuelve data.table que es lo que quiero usar >> >> El 29 de septiembre de 2015, 17:05, Carlos Ortega < >> cof en qualityexcellence.es> escribió: >> >>> No sé porqué piensas que "fread" va poder leer cualquier cosa... >>> >>> Ya que lo tienes en Word, prueba con esto: >>> https://github.com/hrbrmstr/docxtractr >>> >>> Saludos, >>> Carlos Ortega >>> www.qualityexcellence.es >>> >>> El 29 de septiembre de 2015, 16:55, MªLuz Morales <mlzmrls en gmail.com> >>> escribió: >>> >>>> Buenas tardes, >>>> >>>> intento almacenar el contenido de un archivo .docx en un data.table, >>>> pero >>>> solo me devuelve 1855 filas cuando deberñian ser 6821. >>>> >>>> Sin embargo, el mismo archivo se me descarga completo usando read_docx >>>> {qdapTools}, pero este devuelve un vector carácter y no es lo que >>>> quiero. >>>> >>>> ¿Alguien sabe donde puede estar el problema? >>>> >>>> Nota: El docx procede de un archivo .rel que descargué de internet, al >>>> cual >>>> cambié la extensión por .doc y una vez abierto guardé como docx. >>>> >>>> Gracias!! >>>> Un saludo >>>> MªLuz >>>> >>>> [[alternative HTML version deleted]] >>>> >>>> _______________________________________________ >>>> R-help-es mailing list >>>> R-help-es en r-project.org >>>> https://stat.ethz.ch/mailman/listinfo/r-help-es >>>> >>> >>> >>> >>> -- >>> Saludos, >>> Carlos Ortega >>> www.qualityexcellence.es >>> >> >> > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es >[[alternative HTML version deleted]]