Si, el paquete XML sirve para eso. Vas a tener que aprender a usar para XML
para extraer información de los nodos. Aquí hay una pregunta de
stackoverflow sobre como extraer información de html cosa que es muy similar
a hacer en un archivo xml
http://stackoverflow.com/questions/1395528/scraping-html-tables-into-r-data-frames-using-the-xml-package
Luciano
El 12 de julio de 2011 16:09, Sebastian Kruk
<residuo.solow@gmail.com>escribió:
> Estimados:
>
> Tengo una archivo con informacion de las importaciones y exportaciones
> cuya fuente es de la Aduana uruguaya. Si bajo el año entero puede
> llegar a ser un archivo grande.
>
> ¿Hay alguna libreria que me sirva para importar el archivo con formato
> xml y de pique solamente importar ciertas variables?
>
> Descripción del contenido de archivos con ingresadas y modificados:
>
> <?xml version="1.0" encoding="ISO-8859-1" ?>
>
> - <ROOT>
>
> - <ROWSET_DUASDIA>
>
> - <ROW_DUASDIA NUM="1">
>
> <DDCODI_ADUAN> Aduana </DDCODI_ADUAN>
>
> <DDANO_PRESE> Año </DDANO_PRESE>
>
> <DDNUME_CORRE> Dua </DDNUME_CORRE>
>
> <DDNUME_SERIE> Item </DDNUME_SERIE>
>
> <DDFECH_INGSI> Fecha Ingreso </DDFECH_INGSI>
>
> <DDTIPO_REGI> Tipo Regimen </DDTIPO_REGI>
>
> <DDTOTA_ADICI> Adiciones </DDTOTA_ADICI>
>
> <DDPAIS_ORIGE> Origen </DDPAIS_ORIGE>
>
> <DDVINCPROIMP> Vinculo Prov.-Imp</DDVINCPROIMP>
>
> <DDDESP_URGE> Tipo Despacho </DDDESP_URGE>
>
> <DDTIPCAMVEN> Tipo Cambio Venta </DDTIPCAMVEN>
>
> <DDVTOT_DEDUC> Gastos U$S </DDVTOT_DEDUC>
>
> <DDPART_NANDI> NCM </DDPART_NANDI>
>
> <DDTNAN> Apertura </DDTNAN>
>
> <DDPUER_EMBAR> Procedencia/Destino </DDPUER_EMBAR>
>
> <DDPAIS_ADQUI> Adquisicion </DDPAIS_ADQUI>
>
> <DDCONV_INTER> Acuerdo </DDCONV_INTER>
>
> <DDTIPO_NOMEN > Tipo Nomen</DDTIPO_NOMEN >
>
> <DDPART_NALAD> Partida en Nomen </DDPART_NALAD>
>
> <DDTIPO_MARGE> Apertura</DDTIPO_MARGE>
>
> <DDCODI_LIBER> Exoneracion </DDCODI_LIBER>
>
> <DDPORC_AJUS> Porc. Ajuste </DDPORC_AJUS>
>
> <DDQUNICOM> Cant. Unid. Comercial </DDQUNICOM>
>
> <DDTUNICOM> Tipo Unid. Comercial </DDTUNICOM>
>
> <DDCPME_PROD > PME del Producto</DDCPME_PROD >
>
> <DDCPME_INSU > PME del Insumo</DDCPME_INSU >
>
> <DDPART_INSU> NCM del Insumo </DDPART_INSU>
>
> <DDUNID_FIQTY> Total Unid. Fisicas </DDUNID_FIQTY>
>
> <DDUNID_FIDES> Desc. Unid. Fisicas </DDUNID_FIDES>
>
> <DDCIF_DOLPOL> CIF U$S </DDCIF_DOLPOL>
>
> <DDVGAS_SEGUR> Seguro </DDVGAS_SEGUR>
>
> <DDCMON_SEG> Moneda Seguro </DDCMON_SEG>
>
> <DDVGAS_TREMB> Flete </DDVGAS_TREMB>
>
> <DDCMON_FLETE> Moneda Flete </DDCMON_FLETE>
>
> <DDVAD_INCR> Valor Aduana Incr. </DDVAD_INCR>
>
> <DDIMA_DOLAR> IMADUNI U$S </DDIMA_DOLAR>
>
> <DDLIMA_DOLAR> IMADUNI U$S liberado </DDLIMA_DOLAR>
>
> <DDRMI_DOLAR> Rec. Min. U$S </DDRMI_DOLAR>
>
> <DDLRMI_DOLAR> Rec. Min. U$S liberado </DDLRMI_DOLAR>
>
> <DDRAD_DOLAR> Rec. Adic. U$S </DDRAD_DOLAR>
>
> <DDLRAD_DOLAR> Rec. Adic. U$S liberado </DDLRAD_DOLAR>
>
> <DDRMO_DOLAR> Rec. Mov. U$S </DDRMO_DOLAR>
>
> <DDLRMO_DOLAR> Rec. Mov. U$S liberado </DDLRMO_DOLAR>
>
> <DDIVA_DOLAR> IVA U$S </DDIVA_DOLAR>
>
> <DDLIVA_DOLAR> IVA U$S liberado </DDLIVA_DOLAR>
>
> <DDLIVAA_DOLA> IVA Ant. U$S liberado </DDLIVAA_DOLA>
>
> <DDIVAA_DOLAR> IVA Ant. U$S</DDIVAA_DOLAR>
>
> <DDPOR_IMADUN> Porc. IMADUNI </DDPOR_IMADUN>
>
> <DDPOR_RMI> Porc. Rec. Min. </DDPOR_RMI>
>
> <DDPOR_RAD> Porc. Rec. Adic. </DDPOR_RAD>
>
> <DDPOR_IVA> Porc. IVA </DDPOR_IVA>
>
> <DDPOR_IVAA> Porc. IVA Ant. </DDPOR_IVAA>
>
> <DDPME_DOLAR> Monto PME Usado </DDPME_DOLAR>
>
> <DDCNT_ANALI> Cant. Anal. Quim. </DDCNT_ANALI>
>
> <DDCNT_CERTI> Cant. Cert. Not. </DDCNT_CERTI>
>
> <DDVIA_TRANSP> Vía Transporte </DDVIA_TRANSP>
>
> <DDUNID_TRANS> Unidad Transporte </DDUNID_TRANS>
>
> <DDID_MEDTRAN> Medio Transporte </DDID_MEDTRAN>
>
> <DDADUAINGEGR> Aduana Ing/Egreso </DDADUAINGEGR>
>
> <DDTIPO_DOCUM> Tipo Doc. Importador </DDTIPO_DOCUM>
>
> <DDLIBR_TRIBU> Documento Importador </DDLIBR_TRIBU>
>
> <DDDESC_COMER> Desc. Comercial </DDDESC_COMER>
>
> <DDDESC_FOPRE /> Desc. Comercial</DDDESC_FOPRE >
>
> <DDDESC_MATCO /> Desc. Comercial</DDDESC_MATCO >
>
> <DDDESC_USOAP /> Desc. Comercial</DDDESC_USOAP >
>
> <DDDESC_OTROS /> Desc. Comercial</DDDESC_OTROS>
>
> <DDPESO_BRUTO> Peso Bruto </DDPESO_BRUTO>
>
> <DDPESO_NETO> Peso Neto </DDPESO_NETO>
>
> <DDDNOMBRE> Importador </DDDNOMBRE>
>
> <DDCODI_REGI> Regimen </DDCODI_REGI>
>
> <DDTIPO_OPERA> Subregimen </DDTIPO_OPERA>
>
> <DDSEST_MERCA> Estado Mercaderia </DDSEST_MERCA>
>
> <DDNATU_TRANS> Naturaleza Trans. </DDNATU_TRANS>
>
> <DDCNIV_COIMP > Nivel Usuario-Imp. </DDCNIV_COIMP >
>
> <DDCLASE> Tipo Bulto </DDCLASE>
>
> <DDCANT_BULTO> Cantidad Bultos </DDCANT_BULTO>
>
> <DDCODI_ALMA> Deposito </DDCODI_ALMA>
>
> <DDCODI_CER > Control Doc. por NCM</DDCODI_CER >
>
> <DDDUI> DUI </DDDUI>
>
> <DDFECH_EMBAR> Embarque </DDFECH_EMBAR>
>
> <DDTERM_TRANS> Cond. Venta </DDTERM_TRANS>
>
> <DDCALMDEST > Destino Mercaderia </DDCALMDEST >
>
> <DDPAIS_TRANS>Pais Transporte</DDPAIS_TRANS>
>
> <DDCODI_AGENT>Despachante</DDCODI_AGENT>
>
> <DDFCHCMP>Fecha de cumplido Exportación </DDFCHCMP>
>
> <DDCNT_LATU>Cantidad de la AT</DDCNT_LATU>
>
> <DDUNI_ATLA />Unidades de la AT</DDUNI_LATU>
>
> <DDIMESI_DOLA>Monto de IMESI en Dólares</DDIMESI_DOLA>
>
> <DDLIMESI_DOL>Monto Liberado IMESI Dólares</DDLIMESI_DOL>
>
> <DDLLATU_DOLA>LATU 338 Liber en U$S</DDLLATU_DOLA>
>
> <DDLATU_DOLAR>LATU 338 en U$s</DDLATU_DOLAR>
>
> <DDPOR_338>Porcentaje para Liq./Reliq</DDPOR_338>
>
> <DDDERESP_DOL>Derecho Específico en U$s</DDDERESP_DOL>
>
> <DDCOFIS_DOLA>Monto en U$s de COFIS</DDCOFIS_DOLA>
>
> <DDLCOFIS_DOL>Monto Liberado en U$s de COFIS</DDLCOFIS_DOL>
>
> <DDPOR_COFIS>Porcentaje de Aplicación COFIS</DDPOR_COFIS>
>
> <DDACOFIS_DOL>Monto en U$s Ant. COFIS</DDACOFIS_DOL>
>
> <DDLACOFIS_DO>Monto en U$s Ant. COFIS</DDLACOFIS_DO>
>
> <DDPOR_ACOFIS>Porcentaje Aplic. Ant. COFIS</DDPOR_ACOFIS>
>
> <DDLTCI_DOLAR>TCI Liberado en U$s</DDLTCI_DOLAR>
>
> <DDPOR_TCI>Porcentaje de TCI</DDPOR_TCI>
>
> <DDANA_DOLAR>Análisis en U$s</DDANA_DOLAR>
>
> <DDLANA_DOLAR>Liberado de Análisis en U$s</DDLANA_DOLAR>
>
> <DDCERT_DOLAR>Certificados en U$s</DDCERT_DOLAR>
>
> <DDLCERT_DOLA>Liberado Certificados en U$s</DDLCERT_DOLA>
>
> <DDTASCON_DOL>Tasa Consular en Dólares</DDTASCON_DOL>
>
> <DDLTASCON_DO>Tasa Consular en Dólares Liberado</DDLTASCON_DO>
>
> <DDCNT_FICTO>Cantidad Ficto</DDCNT_FICTO>
>
> <DDUNI_FICTO />Unidad Ficto</DDUNI_FICTO>
>
> <DDSERAPEINAC />Apertura INAC</DDSERAPEINAC>
>
> <DDSERINAPEAPE />Apertura INAPE </DDSERINAPEAPE>
>
> <DDSERAPELATU />Apertura LATU </DDSERAPELATU>
>
> <DDSERAPEDETRAC />Apertura DETRACCION </DDSERAPEDETRAC>
>
> <DDSERAPEFIS />Apertura FIS</DDSERAPEFIS>
>
> <DDSERAPESUL />Apertura SUL </DDSERAPESUL>
>
> <DDSERAPEIME />Apertura IMEBA</DDSERAPEIME>
>
> <DDSERIMEMAPE />Apertura IMEBA MEVIR</DDSERIMEMAPE>
>
> <DDSERIMEIAPE />Apertura IMEBA INIA</DDSERIMEIAPE>
>
> <DDSERAPEFPI />Apertura FPI</DDSERAPEFPI>
>
> <DDSERKILACON>Kilos Acondicionados</DDSERKILACON>
>
> <DDSERPORLANS>Porcentaje Lana Sucia</DDSERPORLANS>
>
> <DDSERLANPOR>Porcentaje Lana</DDSERLANPOR>
>
> <DDSERAPEBENE />Apertura del Beneficio </DDSERAPEBENE>
>
> <DDSERFOBLANA>FOB Lana Nac. o Sucia Import.</DDSERFOBLANA>
>
> <DDSERFOBFACO>FOB FACON u otros</DDSERFOBFACO>
>
> <DDSERMATPRIM />Materia Prima </DDSERMATPRIM>
>
> <DDSERTPOUNID />Tipo Unidad Devolución </DDSERTPOUNID>
>
> <DDSERCNTUNID>Cantidad Unidad Devolución</DDSERCNTUNID>
>
> <DDSERAMPDE />Cantidad Unidad Devolución</DDSERAMPDE>
>
> <DDPOR_IMESI>Porcentaje de IMESI</DDPOR_IMESI>
>
> <DDTCI_DOLA>TCI en U$s</DDTCI_DOLA>
>
> <DDPOR_TASCON>Porcentaje Tasa Consular</DDPOR_TASCON>
>
> <DDDolApeDETRAC>Monto U$S Apertura DETRACCION</DDDolApeDETRAC>
>
> <DDLibApeDETRAC>Monto Liberado Apertura
DETRACCION</DDLibApeDETRAC>
>
> <DDPorApeDETRAC>Porcentaje Aplicado Apertura
DETRACCION</DDPorApeDETRAC>
>
> <DDDolApeFis>Monto U$S Apertura FIS</DDDolApeFis>
>
> <DDLibApeFis>Monto Liberado Apertura FIS</DDLibApeFis>
>
> <DDPorApeFis>Porcentaje Aplicado Apertura FIS</DDPorApeFis>
>
> <DDDolApeFPI>Monto U$S Apertura FPI</DDDolApeFPI>
>
> <DDLibApeFPI>Monto Liberado Apertura FPI</DDLibApeFPI>
>
> <DDPorApeFPI>Porcentaje Liberado Apertura FPI</DDPorApeFPI>
>
> <DDDolApeIMEBA>Monto U$S Apertura IMEBA</DDDolApeIMEBA>
>
> <DDLibApeIMEBA>Monto Liberado Apertura IMEBA</DDLibApeIMEBA>
>
> <DDPorApeIMEBA>Porcentaje Aplicado Apertura
IMEBA</DDPorApeIMEBA>
>
> <DDDolApeInac>Monto U$S Apertura INAC</DDDolApeInac>
>
> <DDLibApeInac>Monto Liberado Apertura INAC</DDLibApeInac>
>
> <DDPorApeInac>Porcentaje Aplicado Apertura INAC</DDPorApeInac>
>
> <DDDolApeLATU>Monto U$S Apertura LATU</DDDolApeLATU>
>
> <DDLibApeLATU>Monto Liberado Apertura LATU</DDLibApeLATU>
>
> <DDPorApeLATU>Porcentaje Aplicado Apertura LATU</DDPorApeLATU>
>
> <DDDolApeSUL>Monto U$S Apertura SUL</DDDolApeSUL>
>
> <DDLibApeSUL>Monto Liberado Apertura SUL</DDLibApeSUL>
>
> <DDPorApeSUL>Porcentaje Aplicado Apertura SUL</DDPorApeSUL>
>
> <DDDolIMEIApe>Monto U$S IMEBA INIA</DDDolIMEIApe>
>
> <DDLibIMEIApe>Monto Liberado IMEBA INIA</DDLibIMEIApe>
>
> <DDPorIMEIApe>Porcentaje Aplicado IMEBA INIA</DDPorIMEIApe>
>
> <DDDolIMEMApe>Monto U$S Apertura IMEBA MEVIR</DDDolIMEMApe>
>
> <DDLibIMEMApe>Monto Liberado Apertura IMEBA
MEVIR</DDLibIMEMApe>
>
> <DDPorIMEMApe>Porcentaje Aplicado Apertura IMEBA
MEVIR</DDPorIMEMApe>
>
> <DDDolINAPEApe>Monto U$S Apertura INAPE</DDDolINAPEApe>
>
> <DDLibINAPEApe>Monto Liberado Apertura INAPE</DDLibINAPEApe>
>
> <DDPorINAPEApe>Porcentaje Aplicado Apertura
INAPE</DDPorINAPEApe>
>
> <DDSERAPEARR>Apertura del Arroz<DDSERAPEARR />
> <DDDolApeArroz>Monto U$S Apertura
Arroz</DDDolApeArroz>
> <DDLibApeArroz>Monto Liberado Apertura
Arroz</DDLibApeArroz>
> <DDPorApeArroz>Porcentaje Liberado Apertura
Arroz</DDPorApeArroz>
> <DDTOT_FACT>Total Facturado</DDTOT_FACT>
> <DDSERAPEFOLE>Apertura Fondo Lechero</DDSERAPEFOLE>
> <DDLFOLEDOL>Monto Liberado Fondo Lechero ( U$S
)</DDLFOLEDOL>
> <DDFOLEDOL>Monto U$S Fondo Lechero</DDFOLEDOL>
> <DDFOLEMN>Monto Fondo Lechero Mon.
Nacional</DDFOLEMN>
> <DDPORAIRAE>Porcentaje Anticipo IRAE</DDPORAIRAE>
> <DDLAIRAEDOL>Liberado Anticipo IRAE
U$S</DDLAIRAEDOL>
> <DDAIRAEDOL>Anticipo IRAE U$S</DDAIRAEDOL>
> <DDAIRAEMN>Anticipo IRAE Moneda
Nacional</DDAIRAEMN>
> <DDSERAPEPER>Apertura Fondo
Periodistico</DDSERAPEPER >
> <DDLFOPEDOL>Liberado Fondo Periodistico U$S</
DDLFOPEDOL >
> <DDFOPEDOL>Fondo Periodistico U$S</ DDFOPEDOL >
> <DDFOPEMN>Fondo Periodistico Moneda Nacional</
DDFOPEMN >
> </ROW_DUASDIA>
>
> </ROOT>
>
> Saludos,
>
> Sebastian.
>
> _______________________________________________
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
[[alternative HTML version deleted]]