miguel.angel.rodriguez.muinos en sergas.es
2016-Apr-21 12:58 UTC
[R-es] Web interesante (ROpenSci)
Hola Javier. Yo te puedo dar mi opinión personal: tengo un package en R-Forge porque no me apetece plegarme a las exigencias de documentación de CRAN cuando mi paquete tiene un GUI totalmente autoexplicativo. Es un caso muy particular, pero es una razón. Otra: qué lleva a Microsoft a mantener su propio repositorio? (una especie de mirror de CRAN pero con otra timeline de actualización) Otra más: Bioconductor.... no hace falta explicarlo, creo. Lo que planteas es un debate más serio de lo que parece en un principio. Le voy a dar la vuelta a tu pregunta: se puede confiar en CRAN? Estás seguro de la "seguridad" de CRAN? Por qué confiar más en CRAN que en otros repositorios? Hoy en día se puede publicar prácticamente cualquiera cosa en él. Te voy a contar la historia de un amigo que estuvo a punto de publicar un package en CRAN con un payload (inofensivo, sólo recogía un listado de todos los packages que tenía instalado el usuario y lo enviaba a una URL) como prueba de concepto (obviamente el paquete hacía otra cosa en el frontline). Un amigo de un amigo.. de hecho ni siquiera lo conozco. ;-) Qué pasa con los mirrors de CRAN? Imagina que yo administre uno... es posible modificar/sustituir manualmente un paquete? Hablando de código "que se pisa"... no te ha pasado nunca el instalar un paquete de CRAN y que una función que ya tenías empiece a hacer "otras cosas" porque el autor ha redefinido dicha función? Pd.- La única seguridad que tienes es que al ser software libre, dispones del código fuente y puedes comprobarlo. Pero yo no apostaría mi vida por la seguridad/calidad de CRAN. Un Saludo, Miguel. El 21/04/2016 a las 14:22, Javier Marcuzzi escribió: Estimados ¿Qué hace que un autor cree un paquete de calidad y no utilice CRAN? ¿Se puede confiar en este? Para hacer una analogía, esta semana o la semana pasada leí que un autor de JavaScript por un problema de nombre registrado se negaba a cambiar el nombre, en definitiva, hay una pelea y retira sus código de los repositorios npm, como resultado miles de sitios web tienen problemas. Si por ejemplo uso ?rebi?, ¿este me da la seguridad de CRAN?, pensando en problemas entre código que se pise entre uno y otro. Javier Rubén Marcuzzi ________________________________ Nota: A información contida nesta mensaxe e os seus posibles documentos adxuntos é privada e confidencial e está dirixida únicamente ó seu destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe, por favor elimínea. A distribución ou copia desta mensaxe non está autorizada. Nota: La información contenida en este mensaje y sus posibles documentos adjuntos es privada y confidencial y está dirigida únicamente a su destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, por favor elimínelo. La distribución o copia de este mensaje no está autorizada. See more languages: http://www.sergas.es/aviso-confidencialidad [[alternative HTML version deleted]]
Estimado Miguel Puede ser que en mi forma de escribir se entienda que pienso que CRAN es lo mejor en calidad y seguridad, no, utilicé este como punto de base pero yo en estos momentos estoy utilizando los repositorios de Microsoft, mi criterio fue el siguiente, primero CRAN, luego personas de la empresa leen los originales y los trabajan con otro compilador, podrán realizar ajustes o no, y deberían probarlo, por lo que me llega un código con dos comprobaciones, ?supuestamente?, en un ciclo más lento, pero prefiero lento y seguro. Lógicamente, no todo es genial, creo que pandoc estaba obsoleto y utilicé unas opciones con el repositorio, finalmente pude hacer lo que deseaba, pero ?toquetenado?, un usuario con Linux creo que ni se daría cuenta de ese problema. Bioconductor es una especie de R especializado, yo lo pienso como una carpeta dentro del directorio de CRAN, a R-Forge lo interpreto como código que se puede usar pero está incompleto, inmaduro, en desarrollo, para luego pasar a los repositorios ?oficiales?. Lógicamente su criterio es valido, no hace falta para ese caso en particular, aunque posiblemente si usted accede a las exigencias de CRAN sus ?clientes? aumenten. Nuevos repositorios dentro de un esquema como BioConductor me parece bueno, pero nuevos repositorios con mucha independencia uno de otro me parece peligroso, aparecerán versiones diferentes de lo mismo, se podrán pisar entre una y otra, que siempre lo hacen, pero si se desordena arreglarlo será muy complicado. ¿Habrá usuarios R ? distribución? ¿Cómo R Ubuntu, R RedHat, R ?? Ayer estaba con un código R que funciona, pero cuándo quiero leer en forma de data.frame hay una lista dentro que da problemas, da error, busqué y podría andar otra librería que lee la estructura interna de la primera para exportar los datos, cuándo la primera ya tiene una función para eso, pero que en unos casos da error. Si eso anda y luego se me desordena por utilizar distintos repositorios quedo como decimos por estos lados ?entre la Pampa y la vía?. Javier Rubén Marcuzzi De: miguel.angel.rodriguez.muinos en sergas.es Enviado: jueves, 21 de abril de 2016 9:58 Para: javier.ruben.marcuzzi en gmail.com; r-help-es en r-project.org Asunto: Re: [R-es] Web interesante (ROpenSci) Hola Javier. Yo te puedo dar mi opinión personal: tengo un package en R-Forge porque no me apetece plegarme a las exigencias de documentación de CRAN cuando mi paquete tiene un GUI totalmente autoexplicativo. Es un caso muy particular, pero es una razón. Otra: qué lleva a Microsoft a mantener su propio repositorio? (una especie de mirror de CRAN pero con otra timeline de actualización) Otra más: Bioconductor.... no hace falta explicarlo, creo. Lo que planteas es un debate más serio de lo que parece en un principio. Le voy a dar la vuelta a tu pregunta: se puede confiar en CRAN? Estás seguro de la "seguridad" de CRAN? Por qué confiar más en CRAN que en otros repositorios? Hoy en día se puede publicar prácticamente cualquiera cosa en él. Te voy a contar la historia de un amigo que estuvo a punto de publicar un package en CRAN con un payload (inofensivo, sólo recogía un listado de todos los packages que tenía instalado el usuario y lo enviaba a una URL) como prueba de concepto (obviamente el paquete hacía otra cosa en el frontline). Un amigo de un amigo.. de hecho ni siquiera lo conozco. ;-) Qué pasa con los mirrors de CRAN? Imagina que yo administre uno... es posible modificar/sustituir manualmente un paquete? Hablando de código "que se pisa"... no te ha pasado nunca el instalar un paquete de CRAN y que una función que ya tenías empiece a hacer "otras cosas" porque el autor ha redefinido dicha función? Pd.- La única seguridad que tienes es que al ser software libre, dispones del código fuente y puedes comprobarlo. Pero yo no apostaría mi vida por la seguridad/calidad de CRAN. Un Saludo, Miguel. El 21/04/2016 a las 14:22, Javier Marcuzzi escribió: Estimados ¿Qué hace que un autor cree un paquete de calidad y no utilice CRAN? ¿Se puede confiar en este? Para hacer una analogía, esta semana o la semana pasada leí que un autor de JavaScript por un problema de nombre registrado se negaba a cambiar el nombre, en definitiva, hay una pelea y retira sus código de los repositorios npm, como resultado miles de sitios web tienen problemas. Si por ejemplo uso ?rebi?, ¿este me da la seguridad de CRAN?, pensando en problemas entre código que se pise entre uno y otro. Javier Rubén Marcuzzi Nota: A información contida nesta mensaxe e os seus posibles documentos adxuntos é privada e confidencial e está dirixida únicamente ó seu destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe, por favor elimínea. A distribución ou copia desta mensaxe non está autorizada. Nota: La información contenida en este mensaje y sus posibles documentos adjuntos es privada y confidencial y está dirigida únicamente a su destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, por favor elimínelo. La distribución o copia de este mensaje no está autorizada. See more languages: http://www.sergas.es/aviso-confidencialidad ------------ próxima parte ------------ Se ha borrado un adjunto en formato HTML... URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20160421/277515ec/attachment-0001.html> ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: 52F30BF2EE804EC28693907AF1F73E36.png Type: image/png Size: 150 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20160421/277515ec/attachment-0001.png>
Hola, ¿qué tal? Efectivamente, voy a ser de los que diga que lo conocía. Y más que eso, lo seguía de reojo con cierta envidia. rOpenSci está pensado para "aplicaciones científicas" pero lo que se está pidiendo a gritos (con las salvedades que indico debajo) es algo parecido para datos "locales". Uso "locales" en lugar de "españoles", que es en lo que estoy pensando por deferencia a lectores de otros países y porque pueden aplicarse todo lo que diga a continuación. Hay muchas fuentes de datos (con la salvedad que indicaré debajo) de datos "locales" disponibles a través de APIs que pudieran ser utilizadas programáticamente desde, p.e. aunque no exclusivamente, R: INE, IGN, ¿AEMET?, etc. Sería utiísima una colección de paquetes promovida "localmente" para atacar esas fuentes de datos https://github.com/cjgb/caRtociudadpúblicas. Un ejemplo de paquete que trata de hacer algo así es caRtociudad ( https://github.com/cjgb/caRtociudad), que explota datos de http://www.cartociudad.es (por ejemplo, para geolocalizar direcciones sin las limitaciones de Google Maps). La salvedad a la que me refería más arriba, sin embargo, es que apenas hay fuentes de datos "locales" consultables vía APIs, i.e., programáticamente. El INE, p.e., apenas tiene; la excepción creo que es un servicio cartográfico que consulta caRtociudad (y que devuelve la sección censal correspondiente a unas coordenadas). Pero pienso --soy iluso en ocasiones-- que la demanda (p.e., a través de herramientas sencillas de usar) podría incrementar la oferta. Dicho lo cual, si alguien después de leer todo lo anterior siente algún gusanillo por dentro, que me deje una nota y vemos qué cosas se pueden hacer al respecto. Salud, Carlos J. Gil Bellosta http://www.datanalytics.com [[alternative HTML version deleted]]