Un offtopic para empezar el fin de semana. Acabo de entrar en kaggle, hacia tiempo que no lo hacia, y veo con 'estupor' que practicamente la gente trabaja con python. Es cierto que la mayor parte de competiciones son usadas con redes neuronales, donde python si tiene ventaja frente a R, pero me da miedo ver como python para temas de machine learning parece estar ganando la partida... ¿Opiniones? Obtener Outlook para Android<https://aka.ms/ghei36> [[alternative HTML version deleted]]
Estimados Antes de R, intenté algunas cosas con python, hablemos de más de 15 a anos (no me sale la letra en espannniiiol), yo estaba con le jefe de cátedra de genética y mejoramiento animal haciendo cosas con fortran y me pareció mucho más simple, luego encontré R y fue este para muchas cosas. Hace una semana o dos vi algo porque lo tiene visual studio y un conocido lo usa y le encanta. Leí sobre modelos mixtos, ellos incluso realizan referencia a la documentación de R, es algo de costumbre, pero profundizando los algoritmos de R tienen funcionalidades para los análisis que ellos no disponen, por otro lado me gustó la forma de colocar cosas, en otras palabras, si uno quiere conectar R con C# el R.dotnet hace que se yo cuánto no se actualiza y hoy no lo puedo hacer andar, estaría el sqlserver o rserver, ellos creo que tienen más simple el colocar en un servidor (es mi impresión), y otro punto a favor de ellos es la posibilidad de editar código de distintas cosas, algo de lenguaje humano con títulos, texto, algo de ecuaciones, otra parte de un análisis estadístico y un gráfico, todo desde un mismo documento en una forma amigable a la vista. Por otro lado google y tensorflow es una apuesta interesante y con mucha publicidad, sin embargo esta semana leí parte de la documentación mi Microsoft que también ofrece su librería para redes neuronales, y lo comparan en algo de 10 o 15 veces respecto a la velocidad, aunque también vi unos videos saltando partes donde las herramientas para crear redes neuronales con tensorflow en forma gráfica son geniales, ellos colocaban y sacaban neuronas y veían como cambiaba el resultado en el reconocimiento de una imagen o números, y podían ver cuánto era la contribución de cada una en el resultado final y en forma gráfica (como si fuese la cuenta del supermercado colocando y sacando productos pero sin recalcular el entrenamiento y cálculos, solo al suma total). R es maduro, tiene de todo, pero es a mi impresión duro respecto a python, lo que en R se puede hacer de muchas formas y con varias librerías, como por ejemplo acomodar datos, pyr, dlpyr, etc y etc, en caso de python tienen menos posibilidades para realizar lo mismo, desconozco como es el resultado en cuándo demora en acomodar los datos para el posterior análisis, pero es mucho más simple para alguien que comienza tener una forma y muchos ejemplos con los mismos comandos que como es en R donde para algo simple muchas veces en la lista aparecen soluciones muy distantes una de otra. Javier Rubén Marcuzzi El 11 de noviembre de 2017, 8:51, Jesús Para Fernández < j.para.fernandez en hotmail.com> escribió:> Un offtopic para empezar el fin de semana. > > Acabo de entrar en kaggle, hacia tiempo que no lo hacia, y veo con > 'estupor' que practicamente la gente trabaja con python. > > Es cierto que la mayor parte de competiciones son usadas con redes > neuronales, donde python si tiene ventaja frente a R, pero me da miedo ver > como python para temas de machine learning parece estar ganando la > partida... > > ¿Opiniones? > > Obtener Outlook para Android<https://aka.ms/ghei36> > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
Lo de la multiplicidad de soluciones es algo interesante y de lo que más me gusta en R. A veces python resulta muy encasillado y no da la flexibilidad suficiente. Es cierto que entre muchas soluciones una es mejor que otra, pero en general cuando se empieza por R fácilmente se suele llegar a una solución (por lo menos se llega a una) y si se avanza y si le merece la pena, uno puede profundizar más. Debo admitir que la empresa privada, por causa en general de gente no estadística que primero aprendieron python están apostando más por esta tecnología que no está exenta de problema y que tiene sus fortalezas. Pero 2 puntos en los que yo, personal destaco a R sobre python es el entorno de desarrollo RStudio donde lo más parecido en Python (que yo conozca) es el PyCharm que se acerca pero no llega, y el entorno de desarrollo Shiny, que permite rápidamente montar una web sin conocer mucho de otras tecnologías donde lo más parecido en Python es el Flask que aunque da aspectos bastante amigables (en ocasiones mejores que el shiny) es mucho menos trivial en su uso. Otro punto que se ha destacado es que un lenguaje para Estadísticos (nota, no me gusta dividir el mundo entre data scientist y data ingeneers, es como si ahora hubieran desaparecido los estadísticos y los informáticos) esto tiene lo bueno de que los métodos en R ofrecen en general más riqueza de salida que los de python pero si no hay una mano "informática" por detrás, veo difícil que pueda retomar algunas batallas con éxito frente al mundo python como el tema deep learning y este punto es crucial si R quiere estar a la altura en un futuro. Un saludo ________________________________ De: R-help-es <r-help-es-bounces en r-project.org> en nombre de Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com> Enviado: sábado, 11 de noviembre de 2017 13:44 Para: Jesús Para Fernández Cc: r-help-es en r-project.org Asunto: Re: [R-es] Es todo python Estimados Antes de R, intenté algunas cosas con python, hablemos de más de 15 a anos (no me sale la letra en espannniiiol), yo estaba con le jefe de cátedra de genética y mejoramiento animal haciendo cosas con fortran y me pareció mucho más simple, luego encontré R y fue este para muchas cosas. Hace una semana o dos vi algo porque lo tiene visual studio y un conocido lo usa y le encanta. Leí sobre modelos mixtos, ellos incluso realizan referencia a la documentación de R, es algo de costumbre, pero profundizando los algoritmos de R tienen funcionalidades para los análisis que ellos no disponen, por otro lado me gustó la forma de colocar cosas, en otras palabras, si uno quiere conectar R con C# el R.dotnet hace que se yo cuánto no se actualiza y hoy no lo puedo hacer andar, estaría el sqlserver o rserver, ellos creo que tienen más simple el colocar en un servidor (es mi impresión), y otro punto a favor de ellos es la posibilidad de editar código de distintas cosas, algo de lenguaje humano con títulos, texto, algo de ecuaciones, otra parte de un análisis estadístico y un gráfico, todo desde un mismo documento en una forma amigable a la vista. Por otro lado google y tensorflow es una apuesta interesante y con mucha publicidad, sin embargo esta semana leí parte de la documentación mi Microsoft que también ofrece su librería para redes neuronales, y lo comparan en algo de 10 o 15 veces respecto a la velocidad, aunque también vi unos videos saltando partes donde las herramientas para crear redes neuronales con tensorflow en forma gráfica son geniales, ellos colocaban y sacaban neuronas y veían como cambiaba el resultado en el reconocimiento de una imagen o números, y podían ver cuánto era la contribución de cada una en el resultado final y en forma gráfica (como si fuese la cuenta del supermercado colocando y sacando productos pero sin recalcular el entrenamiento y cálculos, solo al suma total). R es maduro, tiene de todo, pero es a mi impresión duro respecto a python, lo que en R se puede hacer de muchas formas y con varias librerías, como por ejemplo acomodar datos, pyr, dlpyr, etc y etc, en caso de python tienen menos posibilidades para realizar lo mismo, desconozco como es el resultado en cuándo demora en acomodar los datos para el posterior análisis, pero es mucho más simple para alguien que comienza tener una forma y muchos ejemplos con los mismos comandos que como es en R donde para algo simple muchas veces en la lista aparecen soluciones muy distantes una de otra. Javier Rubén Marcuzzi El 11 de noviembre de 2017, 8:51, Jesús Para Fernández < j.para.fernandez en hotmail.com> escribió:> Un offtopic para empezar el fin de semana. > > Acabo de entrar en kaggle, hacia tiempo que no lo hacia, y veo con > 'estupor' que practicamente la gente trabaja con python. > > Es cierto que la mayor parte de competiciones son usadas con redes > neuronales, donde python si tiene ventaja frente a R, pero me da miedo ver > como python para temas de machine learning parece estar ganando la > partida... > > ¿Opiniones? > > Obtener Outlook para Android<https://aka.ms/ghei36> > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-esPágina de Información de R-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es> stat.ethz.ch Esta es una lista de correo para solicitar ayuda sobre R en español y se entiende como un complemento social a la documentación, libros, etc. disponibles sobre R ...>[[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es Página de Información de R-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es> stat.ethz.ch Esta es una lista de correo para solicitar ayuda sobre R en español y se entiende como un complemento social a la documentación, libros, etc. disponibles sobre R ... [[alternative HTML version deleted]]
---------- Forwarded message --------- From: José Luis Cañadas <canadasreche en gmail.com> Date: sáb., 11 nov. 2017 21:16 Subject: Re: [R-es] Es todo python To: Francisco Rodríguez <fjroar en hotmail.com> Cierto. Hay mucho Python por ahí fuera, ¿Y qué? Es software libre igual que R y funciona bien. También es cierto que R da más detalle de salida y más funcionalidades de cara a entender un modelo, por ejemplo para diagnosis de los residuos. Dicen que en esta era del bigdata, Python (y pyspark) es el futuro, pero yo no lo he hecho de menos teniendo R, sparkr, sparklyr y H2O y el gran repositorio de GitHub cloudyr para, por ejemplo, conectar R con googlecloud o los servicios de Amazon web services como Alexa o leer y escribir datos de S3 También comentan que en entornos de producción Python es mejor, la verdad que creo que R también puede competir ahi, utilizando librerías como opencpu, shiny o el ultra fácil plumber para hacer un API REST. Creo que hay mucho desconocimiento de herramientas de R para ponerlo en entornos productivos.. Como nota diré que R y particularmente los paquetes FactomineR y factoextra me han salvado la vida un par de veces cuando tenía datos con variables categóricas y tenía que hacer clustering u otras cosas raras de esas que piden los clientes. Muchas de estas técnicas no están implementadas en Python ni en spark, aunque sería fácil, solo es transformar un poco la matriz de datos antes de aplicar una descomposición en valores singulares. Lo dicho, a mí me gustan ambos lenguajes, aunque encuentro más sencillo R. Y para los que quieran usar cosas de Python dentro de R el paquete reticulate es fabuloso. Para temas de deeplearnig existe tensorflow y keras para R, sin olvidarnos del magnífico MxNet (de los chicos de xgboost) Un saludo y no olvidéis que el próximo jueves empiezan las jornadas de R hispano en Granada El sáb., 11 nov. 2017 16:16, Francisco Rodríguez <fjroar en hotmail.com> escribió:> Lo de la multiplicidad de soluciones es algo interesante y de lo que más > me gusta en R. A veces python resulta muy encasillado y no da la > flexibilidad suficiente. > > > Es cierto que entre muchas soluciones una es mejor que otra, pero en > general cuando se empieza por R fácilmente se suele llegar a una solución > (por lo menos se llega a una) y si se avanza y si le merece la pena, uno > puede profundizar más. > > > Debo admitir que la empresa privada, por causa en general de gente no > estadística que primero aprendieron python están apostando más por esta > tecnología que no está exenta de problema y que tiene sus fortalezas. > > > Pero 2 puntos en los que yo, personal destaco a R sobre python es el > entorno de desarrollo RStudio donde lo más parecido en Python (que yo > conozca) es el PyCharm que se acerca pero no llega, y el entorno de > desarrollo Shiny, que permite rápidamente montar una web sin conocer mucho > de otras tecnologías donde lo más parecido en Python es el Flask que aunque > da aspectos bastante amigables (en ocasiones mejores que el shiny) es mucho > menos trivial en su uso. > > > Otro punto que se ha destacado es que un lenguaje para Estadísticos (nota, > no me gusta dividir el mundo entre data scientist y data ingeneers, es como > si ahora hubieran desaparecido los estadísticos y los informáticos) esto > tiene lo bueno de que los métodos en R ofrecen en general más riqueza de > salida que los de python pero si no hay una mano "informática" por detrás, > veo difícil que pueda retomar algunas batallas con éxito frente al mundo > python como el tema deep learning y este punto es crucial si R quiere estar > a la altura en un futuro. > > > Un saludo > > > ________________________________ > De: R-help-es <r-help-es-bounces en r-project.org> en nombre de Javier > Marcuzzi <javier.ruben.marcuzzi en gmail.com> > Enviado: sábado, 11 de noviembre de 2017 13:44 > Para: Jesús Para Fernández > Cc: r-help-es en r-project.org > Asunto: Re: [R-es] Es todo python > > Estimados > > Antes de R, intenté algunas cosas con python, hablemos de más de 15 a anos > (no me sale la letra en espannniiiol), yo estaba con le jefe de cátedra de > genética y mejoramiento animal haciendo cosas con fortran y me pareció > mucho más simple, luego encontré R y fue este para muchas cosas. Hace una > semana o dos vi algo porque lo tiene visual studio y un conocido lo usa y > le encanta. Leí sobre modelos mixtos, ellos incluso realizan referencia a > la documentación de R, es algo de costumbre, pero profundizando los > algoritmos de R tienen funcionalidades para los análisis que ellos no > disponen, por otro lado me gustó la forma de colocar cosas, en otras > palabras, si uno quiere conectar R con C# el R.dotnet hace que se yo cuánto > no se actualiza y hoy no lo puedo hacer andar, estaría el sqlserver o > rserver, ellos creo que tienen más simple el colocar en un servidor (es mi > impresión), y otro punto a favor de ellos es la posibilidad de editar > código de distintas cosas, algo de lenguaje humano con títulos, texto, algo > de ecuaciones, otra parte de un análisis estadístico y un gráfico, todo > desde un mismo documento en una forma amigable a la vista. Por otro lado > google y tensorflow es una apuesta interesante y con mucha publicidad, sin > embargo esta semana leí parte de la documentación mi Microsoft que también > ofrece su librería para redes neuronales, y lo comparan en algo de 10 o 15 > veces respecto a la velocidad, aunque también vi unos videos saltando > partes donde las herramientas para crear redes neuronales con tensorflow en > forma gráfica son geniales, ellos colocaban y sacaban neuronas y veían como > cambiaba el resultado en el reconocimiento de una imagen o números, y > podían ver cuánto era la contribución de cada una en el resultado final y > en forma gráfica (como si fuese la cuenta del supermercado colocando y > sacando productos pero sin recalcular el entrenamiento y cálculos, solo al > suma total). R es maduro, tiene de todo, pero es a mi impresión duro > respecto a python, lo que en R se puede hacer de muchas formas y con varias > librerías, como por ejemplo acomodar datos, pyr, dlpyr, etc y etc, en caso > de python tienen menos posibilidades para realizar lo mismo, desconozco > como es el resultado en cuándo demora en acomodar los datos para el > posterior análisis, pero es mucho más simple para alguien que comienza > tener una forma y muchos ejemplos con los mismos comandos que como es en R > donde para algo simple muchas veces en la lista aparecen soluciones muy > distantes una de otra. > > Javier Rubén Marcuzzi > > El 11 de noviembre de 2017, 8:51, Jesús Para Fernández < > j.para.fernandez en hotmail.com> escribió: > > > Un offtopic para empezar el fin de semana. > > > > Acabo de entrar en kaggle, hacia tiempo que no lo hacia, y veo con > > 'estupor' que practicamente la gente trabaja con python. > > > > Es cierto que la mayor parte de competiciones son usadas con redes > > neuronales, donde python si tiene ventaja frente a R, pero me da miedo > ver > > como python para temas de machine learning parece estar ganando la > > partida... > > > > ¿Opiniones? > > > > Obtener Outlook para Android<https://aka.ms/ghei36> > > > > > > [[alternative HTML version deleted]] > > > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es en r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > Página de Información de R-help-es< > https://stat.ethz.ch/mailman/listinfo/r-help-es> > stat.ethz.ch > Esta es una lista de correo para solicitar ayuda sobre R en español y se > entiende como un complemento social a la documentación, libros, etc. > disponibles sobre R ... > > > > > > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > Página de Información de R-help-es< > https://stat.ethz.ch/mailman/listinfo/r-help-es> > stat.ethz.ch > Esta es una lista de correo para solicitar ayuda sobre R en español y se > entiende como un complemento social a la documentación, libros, etc. > disponibles sobre R ... > > > > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es[[alternative HTML version deleted]]
> El 11-11-2017, a las 08:51, Jesús Para Fernández <j.para.fernandez en hotmail.com> escribió: > > Acabo de entrar en kaggle, hacia tiempo que no lo hacia, y veo con 'estupor' que practicamente la gente trabaja con python. > > Es cierto que la mayor parte de competiciones son usadas con redes neuronales, donde python si tiene ventaja frente a R, pero me da miedo ver como python para temas de machine learning parece estar ganando la partida...¿Qué es «machine learning», qué es la estadística?¿Qué es python, qué es R? Yo creo que R fue concebido como un software para cómputo estadístico, con un poderoso motor gráfico. Sería raro que en un concurso estadístico, R no resultara victorioso. Los estadísticos somos su audiencia por excelencia, pero ahora hablan de ciencia de datos, que me parece aún un término un poquín difuso. python es un software de propósito general, popular entre computistas, informáticos, ingenieros y, como no, algunos estadísticos. No me alarma que, en grupos multidisciplinarios, un programa de propósito general resulte más útil que uno cuyo objetivo es particular. En mi percepción, la mayoría de las personas que participan en kaggle y similares, no son estadísticos de formación (cuestión que no invalida nada, por si acaso) y por eso no han estado tan expuestos a R y utilizan otras herramientas de mayor visibilidad, como python. Quién sabe cuánta razón tendré, pero no quiero ni pensar en el porcentaje que utilizan otros excelentes programas estadísticos, como stata o el mismísimo SAS, en este tipo de escenarios. En el mundo real, alejados de competiciones y ejercicios académicos, python funciona mejor para aglutinar los resultados que se van obteniendo en las distintas áreas. Esa ha sido mi experiencia. ¡Salud! [[alternative HTML version deleted]]