Buenos días, quisiera saber si existe algún paquete en R para procesamiento de texto, búsqueda de similitudes y ese tipo de cosas. He estado buscando pero no he encontrado nada al respecto. Gracias Un saludo [[alternative HTML version deleted]]
Hola Ma Luz, He trabajado con las siguientes opciones: stylo: https://sites.google.com/site/computationalstylistics/stylo tm: http://cran.r-project.org/web/packages/tm/index.html Espero te sirvan. Saludos cordiales, Jorge ? Velez JCSMR, Canberra 2015-07-07 19:14 GMT+10:00 MªLuz Morales <mlzmrls en gmail.com>:> Buenos días, > > quisiera saber si existe algún paquete en R para procesamiento de texto, > búsqueda de similitudes y ese tipo de cosas. He estado buscando pero no he > encontrado nada al respecto. > > Gracias > Un saludo > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
Hola, en relación al procesamiento de textos he visto que hay en r hispano un Grupo de interés temático en procesamiento del lenguaje natural con R (GITPLN), que está enfocado al procesamiento de textos en español. Es bastante interesante, me gustaría saber si se está utilizando actualmente. Gracias Un saludo El 7 de julio de 2015, 11:14, MªLuz Morales <mlzmrls en gmail.com> escribió:> Buenos días, > > quisiera saber si existe algún paquete en R para procesamiento de texto, > búsqueda de similitudes y ese tipo de cosas. He estado buscando pero no he > encontrado nada al respecto. > > Gracias > Un saludo >[[alternative HTML version deleted]]
Hola, También tienes el paquete "stringdist", que se aproxima bastante a los que has preguntado. http://cran.r-project.org/web/packages/stringdist/index.html stringdist: Approximate String Matching and String Distance Functions Implements an approximate string matching version of R's native 'match' function. Can calculate various string distances based on edits (damerau-levenshtein, hamming, levenshtein, optimal sting alignment), qgrams (q-gram, cosine, jaccard distance) or heuristic metrics (jaro, jaro-winkler). An implementation of soundex is provided as well. Y también por la variedad de funciones y posibilidades de análisis que ofrece puedes mirar "qDap": http://cran.r-project.org/web/packages/qdap/index.html qdap: Bridging the Gap Between Qualitative Data and Quantitative Analysis Automates many of the tasks associated with quantitative discourse analysis of transcripts containing discourse including frequency counts of sentence types, words, sentences, turns of talk, syllables and other assorted analysis tasks. The package provides parsing tools for preparing transcript data. Many functions enable the user to aggregate data by any number of grouping variables, providing analysis and seamless integration with other R packages that undertake higher level analysis and visualization of text. This affords the user a more efficient and targeted analysis. 'qdap' is designed for transcript analysis, however, many functions are applicable to other areas of Text Mining/Natural Language Processing. Saludos, Carlos Ortega www.qualityexcellence.es El 7 de julio de 2015, 11:14, MªLuz Morales <mlzmrls en gmail.com> escribió:> Buenos días, > > quisiera saber si existe algún paquete en R para procesamiento de texto, > búsqueda de similitudes y ese tipo de cosas. He estado buscando pero no he > encontrado nada al respecto. > > Gracias > Un saludo > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Hola, ¿qué tal? Lo del "grupo de interés temático" de procesamiento del lenguaje natural en español fue una iniciativa de la Comunidad R Hispano para tratar de juntar a los interesados en el asunto para que se conociesen y pudiesen trabajar juntos. Jamás despegó. La idea era que, igual que existen grupos locales (gente que trabaja en R en distintos temas y que se juntan periodicamente) podía haber grupos temáticos (gente que trabaja en un mismo tema pero que no están físicamente próximos). Hay dos temas interesantes para la comunidad de usuarios de R en España: 1) Herramientas para el lenguaje. Para el inglés ya hay muchas cosas hechas. El español es una lengua distinta y gran parte de lo existente para el inglés no es, en absoluto, trasladable. 2) Mapas. Insisto: ambas iniciativas están paradas desde hace años. Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com El día 7 de julio de 2015, 12:47, MªLuz Morales <mlzmrls en gmail.com> escribió:> Hola, > en relación al procesamiento de textos he visto que hay en r hispano un > Grupo de interés temático en procesamiento del lenguaje natural con R > (GITPLN), que está enfocado al procesamiento de textos en español. Es > bastante interesante, me gustaría saber si se está utilizando actualmente. > > Gracias > Un saludo > > El 7 de julio de 2015, 11:14, MªLuz Morales <mlzmrls en gmail.com> escribió: > >> Buenos días, >> >> quisiera saber si existe algún paquete en R para procesamiento de texto, >> búsqueda de similitudes y ese tipo de cosas. He estado buscando pero no he >> encontrado nada al respecto. >> >> Gracias >> Un saludo >> > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es