search for: duplicado

Displaying 17 results from an estimated 17 matches for "duplicado".

Did you mean: duplicados
2019 Apr 26
2
Crear nuevo dataframe y eliminar duplicados
...s columnas (A, B, C, D, E, F, G, H) de las que quiero quedarme solo con algunas (digamos C, D, E). Lo consigo mediante select(df, ?C?, ?D?, ?E?). Hasta ahí todo correcto. Ahora no consigo ver como convertir el resultado en un nuevo dataframe con los datos que me interesan y como eliminar sus datos duplicados. Espero haberme explicado bien. Un saludo y gracias anticipadas Jesús
2019 Feb 07
6
Optimización identificación de casos similares
...ectivo número de documento, quiero identificar casos que tengan un porcentaje de igualdad alto, no del 100% porque ya esos los tengo identificados, sino casos como por ejemplo: Nombre: Juan Pérez Documento: 123456789 Nombre: Juan Pérez Documento: 1234056789 Este caso sería una alerta de posible duplicado y tendría que revisarse porque posiblemente en uno de los dos casos se ingreso errado el número de documento. Para calcular esta diferencia uso la función adist del paquete (utils), el problema es que la forma en que tengo el código para revisar los 100.000 casos, la máquina no lo soporta por los...
2015 Mar 25
3
BUCLE
...uestra que no este duplicada. Para hace lo descrito en el parrafo anterior uso el siguiente código: a<-1 for (a in 1:30) { data [a,]<-sample(MuestraS,replace=T) if (sum(duplicated(data[1:a, ]))!=0){a<-a} else {a<-a+1} } No esta haciendo lo que requiero, se detecta el duplicado pero la muestra se generar y continua hasta llegar a 30 dejando el duplicado. No se si deba usar el bucle for o deberia cambiar por un while, pero no lo he podido lograr de ninguna de las dos formas. Un saludo, agradezco su colaboración con el tema. David C. [[alternative HTML version deleted]...
2019 Jun 13
2
Problema de INSERT en Windows SQL
Pd: Perdón por el duplicado de mensaje, se me olvido poner el asunto al anterior y me han surgido nuevas consultas. Buenos días, llevo unos dias peleando para realizar una consulta con INSERT en Windows SQL. He probado varios paquetes de R y con ninguno lo he conseguido. Ahora mismo estoy probando con DBI y odbc. Probé con...
2011 Sep 27
1
problem with switch function across R versions 2.10 and 2.13
...ax"])                       n <- c(n,"minimo no puede ser mayor que maximo") },                  ,         stop(paste("Distribución",distr,"no reconocida.")) ) However, using R2.13 (under Windows), I get the following error: Error en .local(x, distr, ...) :   duplicado de interuptores por defecto: '' y 'stop(paste...' The 2.13 help on the function says the following: In the case of no match, if there is a unnamed element of ... its value is returned. (If there is more than one such argument an error is returned. Before R 2.13.0 the first one...
2016 Aug 05
2
¿Qué hace as.numeric()?
...mail.com> escribió: > Estimado Mauricio Monsalvo > > ¿Puede usar esos datos importados a una base de datos? Por ejemplo en > mysql un código como puede ser: > SELECT email, COUNT(*) Total > FROM clientes > GROUP BY email > HAVING COUNT(*) > 1 > > Para buscar los duplicados (en este caso correos electrónicos), la idea es > conocer las variables y cantidades, una vez que las conoce puede actualizar > para ir normalizando los datos (desde el punto de vista de la base de > datos). Luego solo tendría un problema, conocer los decimales, pero eso ya > fue resue...
2012 May 31
7
problema al actualizar la versiòn de R
Estimados Disculpen la ignorancia, probablemente ya lo hayan respondido, pero al actualizar mi versiòn del programa y querer abrir un workspace creado con la versiòn anterior 2.11.1, indica el siguiente error. No es posible cargar el entorno de trabajo creado Gracias por su ayuda, Alejandro -- tel +54-+2944-422731 int 228 fax +54-+2944-424991 correo electrónico almarti en
2020 Mar 28
5
Datos oficiales de COVID-19 en España
Hola a todos, Por fin pude terminar de preparar la descarga y procesamiento de los datos por edad y sexo. Ya están en el repositorio: https://github.com/rubenfcasal/COVID-19 Ya puestos también incluí la descarga e importación de los datos acumulados del ISCIII y actualicé las tablas en https://rubenfcasal.github.io/COVID-19/COVID-19-tablas.html empleando el paquete DT. Ahora tiene tres
2019 May 18
2
Identificar todos los repetidos y "marcarlos".
Hola, Tengo la siguiente duda: ?existe algo parecido a identificar casos repetidos en R al estilo de como lo hace spss? (a?adiendo una nueva columna de datos y marcando los casos) Estoy probando con "duplicated" pero no es lo que busco. Gracias. [[alternative HTML version deleted]]
2013 Dec 03
3
seleccionar columnas de un dataframe mediante variables
...de ordenación p.pesos.ord<-p.pesos[,order(-criterio)] #Simbolo negativo para ordenar de mayor a menor #CREACION DE TABLA CON PORCENTAJOS # 1) Cogemos los nombres de las columnas originales: nombresColumna <- colnames(p.pesos.ord) # 2) Le añadimos a cada nombre el sufijo _peso para evitar duplicados en nombre de columna ; nuevosNombresColumna <- paste(nombresColumna,'_peso') # 3) Obtenemos las sumas por fila de los pesos por marea: totalPesoMarea <- rowSums(p.pesos.ord) # 4) Creamos un dataframe nuevo con los porcentajes de las columnas que corresponda, que # conservará los...
2016 Aug 05
2
¿Qué hace as.numeric()?
Muchas gracias, Fernando y Javier. > pami$PP <- as.numeric(as.character(pami$PP)) Warning message: NAs introduced by coercion Y entonces los datos que antes convertía en labels(pami$PP) (v.g. 753,2256 a 61343 o 62,7688 ? a 17390, que me pa eran enteros del 1 al n de clases como decía Fernando), los convertía en NA.- Luego de probar también con read.table, pasé a: > pami <-
2016 Sep 03
2
igraph V a partir de E y subgrafos
...timados Tengo un problema. Con igraph creo una red a partir de un data.frame, las dos primeras columnas son V y las restantes E. Hay un trabajo anterior, yo me pregunté ¿Qué pasaría si las cosas hablaran entre ellas?, entonces hay un cruce de información de todos contra todos y elimino los nulos y duplicados. Al ver los listados E, V tienen la información. Hasta ahí estaría todo bien (me interesa puntos o cosas que aporten información, no la información). Ahora donde comienzan las complicaciones, conociendo una palabra (cosa) que está en E, quiero tener los V que la contienen. Ej, la relación A?B den...
2013 Dec 03
0
seleccionar columnas de un dataframe mediante variables
...os[,order(-criterio)] #Simbolo negativo para ordenar > de mayor a menor > > #CREACION DE TABLA CON PORCENTAJOS > > # 1) Cogemos los nombres de las columnas originales: > nombresColumna <- colnames(p.pesos.ord) > > # 2) Le añadimos a cada nombre el sufijo _peso para evitar duplicados > en nombre de columna ; nuevosNombresColumna <- > paste(nombresColumna,'_peso') > > # 3) Obtenemos las sumas por fila de los pesos por marea: > totalPesoMarea <- rowSums(p.pesos.ord) > > # 4) Creamos un dataframe nuevo con los porcentajes de las columnas que &gt...
2013 Dec 03
0
seleccionar columnas de un dataframe mediante variables
...menor > >> > >> #CREACION DE TABLA CON PORCENTAJOS > >> > >> # 1) Cogemos los nombres de las columnas originales: > >> nombresColumna <- colnames(p.pesos.ord) > >> > >> # 2) Le añadimos a cada nombre el sufijo _peso para evitar > duplicados > >> en nombre de columna ; nuevosNombresColumna <- > >> paste(nombresColumna,'_peso') > >> > >> # 3) Obtenemos las sumas por fila de los pesos por marea: > >> totalPesoMarea <- rowSums(p.pesos.ord) > >> > >> # 4) Creamos...
2013 Dec 03
2
seleccionar columnas de un dataframe mediante variables
Hola a todos: Rediela!! Si hago la prueba con rangoAnalisis<-c(110:120) Funciona!!! Pero como os comenté antes, no. Ojo!!! La idea es que tanto columnaInicial como columnaFinal son números(índices) de columna!!! De hecho, haciendo el str() de estas variables me indica que son del tipo num Un saludo El 03/12/13 13:41, Carlos J. Gil Bellosta escribió: > Hola, ¿qué tal? > >
2010 Mar 30
5
limpieza datos
Hola Me encuentro con un problema al manejar unos datos, estos son tomados de una base de datos que tiene algunos errores, importaciones de programas viejos, etc. Básicamente son dos tablas, la primer tabla identifica al individuo, esta tabla tiene valores mal ingresados. La segunda tabla tiene mediciones. Al buscar desde la tabla de mediciones a los individuos solo obtengo solo los
2016 Aug 03
3
¿Qué hace as.numeric()?
Tranquilo que no te han hackeado tu "R"... Simplemente que al importar tu CSV, no has indicado que los decimales son las ",". Y ese campo lo importa como un character (un string). Y cuando lo conviertes a numeric, el resultado es un tanto impredecible. Si utilizas read.table para importar, simplemente incluye el parámetro "dec" de esta forma "read.table(..... ,