search for: duplicados

Displaying 17 results from an estimated 17 matches for "duplicados".

2019 Apr 26
2
Crear nuevo dataframe y eliminar duplicados
...s columnas (A, B, C, D, E, F, G, H) de las que quiero quedarme solo con algunas (digamos C, D, E). Lo consigo mediante select(df, ?C?, ?D?, ?E?). Hasta ahí todo correcto. Ahora no consigo ver como convertir el resultado en un nuevo dataframe con los datos que me interesan y como eliminar sus datos duplicados. Espero haberme explicado bien. Un saludo y gracias anticipadas Jesús
2019 Feb 07
6
Optimización identificación de casos similares
...mDoc2"]<-0* *ii<-1* *for(ii in 1:(nrow(Citacion)-1)){* * jj<-ii+1* * while(jj<=nrow(Citacion)){* * if (adist(Citacion[ii,"NombreDoc"], Citacion[jj,"NombreDoc"])/nchar(Citacion[ii,"NombreDoc"])<0.15){ # Criterio para marcar los posibles casos duplicados* * Citacion[ii,"RNomDoc1"]<-1* * Citacion[jj,"RNomDoc2"]<-1* * jj<-jj+1* * } else {* * Citacion[jj,"RNomDoc2"]<-0* * jj<-jj+1* * } * * } * *} * La idea es optimizar el código de alguna forma para agilizar el p...
2015 Mar 25
3
BUCLE
Buena noche a todos, Nuevamente requiero de su ayuda con algo puntual: 1. Tengo en el vector Muestras: rm(list = ls()) set.seed(2085089)# Fija Datos data<-matrix(-1,30,ncol=10) > MuestraS [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [1,] 1 0 0 0 1 1 0 1 1 1 Ahora, dentro de un bucle for voy a generar muestras aleatorias, pero requiero que
2019 Jun 13
2
Problema de INSERT en Windows SQL
Pd: Perdón por el duplicado de mensaje, se me olvido poner el asunto al anterior y me han surgido nuevas consultas. Buenos días, llevo unos dias peleando para realizar una consulta con INSERT en Windows SQL. He probado varios paquetes de R y con ninguno lo he conseguido. Ahora mismo estoy probando con DBI y odbc. Probé con dbSendStatementy al ejecutar la consulta:
2011 Sep 27
1
problem with switch function across R versions 2.10 and 2.13
Hello, The following piece of code works fine in R.2.10 (ubuntu): switch(distr,         normal    = {if (is.infinite(param["desv"]))                      n <- c(n,"La desv. estándar no puede ser Inf.")                    if (param["desv"]<0)                      n <- c(n,"La desv. estándar no puede ser <0.")                    },        
2016 Aug 05
2
¿Qué hace as.numeric()?
...mail.com> escribió: > Estimado Mauricio Monsalvo > > ¿Puede usar esos datos importados a una base de datos? Por ejemplo en > mysql un código como puede ser: > SELECT email, COUNT(*) Total > FROM clientes > GROUP BY email > HAVING COUNT(*) > 1 > > Para buscar los duplicados (en este caso correos electrónicos), la idea es > conocer las variables y cantidades, una vez que las conoce puede actualizar > para ir normalizando los datos (desde el punto de vista de la base de > datos). Luego solo tendría un problema, conocer los decimales, pero eso ya > fue resuel...
2012 May 31
7
problema al actualizar la versiòn de R
Estimados Disculpen la ignorancia, probablemente ya lo hayan respondido, pero al actualizar mi versiòn del programa y querer abrir un workspace creado con la versiòn anterior 2.11.1, indica el siguiente error. No es posible cargar el entorno de trabajo creado Gracias por su ayuda, Alejandro -- tel +54-+2944-422731 int 228 fax +54-+2944-424991 correo electrónico almarti en
2020 Mar 28
5
Datos oficiales de COVID-19 en España
Hola a todos, Por fin pude terminar de preparar la descarga y procesamiento de los datos por edad y sexo. Ya están en el repositorio: https://github.com/rubenfcasal/COVID-19 Ya puestos también incluí la descarga e importación de los datos acumulados del ISCIII y actualicé las tablas en https://rubenfcasal.github.io/COVID-19/COVID-19-tablas.html empleando el paquete DT. Ahora tiene tres
2019 May 18
2
Identificar todos los repetidos y "marcarlos".
Hola, Tengo la siguiente duda: ?existe algo parecido a identificar casos repetidos en R al estilo de como lo hace spss? (a?adiendo una nueva columna de datos y marcando los casos) Estoy probando con "duplicated" pero no es lo que busco. Gracias. [[alternative HTML version deleted]]
2013 Dec 03
3
seleccionar columnas de un dataframe mediante variables
...de ordenación p.pesos.ord<-p.pesos[,order(-criterio)] #Simbolo negativo para ordenar de mayor a menor #CREACION DE TABLA CON PORCENTAJOS # 1) Cogemos los nombres de las columnas originales: nombresColumna <- colnames(p.pesos.ord) # 2) Le añadimos a cada nombre el sufijo _peso para evitar duplicados en nombre de columna ; nuevosNombresColumna <- paste(nombresColumna,'_peso') # 3) Obtenemos las sumas por fila de los pesos por marea: totalPesoMarea <- rowSums(p.pesos.ord) # 4) Creamos un dataframe nuevo con los porcentajes de las columnas que corresponda, que # conservará los n...
2016 Aug 05
2
¿Qué hace as.numeric()?
Muchas gracias, Fernando y Javier. > pami$PP <- as.numeric(as.character(pami$PP)) Warning message: NAs introduced by coercion Y entonces los datos que antes convertía en labels(pami$PP) (v.g. 753,2256 a 61343 o 62,7688 ? a 17390, que me pa eran enteros del 1 al n de clases como decía Fernando), los convertía en NA.- Luego de probar también con read.table, pasé a: > pami <-
2016 Sep 03
2
igraph V a partir de E y subgrafos
...timados Tengo un problema. Con igraph creo una red a partir de un data.frame, las dos primeras columnas son V y las restantes E. Hay un trabajo anterior, yo me pregunté ¿Qué pasaría si las cosas hablaran entre ellas?, entonces hay un cruce de información de todos contra todos y elimino los nulos y duplicados. Al ver los listados E, V tienen la información. Hasta ahí estaría todo bien (me interesa puntos o cosas que aporten información, no la información). Ahora donde comienzan las complicaciones, conociendo una palabra (cosa) que está en E, quiero tener los V que la contienen. Ej, la relación A?B dent...
2013 Dec 03
0
seleccionar columnas de un dataframe mediante variables
...os[,order(-criterio)] #Simbolo negativo para ordenar > de mayor a menor > > #CREACION DE TABLA CON PORCENTAJOS > > # 1) Cogemos los nombres de las columnas originales: > nombresColumna <- colnames(p.pesos.ord) > > # 2) Le añadimos a cada nombre el sufijo _peso para evitar duplicados > en nombre de columna ; nuevosNombresColumna <- > paste(nombresColumna,'_peso') > > # 3) Obtenemos las sumas por fila de los pesos por marea: > totalPesoMarea <- rowSums(p.pesos.ord) > > # 4) Creamos un dataframe nuevo con los porcentajes de las columnas que >...
2013 Dec 03
0
seleccionar columnas de un dataframe mediante variables
...menor > >> > >> #CREACION DE TABLA CON PORCENTAJOS > >> > >> # 1) Cogemos los nombres de las columnas originales: > >> nombresColumna <- colnames(p.pesos.ord) > >> > >> # 2) Le añadimos a cada nombre el sufijo _peso para evitar > duplicados > >> en nombre de columna ; nuevosNombresColumna <- > >> paste(nombresColumna,'_peso') > >> > >> # 3) Obtenemos las sumas por fila de los pesos por marea: > >> totalPesoMarea <- rowSums(p.pesos.ord) > >> > >> # 4) Creamos...
2013 Dec 03
2
seleccionar columnas de un dataframe mediante variables
Hola a todos: Rediela!! Si hago la prueba con rangoAnalisis<-c(110:120) Funciona!!! Pero como os comenté antes, no. Ojo!!! La idea es que tanto columnaInicial como columnaFinal son números(índices) de columna!!! De hecho, haciendo el str() de estas variables me indica que son del tipo num Un saludo El 03/12/13 13:41, Carlos J. Gil Bellosta escribió: > Hola, ¿qué tal? > >
2010 Mar 30
5
limpieza datos
Hola Me encuentro con un problema al manejar unos datos, estos son tomados de una base de datos que tiene algunos errores, importaciones de programas viejos, etc. Básicamente son dos tablas, la primer tabla identifica al individuo, esta tabla tiene valores mal ingresados. La segunda tabla tiene mediciones. Al buscar desde la tabla de mediciones a los individuos solo obtengo solo los
2016 Aug 03
3
¿Qué hace as.numeric()?
Tranquilo que no te han hackeado tu "R"... Simplemente que al importar tu CSV, no has indicado que los decimales son las ",". Y ese campo lo importa como un character (un string). Y cuando lo conviertes a numeric, el resultado es un tanto impredecible. Si utilizas read.table para importar, simplemente incluye el parámetro "dec" de esta forma "read.table(..... ,