Displaying 17 results from an estimated 17 matches for "duplicado".
Did you mean:
duplicados
2019 Apr 26
2
Crear nuevo dataframe y eliminar duplicados
...s columnas (A, B, C, D, E, F, G, H) de las que quiero quedarme solo con algunas (digamos C, D, E). Lo consigo mediante select(df, ?C?, ?D?, ?E?). Hasta ahí todo correcto.
Ahora no consigo ver como convertir el resultado en un nuevo dataframe con los datos que me interesan y como eliminar sus datos duplicados.
Espero haberme explicado bien.
Un saludo y gracias anticipadas
Jesús
2019 Feb 07
6
Optimización identificación de casos similares
...ectivo número de
documento, quiero identificar casos que tengan un porcentaje de igualdad
alto, no del 100% porque ya esos los tengo identificados, sino casos como
por ejemplo:
Nombre: Juan Pérez Documento: 123456789
Nombre: Juan Pérez Documento: 1234056789
Este caso sería una alerta de posible duplicado y tendría que revisarse
porque posiblemente en uno de los dos casos se ingreso errado el número de
documento.
Para calcular esta diferencia uso la función adist del paquete (utils), el
problema es que la forma en que tengo el código para revisar los 100.000
casos, la máquina no lo soporta por los...
2015 Mar 25
3
BUCLE
...uestra que no este duplicada.
Para hace lo descrito en el parrafo anterior uso el siguiente código:
a<-1
for (a in 1:30) {
data [a,]<-sample(MuestraS,replace=T)
if (sum(duplicated(data[1:a, ]))!=0){a<-a}
else {a<-a+1}
}
No esta haciendo lo que requiero, se detecta el duplicado pero la muestra
se generar y continua hasta llegar a 30 dejando el duplicado.
No se si deba usar el bucle for o deberia cambiar por un while, pero no lo
he podido lograr de ninguna de las dos formas.
Un saludo, agradezco su colaboración con el tema.
David C.
[[alternative HTML version deleted]...
2019 Jun 13
2
Problema de INSERT en Windows SQL
Pd: Perdón por el duplicado de mensaje, se me olvido poner el asunto al
anterior y me han surgido nuevas consultas.
Buenos días,
llevo unos dias peleando para realizar una consulta con INSERT en Windows
SQL. He probado varios paquetes de R y con ninguno lo he conseguido.
Ahora mismo estoy probando con DBI y odbc.
Probé con...
2011 Sep 27
1
problem with switch function across R versions 2.10 and 2.13
...ax"])
n <- c(n,"minimo no puede ser mayor que maximo") }, ,
stop(paste("Distribución",distr,"no reconocida.")) )
However, using R2.13 (under Windows), I get the following error:
Error en .local(x, distr, ...) :
duplicado de interuptores por defecto: '' y 'stop(paste...'
The 2.13 help on the function says the following:
In the case of no match, if there is a unnamed element of ... its value is returned. (If there is more than one such argument
an error is returned. Before R 2.13.0 the first one...
2016 Aug 05
2
¿Qué hace as.numeric()?
...mail.com> escribió:
> Estimado Mauricio Monsalvo
>
> ¿Puede usar esos datos importados a una base de datos? Por ejemplo en
> mysql un código como puede ser:
> SELECT email, COUNT(*) Total
> FROM clientes
> GROUP BY email
> HAVING COUNT(*) > 1
>
> Para buscar los duplicados (en este caso correos electrónicos), la idea es
> conocer las variables y cantidades, una vez que las conoce puede actualizar
> para ir normalizando los datos (desde el punto de vista de la base de
> datos). Luego solo tendría un problema, conocer los decimales, pero eso ya
> fue resue...
2012 May 31
7
problema al actualizar la versiòn de R
Estimados
Disculpen la ignorancia, probablemente ya lo hayan respondido, pero al
actualizar mi versiòn del programa y querer abrir un workspace creado
con la versiòn anterior 2.11.1, indica el siguiente error. No es posible
cargar el entorno de trabajo creado
Gracias por su ayuda, Alejandro
--
tel +54-+2944-422731 int 228 fax +54-+2944-424991 correo electrónico
almarti en
2020 Mar 28
5
Datos oficiales de COVID-19 en España
Hola a todos,
Por fin pude terminar de preparar la descarga y procesamiento de los datos
por edad y sexo. Ya están en el repositorio:
https://github.com/rubenfcasal/COVID-19
Ya puestos también incluí la descarga e importación de los datos acumulados
del ISCIII y actualicé las tablas en
https://rubenfcasal.github.io/COVID-19/COVID-19-tablas.html empleando el
paquete DT. Ahora tiene tres
2019 May 18
2
Identificar todos los repetidos y "marcarlos".
Hola,
Tengo la siguiente duda:
?existe algo parecido a identificar casos repetidos en R al estilo de como lo hace spss? (a?adiendo una nueva columna de datos y marcando los casos)
Estoy probando con "duplicated" pero no es lo que busco.
Gracias.
[[alternative HTML version deleted]]
2013 Dec 03
3
seleccionar columnas de un dataframe mediante variables
...de ordenación
p.pesos.ord<-p.pesos[,order(-criterio)] #Simbolo negativo para ordenar
de mayor a menor
#CREACION DE TABLA CON PORCENTAJOS
# 1) Cogemos los nombres de las columnas originales:
nombresColumna <- colnames(p.pesos.ord)
# 2) Le añadimos a cada nombre el sufijo _peso para evitar duplicados en
nombre de columna ;
nuevosNombresColumna <- paste(nombresColumna,'_peso')
# 3) Obtenemos las sumas por fila de los pesos por marea:
totalPesoMarea <- rowSums(p.pesos.ord)
# 4) Creamos un dataframe nuevo con los porcentajes de las columnas que
corresponda, que
# conservará los...
2016 Aug 05
2
¿Qué hace as.numeric()?
Muchas gracias, Fernando y Javier.
> pami$PP <- as.numeric(as.character(pami$PP))
Warning message:
NAs introduced by coercion
Y entonces los datos que antes convertía en labels(pami$PP) (v.g. 753,2256
a 61343 o
62,7688
? a
17390, que me pa eran enteros del 1 al n de clases como decía Fernando),
los convertía en NA.-
Luego de probar también con read.table, pasé a:
> pami <-
2016 Sep 03
2
igraph V a partir de E y subgrafos
...timados
Tengo un problema. Con igraph creo una red a partir de un data.frame, las dos primeras columnas son V y las restantes E. Hay un trabajo anterior, yo me pregunté ¿Qué pasaría si las cosas hablaran entre ellas?, entonces hay un cruce de información de todos contra todos y elimino los nulos y duplicados. Al ver los listados E, V tienen la información. Hasta ahí estaría todo bien (me interesa puntos o cosas que aporten información, no la información).
Ahora donde comienzan las complicaciones, conociendo una palabra (cosa) que está en E, quiero tener los V que la contienen. Ej, la relación A?B den...
2013 Dec 03
0
seleccionar columnas de un dataframe mediante variables
...os[,order(-criterio)] #Simbolo negativo para ordenar
> de mayor a menor
>
> #CREACION DE TABLA CON PORCENTAJOS
>
> # 1) Cogemos los nombres de las columnas originales:
> nombresColumna <- colnames(p.pesos.ord)
>
> # 2) Le añadimos a cada nombre el sufijo _peso para evitar duplicados
> en nombre de columna ; nuevosNombresColumna <-
> paste(nombresColumna,'_peso')
>
> # 3) Obtenemos las sumas por fila de los pesos por marea:
> totalPesoMarea <- rowSums(p.pesos.ord)
>
> # 4) Creamos un dataframe nuevo con los porcentajes de las columnas que
>...
2013 Dec 03
0
seleccionar columnas de un dataframe mediante variables
...menor
> >>
> >> #CREACION DE TABLA CON PORCENTAJOS
> >>
> >> # 1) Cogemos los nombres de las columnas originales:
> >> nombresColumna <- colnames(p.pesos.ord)
> >>
> >> # 2) Le añadimos a cada nombre el sufijo _peso para evitar
> duplicados
> >> en nombre de columna ; nuevosNombresColumna <-
> >> paste(nombresColumna,'_peso')
> >>
> >> # 3) Obtenemos las sumas por fila de los pesos por marea:
> >> totalPesoMarea <- rowSums(p.pesos.ord)
> >>
> >> # 4) Creamos...
2013 Dec 03
2
seleccionar columnas de un dataframe mediante variables
Hola a todos:
Rediela!!
Si hago la prueba con
rangoAnalisis<-c(110:120)
Funciona!!!
Pero como os comenté antes, no.
Ojo!!!
La idea es que tanto columnaInicial como columnaFinal son
números(índices) de columna!!! De hecho, haciendo el str() de estas
variables me indica que son del tipo num
Un saludo
El 03/12/13 13:41, Carlos J. Gil Bellosta escribió:
> Hola, ¿qué tal?
>
>
2010 Mar 30
5
limpieza datos
Hola
Me encuentro con un problema al manejar unos datos, estos son tomados de una
base de datos que tiene algunos errores, importaciones de programas viejos,
etc.
Básicamente son dos tablas, la primer tabla identifica al individuo, esta
tabla tiene valores mal ingresados.
La segunda tabla tiene mediciones.
Al buscar desde la tabla de mediciones a los individuos solo obtengo solo
los
2016 Aug 03
3
¿Qué hace as.numeric()?
Tranquilo que no te han hackeado tu "R"...
Simplemente que al importar tu CSV, no has indicado que los decimales son
las ",". Y ese campo lo importa como un character (un string). Y cuando lo
conviertes a numeric, el resultado es un tanto impredecible.
Si utilizas read.table para importar, simplemente incluye el parámetro
"dec" de esta forma "read.table(..... ,