Estimados me ha surgido una duda con un simple stem and leaf el mismo es el siguiente:> stem.leaf(Datos$ej1.21)1 | 2: represents 0.12 leaf unit: 0.01 n: 40 LO: 0.72 0.85 3 10 | 9 11 | 4 12 | 4 5 13 | 7 7 14 | 710 (*) 9 15 | 18 16 16 | 3447899 (6) 17 | 045599 (***) 18 18 | 2568 14 19 | 23710 (**) 10 20 | 389 7 21 | 17 5 22 | 8 4 23 | 17 2 24 | 6 1 25 | 5 NA''s: 20 Los datos ordenados son: 0,72 0,85 1,09 1,24 1,37 1,40 1,47 1,51 1,58 1,63 1,64 1,64 1,67 1,68 1,69 1,69 1,70 1,74 1,75 1,75 1,79 1,79 1,82 1,85 1,86 1,88 1,90 1,92 1,93 1,97 2,03 2,08 2,09 2,11 2,17 2,28 2,31 2,37 2,46 2,55 tambien tineen 20 NAs Tengo dos dudas, 1) Porque en la linea (*) y en la (**) toma al valor 1,40 y al valor 1,90 como 14|10 y 19|10 y para el caso de (***) toma el valor 1,70 como 17|0. 2) Que cálculos realiza el comando stem.leaf para decir que un valor es un outliers? me detecta haciendo un boxplot el valor 2,55 como un outliers y con el stem-leaf no. Desde ya muchas gracias. Saludos [[alternative HTML version deleted]]
No estoy segura por que hace eso, pero no es lo que hace en la versión R 2.8.1, habría que ver en los cambios a la versión R 2.9 si es un cambio deseado o por error, cuando pueda leer con un poco más de tiempo el código de stem.leaf te confirmo. Gabriela. ----- Original Message ----- From: "Mauro Alexis" <mauroalexis en gmail.com> To: <r-help-es en r-project.org> Sent: Monday, August 10, 2009 2:50 PM Subject: [R-es] Pregunta sencilla Estimados me ha surgido una duda con un simple stem and leaf el mismo es el siguiente:> stem.leaf(Datos$ej1.21)1 | 2: represents 0.12 leaf unit: 0.01 n: 40 LO: 0.72 0.85 3 10 | 9 11 | 4 12 | 4 5 13 | 7 7 14 | 710 (*) 9 15 | 18 16 16 | 3447899 (6) 17 | 045599 (***) 18 18 | 2568 14 19 | 23710 (**) 10 20 | 389 7 21 | 17 5 22 | 8 4 23 | 17 2 24 | 6 1 25 | 5 NA's: 20 Los datos ordenados son: 0,72 0,85 1,09 1,24 1,37 1,40 1,47 1,51 1,58 1,63 1,64 1,64 1,67 1,68 1,69 1,69 1,70 1,74 1,75 1,75 1,79 1,79 1,82 1,85 1,86 1,88 1,90 1,92 1,93 1,97 2,03 2,08 2,09 2,11 2,17 2,28 2,31 2,37 2,46 2,55 tambien tineen 20 NAs Tengo dos dudas, 1) Porque en la linea (*) y en la (**) toma al valor 1,40 y al valor 1,90 como 14|10 y 19|10 y para el caso de (***) toma el valor 1,70 como 17|0. 2) Que cálculos realiza el comando stem.leaf para decir que un valor es un outliers? me detecta haciendo un boxplot el valor 2,55 como un outliers y con el stem-leaf no. Desde ya muchas gracias. Saludos [[alternative HTML version deleted]] -------------------------------------------------------------------------------- _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es ___________________________________________________________________________ Aviso: ==== El contenido del presente e-mail y sus posibles adjuntos pertenecen al INTA y pueden contener información confidencial. Si usted no es el destinatario original de este mensaje y por este medio pudo acceder a dicha información, por favor solicitamos contactar al remitente y eliminar el mensaje de inmediato. Se encuentra prohibida la divulgación, copia, distribución o cualquier otro uso de la información contenida en el presente e-mail por parte de personas distintas al destinatario. This e-mail contents and its possible attachments belong to INTA and may contain confidential information. If this message was not originally addressed to you, but you have accessed to such information by this means, please contact the sender and eliminate this message immediately. Circulation, copy, distribution, or any other use of the information contained in this e-mail is not allowed on part of those different from the addressee. Antes de imprimir este mensaje, asegúrese de que sea necesario. Proteger el medio ambiente está también en su mano.
Hola: En el código de stem.leaf de la versión R 2.9.1 las hojas se determinan así:> leaf <- floor(10 * abs(signif(data.tr.red - stem, 10)))Que en tus datos serían:> leaf[1] 9 4 7 10 7 1 8 3 4 4 7 8 9 9 0 4 5 5 9 9 2 5 6 8 10 2 3 7 3 8 [31] 9 1 7 8 1 7 6 5 se pueden ver las hojas 10, en el código de la version R 2.8.1 era:> leaf <- floor(abs(data.tr.red * 10 - stem * 10)) > leaf[1] 9 3 7 9 7 1 8 2 4 4 7 7 9 9 0 4 5 5 9 9 2 5 6 7 9 2 2 7 2 8 9 0 7 7 0 7 5 4>obtenemos el diagrama de tallo y hoja al que estamos más acostumbraos, en este momento no tengo tiempo de leer la documentación "What''s New" de la versión R 2.9.1 para ver si sale algo sobre este cambio o sólo es un error, si alguien tiene tiempo .... Gabriela ______________________________ Lic. María Gabriela Cendoya Magíster en Biometría Profesor Adjunto Cátedra de Estadística y Diseño Facultad de Ciencias Agrarias Universidad Nacional de Mar del Plata ______________________________ ----- Original Message ----- From: Mauro Alexis To: Gabriela Cendoya Sent: Monday, August 10, 2009 4:21 PM Subject: Re: [R-es] Pregunta sencilla Ok gracias aclaro que la versión de R con la cual trabajo es: R 2.9.1 Saludos y nuevamente gracias El 10 de agosto de 2009 16:21, Gabriela Cendoya <gcendoya@balcarce.inta.gov.ar> escribió: No estoy segura por que hace eso, pero no es lo que hace en la versión R 2.8.1, habría que ver en los cambios a la versión R 2.9 si es un cambio deseado o por error, cuando pueda leer con un poco más de tiempo el código de stem.leaf te confirmo. Gabriela. ----- Original Message ----- From: "Mauro Alexis" <mauroalexis@gmail.com> To: <r-help-es@r-project.org> Sent: Monday, August 10, 2009 2:50 PM Subject: [R-es] Pregunta sencilla Estimados me ha surgido una duda con un simple stem and leaf el mismo es el siguiente: stem.leaf(Datos$ej1.21) 1 | 2: represents 0.12 leaf unit: 0.01 n: 40 LO: 0.72 0.85 3 10 | 9 11 | 4 12 | 4 5 13 | 7 7 14 | 710 (*) 9 15 | 18 16 16 | 3447899 (6) 17 | 045599 (***) 18 18 | 2568 14 19 | 23710 (**) 10 20 | 389 7 21 | 17 5 22 | 8 4 23 | 17 2 24 | 6 1 25 | 5 NA''s: 20 Los datos ordenados son: 0,72 0,85 1,09 1,24 1,37 1,40 1,47 1,51 1,58 1,63 1,64 1,64 1,67 1,68 1,69 1,69 1,70 1,74 1,75 1,75 1,79 1,79 1,82 1,85 1,86 1,88 1,90 1,92 1,93 1,97 2,03 2,08 2,09 2,11 2,17 2,28 2,31 2,37 2,46 2,55 tambien tineen 20 NAs Tengo dos dudas, 1) Porque en la linea (*) y en la (**) toma al valor 1,40 y al valor 1,90 como 14|10 y 19|10 y para el caso de (***) toma el valor 1,70 como 17|0. 2) Que cálculos realiza el comando stem.leaf para decir que un valor es un outliers? me detecta haciendo un boxplot el valor 2,55 como un outliers y con el stem-leaf no. Desde ya muchas gracias. Saludos [[alternative HTML version deleted]] -------------------------------------------------------------------------------- _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es ___________________________________________________________________________ Aviso: ==== El contenido del presente e-mail y sus posibles adjuntos pertenecen al INTA y pueden contener información confidencial. Si usted no es el destinatario original de este mensaje y por este medio pudo acceder a dicha información, por favor solicitamos contactar al remitente y eliminar el mensaje de inmediato. Se encuentra prohibida la divulgación, copia, distribución o cualquier otro uso de la información contenida en el presente e-mail por parte de personas distintas al destinatario. This e-mail contents and its possible attachments belong to INTA and may contain confidential information. If this message was not originally addressed to you, but you have accessed to such information by this means, please contact the sender and eliminate this message immediately. Circulation, copy, distribution, or any other use of the information contained in this e-mail is not allowed on part of those different from the addressee. Antes de imprimir este mensaje, asegúrese de que sea necesario. Proteger el medio ambiente está también en su mano. [[alternative HTML version deleted]] ___________________________________________________________________________ Aviso: =El contenido del presente e-mail y sus posibles adjuntos pertenecen al INTA y pueden contener informacisn confidencial. Si usted no es el destinatario original de este mensaje y por este medio pudo acceder a dicha informacisn, por favor solicitamos contactar al remitente y eliminar el mensaje de inmediato. Se encuentra prohibida la divulgacisn, copia, distribucisn o cualquier otro uso de la informacisn contenida en el presente e-mail por parte de personas distintas al destinatario. This e-mail contents and its possible attachments belong to INTA and may contain confidential information. If this message was not originally addressed to you, but you have accessed to such information by this means, please contact the sender and eliminate this message immediately. Circulation, copy, distribution, or any other use of the information contained in this e-mail is not allowed on part of those different from the addressee. Antes de imprimir este mensaje, asegzrese de que sea necesario. Proteger el medio ambiente esta tambiin en su mano.
Creo que la pregunta sencilla no era tan sencilla, Yo, no entiendo porque cambia el comportamiento de la función "floor" Siguiendo el código de stem.leaf, se llega a la construcción de tallos a través del uso de la función "floor" en un vector que ha generado luego de manipular los datos originales, y que llama data.tr.red, para simpificar les muestro sólo las primeras 4 coordenadas,> data.tr.red[1:4][1] 10.9 12.4 13.7 14.0> floor(data.tr.red[1:4])[1] 10 12 13 13> floor(c(10.9, 12.4, 13.7,14.0))[1] 10 12 13 14 la acción de floor cambia en la última coordenada a pesar de que parece que le estamos pidiendo que actúe sobre exactamente el mismo vector, seguramente alguna propiedad de "data.tr.red" que no tiene la simple concatenación de esos número esta produciendo ese cambio, pero no puedo encontrar cuál es la diferencia. pero este cambio hace que la hoja que corresponde al 14.0 sea 10 y no 0, produciendo así el error que se observa en el gráfico de tallo y hoja, cada vez estoy más convencida que es un bug a una propiedad deseable, alguien quiere chequearlo antes de hacer un reporte? Gabriela. ______________________________ Lic. María Gabriela Cendoya Magíster en Biometría Profesor Adjunto Cátedra de Estadística y Diseño Facultad de Ciencias Agrarias Universidad Nacional de Mar del Plata ______________________________ ----- Original Message ----- From: "Mauro Alexis" <mauroalexis en gmail.com> To: <r-help-es en r-project.org> Sent: Monday, August 10, 2009 2:50 PM Subject: [R-es] Pregunta sencilla Estimados me ha surgido una duda con un simple stem and leaf el mismo es el siguiente:> stem.leaf(Datos$ej1.21)1 | 2: represents 0.12 leaf unit: 0.01 n: 40 LO: 0.72 0.85 3 10 | 9 11 | 4 12 | 4 5 13 | 7 7 14 | 710 (*) 9 15 | 18 16 16 | 3447899 (6) 17 | 045599 (***) 18 18 | 2568 14 19 | 23710 (**) 10 20 | 389 7 21 | 17 5 22 | 8 4 23 | 17 2 24 | 6 1 25 | 5 NA's: 20 Los datos ordenados son: 0,72 0,85 1,09 1,24 1,37 1,40 1,47 1,51 1,58 1,63 1,64 1,64 1,67 1,68 1,69 1,69 1,70 1,74 1,75 1,75 1,79 1,79 1,82 1,85 1,86 1,88 1,90 1,92 1,93 1,97 2,03 2,08 2,09 2,11 2,17 2,28 2,31 2,37 2,46 2,55 tambien tineen 20 NAs Tengo dos dudas, 1) Porque en la linea (*) y en la (**) toma al valor 1,40 y al valor 1,90 como 14|10 y 19|10 y para el caso de (***) toma el valor 1,70 como 17|0. 2) Que cálculos realiza el comando stem.leaf para decir que un valor es un outliers? me detecta haciendo un boxplot el valor 2,55 como un outliers y con el stem-leaf no. Desde ya muchas gracias. Saludos [[alternative HTML version deleted]] -------------------------------------------------------------------------------- _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es ___________________________________________________________________________ Aviso: ==== El contenido del presente e-mail y sus posibles adjuntos pertenecen al INTA y pueden contener información confidencial. Si usted no es el destinatario original de este mensaje y por este medio pudo acceder a dicha información, por favor solicitamos contactar al remitente y eliminar el mensaje de inmediato. Se encuentra prohibida la divulgación, copia, distribución o cualquier otro uso de la información contenida en el presente e-mail por parte de personas distintas al destinatario. This e-mail contents and its possible attachments belong to INTA and may contain confidential information. If this message was not originally addressed to you, but you have accessed to such information by this means, please contact the sender and eliminate this message immediately. Circulation, copy, distribution, or any other use of the information contained in this e-mail is not allowed on part of those different from the addressee. Antes de imprimir este mensaje, asegúrese de que sea necesario. Proteger el medio ambiente está también en su mano.