Gracias Kjetil Bronchmann Halvorsen
Si, usted tiene razón, yo cuándo leo los datos por primera vez realizo
plot(data.frame), y en algunas oportunidades aparecen cosas curiosas o
interesantes, luego algún test o conocimientos previos sobre la distribución
(modelo, etc.), sin embargo pienso que debe haber alguna forma donde
automáticamente analice los histogramas (data.frame), dando como resultado la
distribución más probable.
Pensé en esto porque charlando con un colega me comentaba que cambiando la
distribución obtenía diferencias (realizando ranef y fixef) y si los modelos son
dentro de lo aceptado estadísticamente y / o la diferencia entre estos es
pequeña, los modelos serían buenos, pero por ejemplo si es BLUP y nos interesa
dentro de los efectos aleatorios los animales y dentro de los fijos el
ambiente*tiempo, debemos estar muy seguros de la distribución utilizada (por lo
que me comentaba de las diferencias que observaba).
Hoy una de las preguntas era sobre como instalar pedigreemm, en este paquete uno
de los parámetros es la distribución, sin embargo en una discusión (no es esta
lista) decía que el paquete MCMCglmm que es útil para los mismos análisis que
pedigreemm (uno utiliza lme4 y otro estadística bayesiana) escribían y
demostraban con algunos ejemplos que no era muy importante conocer la
distribución, que ese era un concepto muy arraigado en quienes venimos de la
biología, que numéricamente es muy semejante.
Se me ocurrió ¿como hacer desde cero si no conozco nada al respecto?, y una de
mis preguntas fue ¿como conozco la distribución? Para lo cuál no es mala su
respuesta, realizo un histograma y comparo visualmente con gráficos de
distribuciones, pero no es lo mismo medir “a ojo o con una regla”.
En la línea de su respuesta encontré esta documentación
cran.r-project.org-doc-contrib-Ricci-distributions-en.pdf
Gracias
Javier
From: Kjetil brinchmann Halvorsen
Sent: Monday, March 26, 2012 9:20 PM
To: Marcuzzi, Javier Rubén
Cc: R-help-es@r-project.org
Subject: Re: [R-es] ?distribution
mire abajo.
On Mon, Mar 26, 2012 at 16:19, Marcuzzi, Javier Rubén
<javier.ruben.marcuzzi@gmail.com> wrote:
Hola a todos.
Se me presento una duda, no realizando un cálculo, es sin números para probar
algún modelo, es general.
Supongamos que hay una nueva investigación, los números medidos son ingresados
a un data.frame, y nuestra primer idea o paquete para un análisis implica dentro
de las opciones conocer la distribución, esta es alguna de las descriptas en:
?distribution
Ahora mi pregunta: ¿cuál es la forma más sencilla para conocer la distribución
sin tener otra información que los datos en un data.frame?
Sin conocer nada más que los números en el data frame puedes hacer muy poco.
Todos métodos estadísticos
dependen de algunos supuestos, como muestreo al azar. Pero suponiendo que los
datos vienen de muestreo aleatorio, un simple histograma dice mucho de la
distribición, asumiendo que el número de obs es grande. Si el número de
observaciones es pequeño, efectivamente necesitas usar métodos paramétricos, es
decir, necesitas tener alguna información afuera de los simples números acerca
de modelos de distribución plausibles. Sin saber algo más de tu fuente de
información es dificil decir mucho más que eso.
Kjetil
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
--
"If you want a picture of the future - imagine a boot stamping on the human
face - forever."
George Orwell (1984)
[[alternative HTML version deleted]]