Hola, Eric.
Tu recuerdo iba bien encaminado.
Lo que ha ocurrido es que R ha creado variables *dummy* con los factores
que has introducido en tu modelo. De esta forma el valor del coeficiente
"intercept", la constante, sería la media de los valores de referencia
de
ambas variables, que en este caso serían "f" y "u"
(precisamente los
niveles que no ves en tu output, ya que se crean k - 1 variables *dummy*,
siendo k el número de niveles de cada variable).
Creo que la mejor forma de que entiendas qué significa esto a la hora de
interpretar tu modelo es haciendo el ejercicio de estimar nuevas
predicciones con esos datos.
Si te fijas, en tu modelo se han calculado cuatro coeficientes, el
"intercept" y los tres coeficientes correspondientes a las tres
variables
dummy creadas, de forma que el modelo quedaría así:
complect(x) = B0 + B1*x(m) + B2*x(par) + B3*x(pp)
En este caso, al tratarse de variables cualitativas (factores), la x no
representa una cantidad, sino una cualidad, es decir, las características
concretas del individuo, que o están presentes o no lo están. Si está
presente, le asignamos un 1 y si no, un 0.
Por tanto, si un individuo es "f" y "u", entonces su
puntuación en
"complect" se estimaría así (dejando aparte las transformaciones
pertinentes):
complect = B0 + B1*0(m) + B2*0(par) + B3*0(pp)
es decir, complect = 0.51438
Si quisieses estimar la puntuación de alguien que tiene los niveles
"f" y
"par", lo harías así:
complect = B0 + B1*0(m) + B2*1(par) + B3*0(pp)
es decir, complect = 0.51438 - 0.01438
Si fuese alguien con los niveles "m" y "pp" sería:
complect = B0 + B1*1(m) + B2*0(par) + B3*1(pp)
es decir, complect = 0.51438 - 0.00515 - 0.01308
Y así sucesivamente.
Espero haberme explicado bien.
Por cierto, puedes ver cuáles son los niveles de referencia con la función
"contrasts". E incluso cambiarlos, en caso de que quieras un grupo
control
distinto al que tienes ahora.
Saludos.
Jose Ignacio
2017-11-16 4:01 GMT+01:00 eric <ericconchamunoz en gmail.com>:
> Estimada comunidad, tengo una pregunta cuya respuesta no he podido
> encontrar en la internet ... resulta que estoy usando GLM en R para ajustar
> un modelo a unos datos de comprension lectora y tengo dudas con la salida
> que me da R. Obtengo la siguiente salida y la pregunta es por el
> significado de la letra justo fuera del parentesis del nombre del factor en
> la tabla de coeficientes. Por ejemplo, aparece "factor(sex)m" ...
esa "m"
> (que es uno de los niveles del factor, el otro es "f"), que
significa ahi ?
> alguna vez lei (pero no puedo encontrarlo para estar seguro) que esa letra
> mostraba el nivel que se ha ajustado primero y que se ha fijado para
> calcular el beta ... o algo asi, es un recuerdo muy vago el que tengo ...
> en el caso de "factor(proceduc)" hay 3 niveles: par, pp, y u. La
pregunta
> es la misma, que implican para la interpretacion de la tabla el hecho de
> que par y pp aparezcan fuera del parentesis.
>
> Muchas gracias por su ayuda desinteresada en tiempos en que todo es
> interes,
>
> Eric.
>
>
>
> Call:
> glm(formula = complect ~ factor(sexo) + factor(proceduc), family >
Gamma(link = "inverse"))
>
> Deviance Residuals:
> Min 1Q Median 3Q Max
> -0.62774 0.00000 0.00259 0.00259 0.46758
>
> Coefficients:
> Estimate Std. Error t value Pr(>|t|)
> (Intercept) 0.51438 0.02294 22.426 <2e-16 ***
> factor(sexo)m -0.00515 0.02470 -0.208 0.835
> factor(proceduc)par -0.01438 0.04488 -0.320 0.750
> factor(proceduc)pp -0.01308 0.02511 -0.521 0.604
> ---
> Signif. codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1
>
> (Dispersion parameter for Gamma family taken to be 0.03571761)
>
> Null deviance: 3.2601 on 81 degrees of freedom
> Residual deviance: 3.2489 on 78 degrees of freedom
> AIC: 87.93
>
> Number of Fisher Scoring iterations: 4
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
[[alternative HTML version deleted]]