Eric
2021-Feb-19 15:28 UTC
[R-es] acerca de cómo se calculan los PDP para un random forest ...
Hola chicos, cómo van ? espero q todos bien, aquí en Chile con cuarentena muy prolongada por el covid, así es que mientras estoy encerrado forzosamente trato de aprender algunas cosas nuevas. Estoy dándole una mirada y jugando con R y algunos paquetes para machine learning, he usado random forest para un caso real de estimación del desarrollo de ciertas capacidades en los niños a partir de las condiciones de crianza, como la calidad del hogar y algunas aptitudes de la madre. Ahora estoy tratando de entender cómo funciona la idea de los Partial Dependence Plots para explicar la influencia de un subconjunto de predictores sobre la vble dependiente y estoy revisando el artículo de Brandon M. Greenwell llamado pdp: An R Package for Constructing Partial Dependence Plots (lo encuentran en este enlace https://journal.r-project.org/archive/2017/RJ-2017-016/RJ-2017-016.pdf, ya que es muy grande para adjuntarlo al correo) ... llegado a la ecuación 2 quisiera saber cómo se lee/interpreta correctamente el término después del primer signo = . Entiendo la idea general de los PDP, pero quisiera una comprensión al detalle y he estado muchos años lejos de la matemática ... "E" supongo que es la esperanza, y Ezc, imagino es la esperanza de lo q está dentro del paréntesis cuadrado calculada sobre el subconjunto zc ... luego, "f con el acento circunflejo" es la función de predicción, y aquí viene mi mayor duda, cómo se lee f(zs,zc) ? ... f(zc) es simple, no? pero cómo se interpreta "f" con zs y zc dentro ? es el producto de f(zs) y f(zc) ? es la suma de la función de predicción de ambos términos ? qué es ? ... luego el mismo término aparece en la sumatoria de la ec. 3, así es q mejor tratar de entenderlo, no ? Adjunto una imagen del texto donde aparecen la ecuación para seguir más fácilmente mi preguntas ... muchas gracias por su ayuda. Eric. ------------ próxima parte ------------ Se ha borrado un adjunto en formato HTML... URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20210219/01dc8b3e/attachment-0001.html> ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: ppndldgmcnlkghlg.png Type: image/png Size: 113670 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20210219/01dc8b3e/attachment-0001.png>