TÉCNICAS AVANZADAS DE REGRESIÓN EN CIENCIAS NATURALES Y SU APLICACIÓN CON R

Profesor: Luis M. Carrascal 
(Profesor de Investigación, CSIC) Museo Nacional de Ciencias Naturales 

Temario:
ASPECTOS GENERALES (asignable a muchos de los modelos que se presentarán) .

1) Distribuciones, transformaciones y funciones de vínculo con las principales familias (Gaussiana, 
Gamma, Poisson, Binomial Negativa, Binomial, Frecuencial). Tipos de variables predictoras: covariantes y factores, efectos fijos y aleatorios.
2) Análisis de supuestos canónicos: exploración de los residuos de los modelos, linealidad de efectos, multicolinearidad de variables (índices VIF), puntos influyentes y perdidos, sobredispersión. 
3) Poder explicativo y predictivo de los modelos: devianza explicada, partición de la variación en la respuesta (magnitud de efectos parciales), validación cruzada (crossvalidation).
4) Robustez de los resultados: estimas robustas, parametrización por re-muestreo con reemplazo de los datos originales (bootstrapping).
5) Diferentes aproximaciones para la estima de significación. Correcciones “quasi” teniendo en cuenta la sobredispersión. Estimadores HC (heteroskedasticity corrected) para corregir el efecto de la heterocedasticidad de los residuos del modelo. 
6) Generación de hipótesis nulas a partir de los propios datos. 
7) Corrigiendo patrones de auto-correlación en los residuos (modelos GLS, generalised Least Squares): auto-correlación temporal y espacial. 
8) Significación vs. fuerza de la evidencia basada en el criterio de información de Akaike. Comparación rigurosa de modelos competidores. Inferencia multimodelos. 


TIPOS DE MODELOS DE ANÁLISIS
1) Modelos generalizados con conteos: regresiones de Poisson. 
2) Distribuciones “aumentadas” de ceros: regresión binomial negativa; Hurdle regression para distribuciones infladas de ceros. 
3) Variables respuesta nominales: regresiones lógit, logística y multinomiales ordinales (proportional odds regression). Diagramas ROC y criterio AUC. 
4) Cuando las relaciones entre las variables predictoras y la respuesta no son lineales: modelos generalizados aditivos (GAM); “atajo” en modelo GLM usando transformaciones polinomiales (centrado de variables). 
5) Gestionando la auto-correlación temporal, espacial: modelos GLS.
6) Solventando el problema de la alta correlación entre las variables predictoras: modelos PLS (“Partial Least Square regressions”). 
7) Heterogeneidad en las sociaciones respuesta – predictores: regresión de quantiles.



Programa:
Objetivo: presentar teórica y prácticamente técnicas de regresión avanzadas y su aplicación a las ‘ciencias naturales’ (sensu lato). 

Desarrollo del curso: 
Se pondrá el énfasis en los principales aspectos teóricos que permitan una buena praxis en la inferencia estadística orientada a la obtención de patrones y al test de hipótesis utilizando un amplio espectro de herramientas estadísticas disponibles y bien contrastadas. El curso va dirigido a investigadores y personal científico-técnico (asentado y en formación) con experiencia previa con la estadística (i.e., equivalente a una licenciatura o ingeniería). Su motivación es incrementar los conocimientos y facilitar el uso práctico y buen desempeño de la estadística, de manera que puede considerarse como un curso “avanzado”. 
Todo el desarrollo práctico del curso se efectuará usando el entorno de trabajo R, utilizando más de una decena de paquetes disponibles ampliamente contrastados. Los paquetes y el entorno R son la herramienta con la que los asistentes al curso se familiarizarán y acabarán pudiendo utilizar de modo rutinario, pero R no es en sí mismo la meta docente y académica del curso. Los conocimientos impartidos podrán ser aplicados trabajando con cualquier otra plataforma de análisis estadístico (SAS, SPSS, GRETL, STATISTICA, etc). 
No es necesario tener conocimientos previos de R, pero es muy recomendable tener cierta experiencia previa. Además de la presentación teórica de los aspectos del curso, el profesor irá mostrando el uso de R según se vayan introduciendo las diferentes técnicas y conceptos estadísticos. Previamente al inicio del curso, se enviarán a los alumnos instrucciones y archivos para su instalación. 
El curso tendrá una fuerte componente práctica (80%), que será combinada simultáneamente con la parte teórica (20%). Por tanto, los alumnos deberán acudir al curso con su ordenador portátil. 



Dirigido a:
INSCRIPCIONES: Los candidatos deberán enviar a la Secretaría de la Sociedad de Amigos del Museo CORREO: mcnc104@mncn.csic.es una página donde expongan los motivos por los que se desea realizar este curso, así como una síntesis del trabajo de investigación o técnico que están desarrollando. Se tendrá en cuenta el orden de llegada de las candidaturas. También deberán aportar su correo electrónico para agilizar la comunicación

Fecha

  • Lunes, 17 Febrero 2020
  • Viernes, 28 Febrero 2020

Horario

17, 18, 19, 20, 21, 24, 25, 26, 27, 28 de Febrero de 2020.

De 15:30 – 19:45 h

Ubicación

Sala de juntas del Museo Nacional de Ciencias Naturales

Plazas

20

Tarifas

340 €

Inscripción