carrera de posgrado

Estadística Multivariada

Inferencia multivariada, reducción de la dimensionalidad y técnicas de clasificación (supervisadas y no supervisadas)


FUNDAMENTACIÓN

La enseñanza de la estadística en la modalidad a distancia se sustenta en los beneficios que las tecnologías de la información y la comunicación (TIC) pueden brindar. Los estudiantes tienen acceso a una amplia variedad de recursos y materiales de aprendizaje: videos, lecturas, ejercicios interactivos, bases de datos y software especializado, etc. constituyendo un soporte didáctico provechoso para afrontar las dificultades que se presentan en la comprensión de ciertos conceptos. Respecto a la Estadística Multivariada, aunque surge alrededor de 1930, es en las últimas décadas que las técnicas de análisis multivariado han experimentado una amplia aceptación y uso en numerosas áreas científicas. Esto se debe al aumento en el uso generalizado de computadoras, lo que ha permitido la utilización de programas que implementan dichas técnicas. En la investigación de Ciencias Naturales, a menudo se maneja un conjunto extenso de variables aleatorias que pueden presentar diferentes niveles y estructuras de correlación que deben tenerse en cuenta al analizar su comportamiento. El uso del análisis univariado en estos casos solo permite obtener conclusiones aisladas y no permite estudiar simultáneamente las relaciones entre las variables en estudio. Para las y los profesionales que buscan investigar en ciencias aplicadas, las técnicas multivariadas son una herramienta fundamental para expresar, interpretar e inferir sobre el comportamiento interrelacionado de las variables involucradas en cualquier proceso.


    Generale

  • Proporcionar conocimientos básicos del análisis multivariado para el manejo y análisis de un conjunto de datos. Comprender sus fundamentos teóricos y la aplicación en un software estadístico para la resolución de problemas prácticos.


  • Específicos.
    Al finalizar el módulo, las y los estudiantes deberán:

  • Explorar y comprender la complejidad de los datos que involucran más de una variable.

  • Lograr la reducción de la dimensión de los datos para facilitar la interpretación de los mismos.

  • Aplicar los distintos métodos exploratorios de clasificación y ordenamiento.

  • Establecer criterios para la aplicación de distintas metodologías de Inferencia Multivariada.

  • Hacer uso de la tecnología actual a través de softwares estadísticos apropiados.

  • Interpretar trabajos en los que se han aplicado técnicas estadísticas multivariadas.


  • Unidad 1:
    Introducción. Algunos ejemplos de aplicación de técnicas de análisis multivariado. Organización de la información. Estadísticos descriptivos: vector de media, matrices de variancias y covariancias y de correlación. Distancias. Distribución Normal Multivariada. Estudio del supuesto de normalidad.

  • Unidad 2:
    Inferencia con datos multivariados. Distribuciones de probabilidad multivariadas: la normal k dimensional, distribución de Wishart, T2 de Hotelling. Test de hipótesis para el vector de medias y la matriz de variancias y covariancias de una población normal multivariada.

  • Unidad 3:
    Análisis de Medidas repetidas. Introducción, objetivos y ejemplos. Estudio de las distintas estructuras de la matriz de varianzas y covarianzas. Modelos mixtos para mediciones repetidas en el tiempo. Ejemplos de aplicación.

  • Unidad 4:
    Componentes principales. Introducción y objetivos. Componentes principales poblacionales y muestrales. Interpretación de los componentes principales. Ejemplos de aplicación.

  • Unidad 5:
    Técnicas de clasificación no supervisadas. Introducción, objetivos y ejemplos. Agrupamientos (clustering) jerárquicos y no jerárquicos. Ejemplos de aplicación.

  • Unidad 6:
    Técnicas de clasificación supervisadas. Regresión logística. Árboles de clasificación (CART). Support Vector Machine (SVM). Ejemplos de aplicación.


    El curso será dictado en modalidad a distancia a través de la plataforma “Carreras y Cursos”, del Campus Virtual del Sistema de Educación a Distancia (SIED) de la Universidad Nacional de Rosario.

    La propuesta dispone de materiales y recursos de diseño multimedial que posibilitan el acceso a los contenidos de manera asincrónica, atendiendo a la organización autónoma de tiempos y espacios de aprendizaje.

    Las clases se desarrollarán en forma teórico-prácticas, y la solución de problemas se hará a través del uso del software estadístico R y la plataforma que sustenta al aula virtual.

    Las clases prácticas tendrán como objetivo la resolución de problemas propuestos con datos en los cuales las y los estudiantes deberán hallar la técnica estadística que mejor responda y se adapte a los objetivos planteados en cada caso. Asimismo, para lograr esta tarea, el estudiantado contará con un tutorial sobre el software utilizado para cada tipo de análisis que se llevará a cabo y trabajará en la confección de programas en el software R que les permitirá tomar las decisiones pertinentes sobre los datos.

    Los contenidos en el aula estarán organizados en unidades temáticas por tópicos. Estas unidades se desarrollarán durante las semanas de dictado de acuerdo al cronograma presentado, dejando accesible el material semanal de cada apartado de acuerdo con lo programado.

    Las clases teóricas asincrónicas se llevarán a cabo mediante videos y tutoriales confeccionados por el equipo docente donde se desarrollen los contenidos y las aplicaciones en problemas biológicos. Además, se dispondrá de materiales de estudios documentados y los archivos de datos necesarios para la parte práctica.

    Para garantizar una comunicación interactiva entre cada docente y las y los estudiantes, como medio de carácter sincrónico (videoconferencia), se utilizará la plataforma institucional establecida. Los encuentros sincrónicos quedarán grabados y estarán disponibles en el aula desde el día posterior al mismo. Se realizan 2 encuentros sincrónicos por semana con el objetivo de responder preguntas e interactuar con las y los estudiantes recorriendo los temas de cada unidad. La duración de los mismos será de 2 horas. Se deberá cumplir con un 75% de asistencia obligatoria. Los encuentros sincrónicos serán grabados y publicados en el aula virtual. Podrán acreditar asistencia quienes visualicen las grabaciones de los encuentros y completen las actividades asociadas que permitan acreditar los saberes que se impartieron en los mismos.

    Las consultas a través del foro estarán habilitadas durante todo el curso.

Semana

Contenidos

Descripción

Carga Horaria

Modalidad

1

Unidad 1. Teoría

Introducción. Generalidades del análisis multivariado.

3

Asincrónicas

1

Unidad 2. Teoría y práctica

Test de hipótesis para el vector de medias y la matriz de variancias y covariancias de una población normal multivariada.

4

Asincrónicas

1

Unidad 3. Teoría y práctica

Análisis de medidas repetidas.

Modelos mixtos para mediciones repetidas en el tiempo. Ejemplos de aplicación

4

Asincrónicas

1

2 Encuentros sincrónicos

4

Sincrónicas

2

Unidad 4. Teoría y práctica

Componentes principales. Componentes principales poblacionales y muestrales. Interpretación de las componentes principales.

Ejemplos de aplicación.

4

Asincrónicas

2

Unidad 5. Teoría y práctica

Técnicas de clasificación no supervisadas. Introducción, objetivos y ejemplos. Agrupamientos (clustering) jerárquicos y no jerárquicos.

Ejemplos de aplicación.

3

Asincrónicas

2

Unidad 6. Teoría y práctica

Técnicas de clasificación supervisadas. Regresión logística. Árboles de clasificación (CART). Support Vector Machine (SVM).

Ejemplos de aplicación.

4

Asincrónicas

2

2 Encuentros sincrónicos

4

Sincrónicas

3

Práctica integradora. Unidades 3 y 4

8

Asincrónicas

3

Práctica integradora. Unidades 5 y 6

8

Asincrónicas

3

2 Encuentros sincrónicos

4

Sincrónicas

Trabajo final

 


    La evaluación consta de un trabajo donde los estudiantes deberán aplicar una de las técnicas multivariadas abordadas en el curso sobre un conjunto de datos propio o bien un conjunto de datos extraídos de un repositorio digital de acceso abierto. Deberán realizar la entrega dentro del período informado por la o el docente mediante la actividad “Tarea” disponible en la plataforma. Los participantes deberán obtener como mínimo 6 (seis) sobre 10 (diez) puntos para aprobar el curso.


    Celina Beltrán
    Es licenciada en Estadística por la Facultad de Ciencias Económicas y Estadística de la Universidad Nacional de Rosario (2000). Realizó la maestría en Estadística Aplicada en la Facultad de Ciencias Económicas y Estadística de la UNR (2004), cuya tesis se tituló: “Modelos para series de tiempo estacionales” y fue dirigida por la Magister María Teresa Blaconá. Realizó el doctorado en Humanidades y Artes, con mención en Lingüística en la UNR (2008), cuya tesis se tituló: “Modelización lingüística e información estadística en el análisis automático de textos” y fue dirigida por el Dr. Gabriel G. Bés. Realizó el posdoctorado en la UNR, Modalidad PROYECTO, y el proyecto se tituló: “Análisis y clasificación automática de textos mediante la utilización de técnicas estadísticas multivariadas” (2014).
    Categorización en el Programa de Incentivos de la U.N.R: Categoría II
    Antecedentes docentes: es profesor adjunto en la cátedra de Estadística de la Facultad de Ciencias Agrarias, UNR; es docente del doctorado en Ciencias Agrarias, Especialización en Bioinformática y Especialización en producción Animal Sustentable en la Facultad de Ciencias Agrarias de la UNR; es docente del doctorado en Antropología en la UNR.
    Publicaciones: La estadística en la investigación. Elementos básicos y aplicaciones. Beltrán,C; Barbona, I. Ediciones Del Revés. Rosario. (2016); Introducción al análisis estadístico en la investigación. Con aplicaciones en distintas disciplinas. Beltrán, C. Ediciones Juglaría. Rosario. (2012); Modelización lingüística y análisis estadístico en el análisis automático de textos. Beltrán, C. Ediciones Juglaría. Rosario. (2009). Elementos de estadística descriptiva e Inferencial (con aplicaciones a las ciencias Agrarias). Giubileo, M.G; Bisaro, V.; Trevizán, A.; Dalla Marta, N.; Cosolito, P.; Beltrán, C. Ediciones Juglaría. Rosario. (2005). Introducción al diseño y análisis de experimentos con aplicación a las Ciencias Agrarias. Giubileo, M.G; Bisaro, V.; Trevizán, A.; Cosolito, P.; Beltrán, C. Ediciones Juglaría. Rosario. (2006). Problemas de estadística descriptiva e inferencial con aplicación a las Ciencias Agrarias. Barbona, I.; Beltrán, C.; Cosolito, P. Macat, P.; Trevizan, A. Ediciones Juglaría. Rosario. (2013).


UNIDAD ACADÉMICA DE PROCEDENCIA

Facultad de Ciencias Agrarias



RESOLUCIÓN DE APROBACIÓN

C.D. Nº 637/23


DESTINADO A:

Cursantes de los doctorados de la Facultad de Ciencias Agrarias, ingenieras e ingenieros agrónomos, licenciadas y licenciados en Biotecnología, médicas y médicos veterinarios, biólogas, biólogos y carreras afines a la Bioinformática.


REQUISITOS DE ADMISIÓN:

Estar realizando un doctorado de la Facultad de Ciencias Agrarias, ser ingenieras o ingenieros agrónomos, tener una licenciatura en Biotecnología, ser médicas o médicos veterinarios, biólogas o biólogos y pertenecer a carreras afines a la Bioinformática.


FECHAS

EN CURSO

Inicio de cursado: 04 de noviembre de 2024

 

DURACIÓN

3 semanas
Carga horaria total: 50 horas; 12 horas sincrónicas y 38 horas asincrónicas.


Curso de Posgrado con otorgamiento de créditos

Modalidad On line  

El dictado del curso se desarrollará a través de la plataforma Moodle del Campus Virtual de la UNR.

 

Cupo

Mínimo: 5
Máximo: 50


COSTO

5 créditos

Información sobre el costo de cada crédito:
https://fcagr.unr.edu.ar/calendario-posgrado/



INSCRIPCIÓN

Formulario de inscripción

Para mayor información
[email protected]

 


 





CONTACTO


Sistema Institucional de Educación a Distancia
Campus Virtual
Universidad Nacional de Rosario


Maipú 1065 – 2º piso - Of. 214 - Rosario - Argentina

 

Mesa de Ayuda Carreras y Cursos