Modalidad: Online
60 horas (6 sem)
Todo el año
Aplica una de las técnicas más populares en Machine Learning no supervisado: el análisis clúster jerárquico y no jerárquico (k-medias) con R Software. Encuentra grupos de observaciones (clústers) que comparten características similares y descubre patrones relevantes en grandes conjuntos de variables de manera rápida y sencilla.
El Curso de Machine Learning: análisis clúster con R, es un programa práctico impartido con la metodología exclusiva de Máxima Formación, 100% on-line y learn by doing (aprender haciendo).
¿Por qué es único?
Porque está diseñado con el enfoque práctico que requieren los profesionales del análisis de datos cuyo objetivo es transformar el saber en habilidades prácticas avanzadas con aplicación directa a su operativa con los datos.
Nuestro programa formativo con enfoque práctico:
- Garantiza una curva de aprendizaje progresiva y se adapta a tu nivel de desempeño.
- Pone el énfasis en el seguimiento diario de tus necesidades de aprendizaje particulares.
- Disfrutas de un asesoramiento de calidad que te permite aplicar los nuevos conocimientos, desde el primer día.
Tras finalizar esta formación recibirás un diploma expedido por Máxima Formación como garantía de aprovechamiento del curso.
100% on-line y learn by doing.
Marca tu propio ritmo de aprendizaje, donde y cuando quieras, de forma progresiva y con la flexibilidad que te ofrece nuestra metodología con evaluación continua:
- Tutorización personalizada. Con el apoyo individualizado de un docente comprometido con tus necesidades de aprendizaje. Consulta sin límites.
- Enfoque Learn by doing. Pon en práctica los nuevos conocimientos analizando casos reales completamente aplicables a tu realidad profesional.
- A tu ritmo. Aprende cuándo y dónde quieras, marca tu propio ritmo de aprendizaje, sin fechas ni plazos de entrega.
- Contenidos de calidad. Evoluciona paso a paso con materiales didácticos, actualizados y prácticos aplicables a tus proyectos profesionales.
- Evaluación continua. Basada en el apoyo individualizado del alumno para garantizar la comprensión de conceptos y su capacidad técnica para resolver los ejercicios propuestos.
- Recursos. Materiales audiovisuales, guías prácticas y bibliografía complementaria, para ir más allá en tu desempeño.
Para acceder a este curso, no se establece ningún requisito.
Destinatarios
Para profesionales del análisis de datos interesados en integrar técnicas de Machine Learning en sus proyectos y profundizar en las técnicas de análisis de agrupación (análisis clúster).
Un curso práctico orientado a estudiantes, profesionales, investigadores y PhD interesados en:
- Conocer los fundamentos del preprocesado de datos.
- Conocer las aplicaciones de los diferentes análisis clúster.
- Dominar el análisis clúster de partición por k-medias y el jerárquico.
- Interpretar dendrogramas.
- Aprender a validar agrupaciones por calidad y por estabilidad.
- Reconocer patrones en los datos con técnicas de Machine Learning no supervisado.
- Crear gráficos de alta calidad para comunicar los resultados de los análisis.
Al finalizar el Curso de Machine Learning: análisis clúster con R serás capaz de:
- Reconocer patrones en los datos automáticamente, sin la necesidad de agrupaciones previas (Machine Learning no supervisado).
- Analizar y representar gráficamente las relaciones entre múltiples variables creando grupos homogéneos de observaciones.
- Interpretar y validar tus hallazgos para apoyar la toma de decisiones en tu organización o investigación.
- Dominar el lenguaje estadístico de R Software, una de las competencias profesionales más demandadas en el mercado laboral de la Ciencia de Datos.
CURSO DE NIVEL INTERMEDIO
Para un mejor aprovechamiento de la formación es recomendable tener conocimientos básicos previos sobre R Software.
TEMA 1. INTRODUCCIÓN AL ANÁLISIS CLUSTER Y AL PREPROCESADO DE DATOS.
- ¿Qué es y para qué sirve el análisis cluster?
- Diferencias entre cluster jerárquico y de partición.
- Procedimiento de análisis.
- Exploración y preprocesado de los datos con R.
- Medidas de similitud/distancia.
- Tendencia de agrupación.
TEMA 2. ANÁLISIS CLÚSTER DE PARTICIÓN POR K-MEDIAS
- Introducción al análisis cluster de partición.
- Ventajas, desventajas y algoritmos alternativos.
- ¿Cómo funciona el algoritmo de k-medias?
- Análisis de k-medias con R.
- Interpretación de los grupos.
- Gráficos elegantes y avanzados.
- Predicción de nuevos casos.
TEMA 3. ANÁLISIS CLUSTER JERÁRQUICO
- Introducción al análisis clúster jerárquico.
- Cluster aglomerativo vs divisivo.
- Ventajas, desventajas y alternativas.
- Métodos de vinculación entre grupos. ¿Cómo elegir el mejor método?
- Análisis AGNES con R.
- Interpretación del árbol de agrupación (dendrograma).
- ¿Cuántos grupos elegir?
- Gráficos elegantes y avanzados.
- Personalizar y guardar gráficos.
- El cuarteto de Anscombe.
TEMA 4. VALIDACIÓN DE LA AGRUPACIÓN
- Validación de la agrupación por calidad y estabilidad.
- Medidas de calidad externa.
- Medidas de calidad interna.
- Medidas de calidad relativa.
- Medidas de estabilidad.
- ¿Cómo elegir el mejor método y el número de grupos óptimo?
- Conclusiones finales. Limitaciones del análisis clúster.
Claustro docente
El seguimiento personalizado es uno de nuestros puntos fuertes.
En este Máster contarás con el asesoramiento y las tutorías ilimitadas de dos docentes expertos que van compartir contigo todo su conocimiento y su experiencia en el sector de la Ciencia de Datos:
Rosana Ferrero
Data Scientist con más de 10 años de experiencia en consultoría, investigación y docencia.Colabora en proyectos de diversos centros de investigación como el Consejo Superior de Investigaciones Científicas (CSIC), CAPES-PUC, IAS-CSIC y LINCGlobal. Asesora y consultora en Biomáxima.
Juan Luis López
Analista de datos con certificaciones en Data Visualization with ggplot2, Data Analysis in R y Machine Learning Toolbox.