Modalidad: Online
60 horas (6 sem)
Todo el año
Detecta los patrones clave en tus conjuntos de datos e identifica qué variables contribuyen en mayor medida a su variabilidad. Simplifica y representar de manera óptima un conjunto de múltiples variables numéricas, correlacionadas entre sí, mediante Data Mining de reducción de la dimensión.
El Curso de Análisis Análisis de componentes principales (PCA) con R, es un programa práctico impartido con la metodología exclusiva de Máxima Formación, 100% on-line y learn by doing (aprender haciendo).
¿Por qué es único?
Porque está diseñado con el enfoque práctico que requieren los profesionales del análisis de datos cuyo objetivo es transformar el saber en habilidades prácticas avanzadas con aplicación directa a su operativa con los datos.
Nuestro programa formativo con enfoque práctico:
- Garantiza una curva de aprendizaje progresiva y se adapta a tu nivel de desempeño.
- Pone el énfasis en el seguimiento diario de tus necesidades de aprendizaje particulares.
- Disfrutas de un asesoramiento de calidad que te permite aplicar los nuevos conocimientos, desde el primer día.
Tras finalizar esta formación recibirás un diploma expedido por Máxima Formación como garantía de aprovechamiento del curso.
100% on-line y learn by doing.
Marca tu propio ritmo de aprendizaje, donde y cuando quieras, de forma progresiva y con la flexibilidad que te ofrece nuestra metodología con evaluación continua:
- Tutorización personalizada. Con el apoyo individualizado de un docente comprometido con tus necesidades de aprendizaje. Consulta sin límites.
- Enfoque Learn by doing. Pon en práctica los nuevos conocimientos analizando casos reales completamente aplicables a tu realidad profesional.
- A tu ritmo. Aprende cuándo y dónde quieras, marca tu propio ritmo de aprendizaje, sin fechas ni plazos de entrega.
- Contenidos de calidad. Evoluciona paso a paso con materiales didácticos, actualizados y prácticos aplicables a tus proyectos profesionales.
- Evaluación continua. Basada en el apoyo individualizado del alumno para garantizar la comprensión de conceptos y su capacidad técnica para resolver los ejercicios propuestos.
- Recursos. Materiales audiovisuales, guías prácticas y bibliografía complementaria, para ir más allá en tu desempeño.
Para acceder al Curso de Análisis de componentes principales (PCA) con R no se establece ningún requisito.
Destinatarios
Profesionales del análisis de datos interesados descubrir patrones ocultos en grandes bases de datoscon técnicas de Data Mining y aplicando el algoritmo PCA.
Un curso práctico orientado a estudiantes, profesionales, investigadores y PhD interesados en:
- Identificar patrones y reducir la complejidad de grandes conjuntos de datos
- Analizar e interpretar un PCA.
- Aplicar la herramienta exploratoria del análisis clúster jerárquico (ACJ – HCPC).
CURSO DE NIVEL INTERMEDIO
Para un mejor aprovechamiento de la formación es recomendable tener conocimientos básicos previos sobre R Software.
Al finalizar el Curso de Análisis de componentes principales (PCA) con R habrás desarrollado las competencias necesarias para hacer comprensible la información extraída en los conjuntos de datos, y serás capaz de:
- Evaluar, modelar y visualizar gráficamente las relaciones entre múltiples variables para reducir su dimensión y complejidad.
- Identificar las variables más importantes y ordenarlas.
- Resumir la información de un gran conjunto de variables en nuevas no correlacionadas que capturen la mayor variabilidad de los datos.
- Predecir el comportamiento de nuevos casos o nuevas variables sobre el mapa de relaciones.
- Dominar el lenguaje estadístico de R Software.
TEMA 1. INTRODUCCIÓN AL ANÁLISIS DE COMPONENTES PRINCIPALES (PCA)
Patrones y reducción de la complejidad de grandes conjuntos de datos.
- Cuándo podemos aplicar un PCA y para qué.
- Cómo funciona el PCA.
- Análisis y preparación previa de los datos.
- Ejemplos de casos reales.
TEMA 2. CÓMO ANALIZAR E INTERPRETAR UN PCA
Valores propios, ejes principales y gráficos biplot.
- Formato de los datos y estandarización.
- Obtención de los valores propios y varianzas explicadas por los ejes.
- Selección del número de ejes (componentes principales) óptimo y obtención de la variabilidad explicada por cada uno.
- Gráfico de las variables y los casos. Círculos de correlación.
- Evaluación de la calidad de la representación.
- Descripción de las dimensiones identificadas.
- Detección de las variables que más contribuyen a explicar la variabilidad de los datos.
- Interpretación y publicación de los resultados.
- Ejemplos de casos reales.
TEMA 3. ANÁLISIS CLÚSTER JERÁRQUICO
- HCPC ( Hierarchical Clustering on Principal Components )
- Por qué HCPC
- Ejemplo de casos reales con variables continuas
- Generación de informes autmáticos
Claustro docente
El seguimiento personalizado es uno de nuestros puntos fuertes.
En este Máster contarás con el asesoramiento y las tutorías ilimitadas de dos docentes expertos que van compartir contigo todo su conocimiento y su experiencia en el sector de la Ciencia de Datos:
Rosana Ferrero
Data Scientist con más de 10 años de experiencia en consultoría, investigación y docencia.Colabora en proyectos de diversos centros de investigación como el Consejo Superior de Investigaciones Científicas (CSIC), CAPES-PUC, IAS-CSIC y LINCGlobal. Asesora y consultora en Biomáxima.
Juan Luis López
Analista de datos con certificaciones en Data Visualization with ggplot2, Data Analysis in R y Machine Learning Toolbox.