Cursos de formación
ADMINISTRATING CLOUDERA DATA PLATFORM -CDP PRIVATE CLOUD BASE
ADMINISTRATING CLOUDERA DATA PLATFORM -CDP PRIVATE CLOUD BASE
Datos del curso 25/0999.056
Familia: INFORMÁTICA Y COMUNICACIONES
Certificado profesional: NO
Modalidad
Presencial
Horas
48
Fecha
15/09/2025
Tipo de formación
General
Horario
Virtual horario obligatorio de 17:00-21:00 horas.
Fecha fin
02/10/2025
Alumnos
16
Fin inscripción
01/09/2025
Datos del centro
Localidad:
ZARAGOZA
Teléfono:
976715153
Responsable:
Jesús Enrique Duce Gonzaga
Dirección:
Avda. Sainz de Varanda, 15
Requisitos para realizar el curso
Requisitos
Requisitos especificos
Trabajadores ocupados o desempleados en la Comunidad Autónoma de Aragón, de manera específica destinado para administradores de sistemas y gerentes IT que tengan experiencia básica en Linux.Requisitos previos:Se requiere experiencia básica en Linux. No se requieren conocimientos previos de Apache Hadoop.
Finalidad y Programa del curso
Finalidad
Formar de manera actualizada a profesionales del sector para su inmediata adecuación laboral
Programa
Módulo 1: Plataforma de datos de Cloudera· Tendencias de la industria para Big Data· El desafío de estar basado en datos· La nube de datos empresariales· CDP· Factores de forma de CDP· Ejercicio práctico: configurar la red de ejerciciosMódulo 2: Instalación de la base de nube privada de CDP· Cloudera Manager· Ejercicio práctico: instalación de Cloudera Manager Server· Descripción general del tiempo de ejecución de CDP· Demostración dirigida por un instructor: Cloudera Manager· Ejercicio práctico: instalación en clústerMódulo 3: Configuración de clúster· Ajustes de configuración· Modificación de configuraciones de servicio· Archivos de configuración· Administrar instancias de roles· Agregar nuevos servicios· Agregar y quitar hosts· Ejercicio práctico: configuración de un clúster de HadoopMódulo 4: Almacenamiento de datos· HDFS· Rendimiento de HDFS y tolerancia a fallos· Descripción general de seguridad de HDFS y Hadoop· Trabajar con la interfaz de usuario de Namenode· Demostración dirigida por un instructor: interfaz de usuario de Namenode· Trabajando con HDFS· Ejercicio práctico: trabajar con HDFS· HBase· Kudu· Almacenamiento en la nube· Ejercicio práctico: almacenamiento de datos en Amazon S3Módulo 5: Ingesta de datos· Formatos de archivo· Ingesta de datos mediante transferencia de archivos o interfaces REST· Importación de datos de bases de datos relacionales con Apache Sqoop· Ejercicio práctico: importación de datos con Sqoop· Ingesta de datos con NiFi· Demostración dirigida por un instructor: interfaz de usuario de NiFi· Prácticas recomendadas para importar datos· Ejercicio práctico: verificación de NiFiMódulo 6: Flujo de datos· Cloudera Flow Management y NiFi· Arquitectura NiFi· Gestión de flujo de Cloudera Edge y MiNiFi· Uso de NiFi· Descripción general de Apache Kafka· Arquitectura de clúster de Apache Kafka· Herramientas de línea de comandos de Apache Kafka· Ejercicio práctico: trabajar con KafkaMódulo 7: Acceso y descubrimiento de datos· Apache Hive· Apache Impala· Ajuste de Apache Impala· Ejercicio práctico: instalar Impala y Hue· Hue· Administrar y configurar Hue· Autenticación y autorización de Hue· Descripción general de CDSW· Ejercicio práctico: uso de Hue, Hive e ImpalaMódulo 8: Computación de datos· Descripción general de YARN· Ejecución de aplicaciones en YARN· Visualización de aplicaciones de YARN· Registros de aplicaciones de YARN· Aplicaciones MapReduce· Configuración de CPU y memoria YARN· Ejercicio práctico: ejecución de aplicaciones YARN· Descripción general de Tez· ACID para Hive· Descripción general de Spark· Cómo se ejecutan las aplicaciones Spark en YARN· Supervisión de aplicaciones Spark· Ejercicio práctico: ejecución de aplicaciones SparkMódulo 9: Gestión de recursos· Etiquetas de nodo· Configuración de cgroups· El programador de capacidad· Administrar colas· Programación de consultas de Impala· Ejercicio práctico: uso del programador de capacidadMódulo 10: Planificación de su clúster· Elegir el hardware adecuado· Consideraciones de red· Consideraciones sobre la nube privada de CDP· Configurar nodosMódulo 11: Configuración avanzada de clústeres· Configuración de puertos de servicio· Ajuste de HDFS y MapReduce· Gestionar el crecimiento del clúster· Codificación de borrado· Habilitación de alta disponibilidad para HDFS y YARN· Ejercicio práctico: configuración de HDFS para alta disponibilidadMódulo 12: Mantenimiento de clústeres· Comprobación del estado de HDFS· Copiar datos entre clústeres· Reequilibrio de datos en HDFS· Instantáneas del directorio HDFS· Ejercicio práctico: creación y uso de una instantánea· Mantenimiento de host· Actualizar un clúster· Ejercicio práctico: actualizar el clústerMódulo 13: Monitoreo de clústeres· Funciones de supervisión de Cloudera Manager· Pruebas de salud· Ejercicio práctico: Romper el grupo· Eventos y alertas· Gráficos e informes· Recomendaciones de seguimiento· Ejercicio práctico: confirmación de la reparación del clúster y configuración de alertas por correo electrónicoMódulo 14: Solución de problemas del clúster· Herramientas de resolución de problemas· Ejemplos de configuración incorrecta· Ejercicio práctico: resolución de problemas de un clústerMódulo 15: Seguridad· Gobierno de datos con SDX· Conceptos de seguridad de Hadoop· Autenticación de Hadoop mediante Kerberos· Autorización de Hadoop· Cifrado Hadoop· Asegurar un clúster de Hadoop· Apache Ranger· Atlas de Apache· Copia de seguridad y recuperaciónMódulo 16: Nube privada / Nube pública· Descripción general de CDP· Capacidades de nube· ¿Qué es Kubernetes?· Workload XM· Escalado automáticoMódulo 17: ConclusiónMódulo 18: Apéndice: API de Cloudera ManagerMódulo 19: Apéndice: Descripción general de Ozone
Profesorado
PROFESOR ESPECIALIZADO
Equipamiento
EQUIPAMIENTO PLATAFORMA CTA
Fecha y hora previstas de la seleccion
Fecha Selección 04/09/2025
Hora Selección 18:00