Cursos de formación
ANALYZING WITH CLOUDERA DATA WAREHOUSE -CERTIF: CDP DATA ANALYST
ANALYZING WITH CLOUDERA DATA WAREHOUSE -CERTIF: CDP DATA ANALYST
Datos del curso 25/0999.055
Familia: INFORMÁTICA Y COMUNICACIONES
Certificado profesional: NO
Modalidad
Presencial
Horas
48
Fecha
17/03/2025
Tipo de formación
General
Horario
Virtual horario obligatorio de 17:00-21:00 horas.
Fecha fin
03/04/2025
Alumnos
16
Fin inscripción
03/03/2025
Datos del centro
Localidad:
ZARAGOZA
Teléfono:
976715153
Responsable:
Jesús Enrique Duce Gonzaga
Dirección:
Avda. Sainz de Varanda, 15
Requisitos para realizar el curso
Requisitos
Requisitos especificos
Trabajadores ocupados o desempleados en la Comunidad Autónoma de Aragón, de manera específica destinado a analistas de datos, especialistas en inteligencia empresarial, desarrolladores, arquitectos de sistemas y administradores de bases de datos.Requisitos previos:Se requieren conocimientos previos de SQL, así como estar familiarizado con la línea de comandos de Linux.
Finalidad y Programa del curso
Finalidad
Formar de manera actualizada a profesionales del sector para su inmediata adecuación laboral
Programa
Fundamentos para el Análisis de Big DataVisión General del Análisis de Big DataAlmacenamiento de Datos: HDFSProcesamiento Distribuido de Datos: YARN,MapReduce y SparkProcesamiento y Análisis de Datos: Hive e ImpalaIntegración de Bases de Datos: SqoopOtras Herramientas de DatosExplicación del Escenario del EjercicioIntroducción a Hive e Impala¿Qué es Hive?¿Qué es Impala?¿Por qué utilizar Hive e Impala?Schema y almacenamiento de datosComparación entre Hive y bases de datos tradicionalesCasos de usoConsultas con Hive e ImpalaTablas y bases de datosSintaxis básica en consultas Hive e ImpalaTipos de datosEmpleo de Hue para ejecutar consultasEmpleo de Beeline (la Shell de Hive)Empleo de la Shell de ImpalaOperadores comunes y funciones integradasOperadoresFunciones escalaresFunciones de agregadoAdministración de datosAlmacenamiento de datosCreación de bases de datos y tablasCarga de datosModificación de bases de datos y tablasSimplificación de consultas con vistasAlmacenamiento de resultados de consultasAlmacenamiento de datos y rendimientoParticionamiento de tablasCarga de datos en tablas particionadasCuándo utilizar particionamientoSelección del formato de archivoUso de los formatos de archivo Avro y ParquetTrabajando con múltiples DatasetsUNION y JoinsManejo de valores NULL en JoinsJoins avanzadosFunciones analíticas y WindowingUtilización de funciones analíticas comunesOtras funciones analíticasVentanas deslizantesDatos complejosDatos complejos con HiveDatos complejos con ImpalaAnálisis de textoEmpleo de expresiones regulares con Hive e ImpalaProcesamiento de texto con SerDes en HiveAnálisis de Sentimiento y n-grams en HiveOptimización de Apache HiveComprendiendo cómo se ejecutan las consultasOptimización basada en Costes y EstadísticasBucketingOptimizaciones de ficheros ORCIndexación de datosHive en SparkOptimización de Apache ImpalaCómo Impala ejecuta las consultasMejorar el rendimiento de ImpalaExtendiendo Hive e ImpalaCustomizar SerDes y formatos de archivo en HiveTransformación de datos con Scripts personalizados en HiveFunciones definidas por el usuarioConsultas parametrizadasSelección de la Mejor Herramienta para cada TareaComparación entre MapReduce, Hive, Impala, y bases de datos relacionales¿Cuál elegir?CDP Public Cloud Data WarehouseVisión General del Data Warehouse en la Nube PúblicaAutoescaladoGestión de Data WarehouseConsulta de Datos mediante CLI e Integración con TercerosAppendix: Apache Kudu¿Qué es Kudu?Tablas KuduUso de Impala con Kudu
Profesorado
PROFESOR ESPECIALIZADO
Equipamiento
EQUIPAMIENTO PLATAFORMA CTA
Fecha y hora previstas de la seleccion
Fecha Selección 06/03/2025
Hora Selección 19:00