Científico de Datos PLENO o SENIOR, es un perfil mas completo
ACTIVIDADES
- Desarrollo de procesos ETL en ambiente de DataBricks.
- Desarrollo de procesos de integración y limpieza de datos en ambiente databricks.
PERFIL
Necesarios, conocimientos en Spark, SQL Avanzado , Data Bricks, modelado de datos.Experiencia profesional de al menos 6 años en proyectos de BI de los cuales al menos 2 en ambientes de Bigdata (haddop, gcp, etc)Conocimientos en herramientas de Big Data : Hadoop , Hive, experiencia en integración de datos en entorno de Data LakeConocimiento en el Stack Cloudera : Hue, Hadoop, Sqoop, HDFS. (Manejo de alguna nube (AWS, Azure o Google)Consumo de API’sCreación de flujos en alguna herramienta de ETL pudiendo ser : Automic, Airflow.Cómputo distribuido : Hadoop, Apache Spark, Apache Druid, DremioManejo de bases de datos relacional como : Sql Server, Teradata, Oracle, DB2, MSSQL, PostgeSQL, MariaDB.SO : UnixModelado de datosPerfil analíticoConocimientos en algún lenguaje de programación : Java, Python, ScalaLenguajes de marcado : XML.Lenguaje de serialización : YAML. (No mandatorio)