Diseñar con visión integral y mejores prácticas una solución tecnológica compuesta por diferentes herramientas de una plataforma tecnológica asegurando que se cumpla de manera óptima los requerimientos del Cliente. Asegurar la calidad y la correcta implementación del diseño hasta la conclusión del proyecto.
Experiencia 3 años minimo con herramientas Big Data y Databricks.
- Ecosistemas de Big Data
- Buena comunicación para trato con clientes de alto nivel
- Inglés intermedio hablado y escrito (Comunicación semanal con equipos internacionales)
- Capacidad para canalizar los datos, vengan estos de fuentes internas o externas.
- Diseñar tratamientos de la información sin importar si son procesos en tiempo diferido o procesos en tiempo real.
- Modelado de datos
- Conocimiento avanzado de PL / SQL
- Experiencia en desarrollo de ETLs
- Experiencia en desarrollo de software en algún lenguaje como Java, Python o algún otro Orientado a Objetos
- Capacidad para diseñar y estructurar bases de datos SQL y NoSQL.
- Capacidad para trabajar en equipo.
- Experiencia avanzada de SPARK ya sea con Scala, Java o Python.
- Gestión de plataforma de databricks
Herramientas :
Hadoop {HIVE, Sqoop, Kafka}Azure Databricks y Data Lake StorageSPARK (Scala, Java, Python)RDBMS : Microsoft SQL Server [Deseable], Azure SQL Server [Deseable], Oracle (deseable), etc.JavaPythonPL / SQLHerramienta orquestadora de flujos de trabajo (por ejemplo : Automic, Informatica, Control M, Airflow [Deseable], etc)Aceleradores de consulta de datos (Deseable)Actividades a realizar :
Gestionar la plataforma Databricks, usuarios, proyectos y salud de los Clusters utilizados, así como buenas practicas de ejeuciones sobre Azure DatabricksDefinir arquitecturas para proyectos de volumenes de datos grandes (Big Data) con apoyo de equipos nacionales e internacionales, apegándose a las mejores prácticas y estándares definidos por las áreas de datos, así como con las herramientas tecnológicas utilizadas dentro del grupo y que se adecuen a la necesidad de cada proyecto a fin de contemplar la reutilización de la arquitectura por otras iniciativas.Trabajar en conjunto con las áreas de Ingeniería, Gobierno de datos, Ciencia de Datos y Representantes de Areas de negocio a fin de definir en conjunto soluciones en términos de componentes, módulos, algoritmos, modelos y alternativas a soluciones existentes que se adecuen a las exigencias de cada proyecto por medio de metodologías ágiles.