DB InfraGo
Data engineer / Data architect
Key responsibilities:
-
Design und Umsetzung von Lakehouse-Architektur.
-
Entwicklung von Datenmodellen und Sicherstellung von
-
Etablierung von Best Practices und Standards in den
Bereichen Data Governance, Analytics und Security.
-
Unterstützung bei der Umsetzung von
Data-Engineering-Aufgaben in AWS-Umgebungen und
anderen Cloud-Infrastrukturen.
-
Auswahl und Integration geeigneter Datenplattformen, die
Skalierbarkeit, Performance und Kosteneffizienz
berücksichtigen.
-
Entwicklung und Pflege von Architektur- und
Geschäftsprozessmodellen, die auf die Anforderungen des
Unternehmens abgestimmt sind.
-
Enge Zusammenarbeit mit anderen Architekten zur
Erstellung eines Business Information Models, das
Daten-Domänen, Themenbereiche, Datenobjekte und
Attribute definiert.04.2020 -
02.2023
10.2019 -
01.2020
-
Entwicklung von datengetriebenen Produkten und
Dienstleistungen in Zusammenarbeit mit Stakeholdern.
Technologies:
AWS, Lake Formation, Glue, Athena, EMR, Gitlab CI/CD,Python,
CDK, CloudFormation, Lamda, RDS, Gitlab CI/CD, Docker,
Kubernetes, ArgoCD, StepFunctions, AirFlow
DB Fernverkehr AG
Lead Data Engineer / Data Architect
Key responsibilities:
-
Konzeption und Entwicklung eines Data Architekturs in AWS
-
Entwicklung und Betrieb von Pipelines
-
Aufbau eines Dataflow Frameworks
-
Migration nach AWS und Optimierung von bestehende
Pipelines auf basis von Cloudera
-
Entwicklung von wiederverwendbaren Elementen für ETL,
Data Flows, Best Practices, Code Standards und Data
Architektur
Technologie:
Spark, AWS, Glue, Athena, EMR, Scala, Python, CDK,
CloudFormation, Lamda, RDS, Gitlab CI/CD, Docker, Hudi, s3,
Meta-Store, Step Functions
Zalando SE
Data Governance and Compliance.
Hauptaufgaben:
-
Konzeption und Entwicklung eines Data Governance and
Compliance Agents.
-
Go-live technischer und fachlicher Konzeption
-
Datenpipeline Entwicklung
-
Monitoring and Alerting
-
DataOps / DevOps
-
Technologie:
Apache Spark, HDFS, Stanford NLP, scikit-learn, gensim, Spark
ML, Java, Python, Scala, Terraform, Gradle, CircleCI, Google
Cloud, MongoDB, PubSub, BigQuery, Dataproc,
workflows-templates, Zeppelin06.2019 -
09.2019
09.2015 -
06.2019
09.2014 -
06.2019
Charly education
Data engineer
Hauptaufgaben:
-
Konzeption und Entwicklung eines Data Lakes in GCP
-
ETL-Pipelines Entwicklung und Betrieb
-
Near-Realtime-Pipelines Entwicklung und Betrieb
-
Machine Learning & KI PoCs
-
Datenanalyse und Visualisierung
-
DataOps / DevOps
Technologie:
Apache Spark, HDFS, Stanford NLP, scikit-learn, gensim, Spark
ML, Java, Python, Scala, Terraform, Gradle, CircleCI, GCP,
MongoDB, PubSub, BigQuery, Dataproc, workflows-templates,
Zeppelin
Datalovers AG
Data engineer
Key responsibilities:
-
ETL-Pipelines Entwicklung und Betrieb
-
Data mining mit NLP / Machine learning
-
Information Retrieval und Search-Cluster aufbau
-
Datenanalyse und Visualisierung
Technologie:
Apache Spark, HDFS, Stanford NLP, scikit-learn, Solr-Cloud,
Neo4j, MongoDB, JSON, Java, Python, Scala, Zeppelin, Kibana,
Elasticsearch, Spring, Spring-Data, Maven, Jenkins, Cloudera,
AWS, Google Cloud, Telekom Cloud.
CMS CarMobileSystems GmbH
Data engineer
Key responsibilities:
-
Spark Pipelines Entwicklung und Betrieb
-
Data mining
-
NLP und ML Anwendungsfälle
-
Data modelling (No-SQL, SQL)
-
Datenanalyse und Visualisierung
-
Search-Cluster aufbau
Technologie:2013 - 2014 Sonstige
Skillmatrix Sprachen Studium
2008-2012 Apache Spark, HDFS, Stanford NLP, Solr-Cloud, MongoDB,
MySQL, JSON, Java, Scala, Zeppelin, Spring, JPA, Spring Data,
IT-Kenntnisse (Skills)
Amazon Web Services
Grundkentnisse
Cloud Computing
Grundkentnisse
Cloud-Entwicklung
Grundkentnisse
Data Mining
Grundkentnisse
Elasticsearch
Grundkentnisse
Google Buzz
Grundkentnisse
Google Checkout
Grundkentnisse
Google Chrome
Grundkentnisse
Google Cloud
Grundkentnisse
Google Plus
Grundkentnisse
Machine Learning
Grundkentnisse
Social Marketing
Grundkentnisse
Software Architecture
Grundkentnisse