Data Engineer (m/w/d) in Voll- oder Teilzeit
18. Oktober 2024Wir suchen für den Fachbereich „IT und Data Science“ zum 01. Januar 2025 am Standort Berlin einen Data Engineer (m/w/d) in Voll- oder Teilzeit
Das Zentralinstitut für die kassenärztliche Versorgung in der Bundesrepublik Deutschland (Zi) ist das Forschungsinstitut der Kassenärztlichen Vereinigungen der Länder und der Kassenärztlichen Bundesvereinigung in der Rechtsform einer Stiftung des bürgerlichen Rechts. Die Forschungsarbeiten und Studien des Zi beschäftigen sich vorwiegend mit der ambulanten Medizin. Im Fokus steht dabei die Auswertung bundesweiter Daten aus der vertragsärztlichen Versorgung einschließlich der Arzneimittelverordnung.
Zur Unterstützung dieser Aufgaben suchen wir für den Fachbereich „IT und Data Science“ zum 01. Januar 2025 am Standort Berlin einen
Data Engineer (m/w/d) in Voll- oder Teilzeit
Was sind Ihre Aufgaben?
Sie arbeiten an zentralen Projekten wie dem 116117 Terminservice oder SmED und weiteren innovativen Vorhaben, die darauf abzielen, die medizinische Versorgung in Deutschland zu verbessern. Dabei sind Sie maßgeblich für die Erstellung und Optimierung von zeitkritischen ETL-Prozessen verantwortlich und integrieren verschiedene Datenquellen, um Datenströme für Analysen und Berichte nutzbar zu machen.
Zu Ihren Aufgaben gehören außerdem:
- Design, Implementierung und Betreuung von ETL-Prozessen in einer modernen Datenarchitektur.
- Verarbeitung, Bereinigung und Transformation großer Datenmengen (Data Wrangling).
- Arbeit mit MongoDB, Spark, Dremio, SQL sowie S3-basierten Speicherlösungen und weiteren Technologien zur Datenspeicherung, -verarbeitung und -abfrage.
- Nutzung von Airflow zur Orchestrierung von Datenpipelines.
- Zusammenarbeit mit Data Scientists, Datenbankadministratoren und inhaltlichen Verantwortlichen zur Unterstützung von Datenanalysen.
- Versionierung und kollaborative Arbeit mit git.
Was wir von Ihnen erwarten?
- Abgeschlossenes Studium in Informatik oder einem verwandten Studienfach oder nachweisbare Berufserfahrung in den oben genannten Aufgabenfeldern.
- Fundierte Kenntnisse in Python und Erfahrung im Umgang mit ETL-Prozessen.
- Praktische Erfahrung mit MongoDB, Spark, Airflow, SQL und S3.
- Erfahrung in Data Wrangling und der effizienten Verarbeitung großer Datenmengen.
- Kenntnisse in der Versionsverwaltung mit git.
- Routinierter Umgang mit Linux und Bash-Skripten.
- Eigenverantwortliches und zielorientiertes Arbeiten in einem interdisziplinären Team.
- Freude an der Lösung komplexer Datenprobleme und Interesse an Projekten, die die Gesundheitsversorgung in Deutschland unterstützen.
Was bieten wir Ihnen?
- Mitarbeit an innovativen Themen in einem dynamischen Forschungsinstitut des deutschen Gesundheitswesens
- flache Hierarchien in einem teamorientierten Arbeitsumfeld
- einen unbefristeten Arbeitsvertrag
- Vergütungsstrukturen nach fachlicher Qualifikation in Anlehnung an den TVöD
- attraktive Sozialleistungen, wie z. B. eine arbeitgeberfinanzierte zusätzliche Altersversorgung
- Unterstützung bei der Vereinbarkeit von Beruf und Familie (60 Prozent der regulären Arbeitszeit im Homeoffice möglich mit Stellung eines Arbeitslaptops)
- flexible Arbeitszeiten inkl. Überstundenausgleich
- individuelle Weiterbildungsmöglichkeiten
- 30 Tage Jahresurlaub
- Vergünstigungen im öffentlichen Nahverkehr
- Nutzung der Kantine zu reduzierten Preisen
Interessiert? Dann freuen wir uns auf Ihre aussagefähige Onlinebewerbung bis zum 30. November 2024. Ihre vollständigen Bewerbungsunterlagen reichen Sie bitte per Mail ein. Geben Sie bitte neben Ihrem frühestmöglichen Eintrittstermin auch Ihre Gehaltsvorstellung an. Mit der Übermittlung der Unterlagen erklären Sie sich der Datenverarbeitung (zu den Datenschutzhinweisen) einverstanden.
Rückfragen zur ausgeschriebenen Stelle beantwortet Ihnen gerne Herr Dr. Lars Eric Kroll (Fachbereichsleiter „IT und Data Science“).