Machine Learning Solutions Engineer (m/w/d)

_Machine Learning Frameworks, wie z.B. Du berätst Kunden bei der Optimierung von Machine Learning Algorithmen für Beschleuniger....

DEINE AUFGABEN

Wir sind auf der Suche nach einem erfahrenen Machine Learning Solutions Engineer, der daran interessiert ist, GPU-Beschleuniger zu nutzen, um unsere HPC-Produkte und Kunden zu unterstützen.
Die HPC-Kunden von Northern Data verlassen sich auf leistungsstarke Hardware-Beschleuniger, um ihre Experimente durchzuführen, ihre Modelle zu trainieren und bahnbrechende Ergebnisse zu erzielen. Beschleuniger sind komplexe Systeme mit ad-hoc Software-Schichten & APIs, um sie zu programmieren. Es kann schwierig sein, sie optimal zu nutzen.
Deine Aufgabe ist es, über den gesamten KI-Software-Stack hinweg zu arbeiten, um unseren Kunden immer schnellere Fortschritte in Richtung unserer Mission zu ermöglichen. Du betrachtest alle Komponenten, die Einfluss auf die Performance haben und verwendest Technologien wie Rocm, Hip, NCCL und MPI:

  • Machine Learning Frameworks, wie z.B. TensorFlow, PyTorch und JAX,
  • Compiler, wie z.B. XLA und MLIR
  • Hardware, wie z.B. (aber nicht beschränkt auf) GPUs
  • Networking

Du arbeitest mit Kunden zusammen, um ihre Bedürfnisse zu verstehen und mögliche Lösungen zu erforschen. Du implementierst, was benötigt wird, um eine höhere Rechenleistung zu erreichen.

  • Du bist der Go-to-Experte für Fragen in unserem Produktentwicklungsteam
  • Du berätst Kunden bei der Optimierung von Machine Learning Algorithmen für Beschleuniger
  • Du entwirfst und entwickelst innovative Ansätze für High-Performance Computing und paralleles Rechnen auf Hardware-Beschleunigern
  • Du trägst zum Design und zur Implementierung von Lösungen für gängige Performance-Probleme bei
  • Du benchmarkst maschinelle Lernalgorithmen und identifizierst Engpässe und behebst sie in unseren sich schnell entwickelnden Rechenzentren
  • Du validierst Modelldesign-Entscheidungen basierend auf theoretischen und/oder detaillierten experimentellen Ergebnissen
  • Du integrierst neue Deep Learning Algorithmen in unser Produkt und verbesserst bestehende Ansätze
  • Du optimierst kundenspezifische Rechenkerne für die GPU (XLA, etc.)
  • Du findest die ideale Balance zwischen Spitzenforschung und hochwertigem Code, der in der Produktion läuft

WAS DU MITBRINGST

  • Master oder PhD in Informatik, einem verwandten technischen Fachgebiet oder gleichwertige praktische Erfahrung
  • Einschlägige Berufserfahrung in maschinellem Lernen, Optimierung
  • Starke theoretische Kenntnisse in linearer Algebra, Stochastik
  • Erfahrung mit TensorFlow oder ähnlichen Frameworks für maschinelles Lernen, vorzugsweise in großen Projekten
  • Interesse daran zu verstehen, warum etwas funktioniert, nicht nur wie
  • Erfahrung mit der Programmierung in C/C++
  • Erfahrung mit der Programmierung auf GPUs (CUDA, Rocm)
  • Erfahrung mit verteilten Multi-Host-Systemen
  • Erfahrung in paralleler Programmierung und High-Performance Computing
  • Vertrautheit mit Python
  • Interesse an KI und fundierte Kenntnisse von KI-Algorithmen
  • Idealerweise Veröffentlichungen im Zusammenhang mit peer-reviewed Papers, mit Interesse an der Veröffentlichung weiterer Papers

WARUM WIR?

  • Arbeit in einem dynamischen Unternehmen mit flachen Hierarchien und kurzen Entscheidungswegen
  • Ein hohes Maß an Eigenverantwortung und einen großen Entscheidungsspielraum
  • Viel Freiraum für persönliche und berufliche Entwicklung und Weiterbildung
  • Regelmäßige Team- und Firmenevents in einer entspannten Atmosphäre
  • Eine entscheidende Rolle in einem jungen, dynamischen und schnell wachsenden Team
  • Ein Arbeitsumfeld, in dem Vertrauen, Respekt und Feedback gefördert werden
  • Wettbewerbsfähiges Gehalt, flexible Arbeitszeiten, Home Office

ÜBER UNS

Die Northern Data AG entwickelt und betreibt globale Infrastrukturlösungen im Bereich High Performance Computing (HPC). Das Unternehmen liefert mit seinen kundenspezifischen Lösungen die Infrastruktur für diverse HPC-Anwendungen in Bereichen wie Bitcoin Mining, Künstliche Intelligenz, Blockchain, Big Data Analytics, IoT oder Rendering. Das international tätige Unternehmen ist heute ein führender Anbieter im Bereich von HPC-Lösungen weltweit. Northern Data bietet seine HPC-Lösungen sowohl in großen, stationären Rechenzentren an als auch in mobilen Hightech-Rechenzentren, die an jedem Standort weltweit aufgestellt werden können. Dabei kombiniert das Unternehmen selbst entwickelte Soft- und Hardware mit intelligenten Konzepten für eine nachhaltige Energieversorgung. Der Northern Data Konzern beschäftigt aktuell rund 150 Personen.

Art der Stelle: Vollzeit, Festanstellung

Arbeitszeiten:

  • 8-Stunden-Schicht