AI Inference Engineer - Large Language Models (f/m/d) - #2086263

Aleph Alpha


Date: vor 13 Stunden
Stadt: Berlin
Vertragstyp: Ganztags
Arbeitsplan: Volle Tag
Aleph Alpha
Overview

You will join our product team in a position that sits at the intersection of artificial intelligence research and real-world solutions. We foster a highly collaborative work culture where you can expect to work closely with your teammates and have a high level of communication between teams through methodologies such as pair or mob programming.

Your Responsibilities

  • Model Inference: Focus on inference optimization to ensure rapid response times and efficient resource utilization during real-time model interactions.
  • Hardware Optimization: Run models on various hardware platforms, from high-performance GPUs to edge devices, ensuring optimal compatibility and performance.
  • Experimentation and Testing: Regularly run experiments, analyze outcomes, and refine the strategies to achieve peak performance in varying deployment scenarios.
  • Staying up to date with the current literature on MLSys

Your Profile

  • You care about making something people want. You want to ship something that will bring value to our users. You want to deliver AI solutions end-to-end and not finish building a prototype.
  • Bachelor's degree or higher in computer science or a related field.
  • You understand how multimodal transformers work.
  • You understand the characteristics of LLM inference (KV caching, flash attention, and model parallelization).
  • You have hands-on experience with large language models or other complex AI architectures.
  • You have experience in system design and optimization, particularly within AI or deep learning contexts.
  • You are proficient in Python and have deep understanding of deep learning frameworks such as PyTorch.
  • A deep understanding of the challenges associated with scaling AI models for large user bases.

Nice If You Have

  • Previous experience in a high-growth tech environment or a role focused on scaling AI solutions.
  • Expertise with CUDA and Triton programming and GPU optimization for neural network inference.
  • Experience with Rust.
  • Experience in adapting AI models to suit a range of hardware, including different accelerators.
  • Experience in model quantization, pruning, and other neural network optimization methodologies.
  • A track record of contributions to open-source projects (please provide links).
  • Some Twitter presence discussing ML Sys topics.

What You Can Expect From Us

  • Become part of an AI revolution!
  • 30 days of paid vacation
  • Access to a variety of fitness & wellness offerings via Wellhub
  • Mental health support through nilo.health
  • Substantially subsidized company pension plan for your future security
  • Subsidized Germany-wide transportation ticket
  • Budget for additional technical equipment
  • Flexible working hours for better work-life balance and hybrid working model
  • Virtual Stock Option Plan
  • JobRad Bike Lease

Wie bewerbe ich mich?

Um sich für diesen Job zu bewerben, müssen Sie auf unserer Website autorisieren. Wenn Sie noch kein Konto haben, registrieren Sie sich bitte.

Veröffentlichen Sie einen Lebenslauf

Ähnliche Jobs

Senior IT-Consultant IAM Technologien (m/w/d) in Berlin

Deloitte,
vor 12 Stunden
Du machst den Unterschied. Ob im Business Audit & Assurance, Risk Advisory, Tax & Legal, Financial Advisory oder Consulting: Wir bei Deloitte unterstützen unsere weltweiten Mandanten dabei, sich kontinuierlich weiterzuentwickeln. Entdecke ein vielfältiges Arbeitsumfeld, das ständig in Bewegung ist und...
Deloitte

Pflegefachkraft (m/w/d) für unsere Einrichtung im Süden von Berlin

Alloheim Senioren-Residenzen SE,
vor 13 Stunden
Du möchtest bei dem größten Pflegeheimbetreiber Deutschlands arbeiten? Du suchst einen krisensicheren Arbeitgeber? Die ersten beiden Fragen kannst Du bereits mit „ja“ beantworten? Hier sind wir! Wir suchen Dich als Pflegefachkraft (m/w/d) für unsere Residenz. Das erwartet Dich vor Ort:...
Alloheim Senioren-Residenzen SE

Elektroniker/ Elektriker/ Mechatroniker (w/m/d) als Prüfassistenz für Leit- und Sicherungstechnik

Siemens,
vor 13 Stunden
Gemeinsam machen wir den Unterschied Siemens Mobility ist ein eigenständig geführtes Unternehmen der Siemens AG und seit über 160 Jahren ein führender Anbieter im Bereich Mobilität. Zu unserem Kerngeschäft gehören Schienenfahrzeuge, Bahnautomatisierungs- und Elektrifizierungslösungen, schlüsselfertige Systeme sowie die dazugehörigen Serviceleistungen....
Siemens