About the Role
Strona główna O nas Kariera ML/AI Infrastructure Engineer
ML/AI Infrastructure Engineer
Beyond.pl to pierwszy w Europie Środkowo-Wschodniej operator data center świadczący wysokowydajne, skalowalne usługi IT na potrzeby sztucznej inteligencji, przetwarzania w chmurze i obciążeń korporacyjnych. Dostarczamy usługi w oparciu o własne, zlokalizowane w UE, centra danych – nowoczesne, bezpieczne i energooszczędne Dostarczając wysokowydajne oraz zasilane energią odnawialną usługi kolokacji i mocy obliczeniowej, odważnie wspieramy wizjonerów jutra. Przekształcamy tradycyjne centra danych w Fabryki AI, aby pomagać w rozwoju innowacji – w sposób zrównoważony, bezpieczny, suwerenny i na dużą skalę. Dostarczamy ekosystem usług i rozwiązań wspierający rozwój projektów AI. Nasza wielopoziomowa oferta składa się z: AIaaS na bazie NVIDIA AI Enterprise, GPUaaS, usług kolokacji GPU i usług zarządzanych.
Rodzaj pracy: hybrydowa, zdalna
Miejsce pracy: Poznań
Zadania
Projektowanie, wdrażanie i optymalizacja systemów AI/ML opartych na GPU
Zarządzanie infrastrukturą dla ML/AI – serwery GPU, storage, sieci wysokiej przepustowości
Optymalizacja środowisk do trenowania modeli – dobór sprzętu, konfiguracja klastrów (np. Kubernetes, Slurm), tuning pod workloady AI.
Monitoring i troubleshooting – analiza wykorzystania zasobów, wykrywanie wąskich gardeł i problemów z dostępnością.
Integracja sprzętu i oprogramowania – testowanie i wdrażanie nowych technologii (np. nowa generacja akceleratorów, frameworki AI).
Nasze oczekiwania
Doświadczenie w architekturze HPC – doświadczenie w projektowaniu, implementacji oraz zarządzaniem klastrami HPC
Bardzo dobra znajomość systemów operacyjnych Linux oraz ich optymalizacja pod kątem HPC
Bardzo dobra znajomość Kubernetes
Znajomość systemów kolejkowania zadań np. Slurm
Doświadczenie w sieciach HPC – Infiniband
Znajomość systemów plików HPC – Ceph, Lustre
Optymalizacja aplikacji HPC – tuning wydajności, profiling, analiza wąskich gardeł
Znajomość Ansible, Terraform
Znajomość platformy run.ai – zarządzanie zasobami GPU
Umiejętność rozwiązywania problemów – analiza wydajności, debugowanie aplikacji HPC
Umiejętność pracy zespołowej – współpraca z inżynierami i administratorami
Dobre umiejętności komunikacyjne – dokumentowanie architektury, prezentacje dla zespołów technicznych
Samodzielność i inicjatywa – umiejetność prowadzenia projektów i proponowanie nowych rozwiązań
Chęć nauki nowych technologii – śledzenie trendów w HPC i adaptacja nowych rozwiązań
Oferujemy
Pracę w wymiarze pełnego etatu w dynamicznie rozwijającej się firmie w sektorze IT
Pracę hybrydową lub zdalną.
Atrakcyjne wynagrodzenie adekwatne do posiadanych umiejętności.
Rozwój zawodowy, w tym szkolenia i certyfikacje w obszarze AI
Wymianę wiedzy i poszerzenie jej o kolejne rozwiązania.
Samodzielność w działaniu i realny wpływ na strategię firmy.
Bogaty pakiet socjalny (w tym Multikafeteria i lekcje języka angielskiego).
Indywidualny fundusz szkoleniowy, prywatną opiekę medyczną i ubezpieczenie na życie.
Przyjazne środowisko pracy i niezbędne narzędzia.
Pracę z nowoczesnymi technologiami w centrach danych Beyond.pl
Aplikuj
Tech Stack
GPULinuxKubernetesSlurmInfinibandCephLustreAnsibleTerraformrun.ai