/ML/AI Infrastructure Engineer

ML/AI Infrastructure Engineer

PolandRemoteplvia direct
// Job Type
Full Time
// Salary
Not disclosed
// Posted
2 months ago
// Seniority
mid
// Work Mode
hybrid

About the Role

Strona główna O nas Kariera ML/AI Infrastructure Engineer ML/AI Infrastructure Engineer Beyond.pl to pierwszy w Europie Środkowo-Wschodniej operator data center świadczący wysokowydajne, skalowalne usługi IT na potrzeby sztucznej inteligencji, przetwarzania w chmurze i obciążeń korporacyjnych. Dostarczamy usługi w oparciu o własne, zlokalizowane w UE, centra danych – nowoczesne, bezpieczne i energooszczędne Dostarczając wysokowydajne oraz zasilane energią odnawialną usługi kolokacji i mocy obliczeniowej, odważnie wspieramy wizjonerów jutra. Przekształcamy tradycyjne centra danych w Fabryki AI, aby pomagać w rozwoju innowacji – w sposób zrównoważony, bezpieczny, suwerenny i na dużą skalę. Dostarczamy ekosystem usług i rozwiązań wspierający rozwój projektów AI. Nasza wielopoziomowa oferta składa się z: AIaaS na bazie NVIDIA AI Enterprise, GPUaaS, usług kolokacji GPU i usług zarządzanych. Rodzaj pracy: hybrydowa, zdalna Miejsce pracy: Poznań Zadania Projektowanie, wdrażanie i optymalizacja systemów AI/ML opartych na GPU Zarządzanie infrastrukturą dla ML/AI – serwery GPU, storage, sieci wysokiej przepustowości Optymalizacja środowisk do trenowania modeli – dobór sprzętu, konfiguracja klastrów (np. Kubernetes, Slurm), tuning pod workloady AI. Monitoring i troubleshooting – analiza wykorzystania zasobów, wykrywanie wąskich gardeł i problemów z dostępnością. Integracja sprzętu i oprogramowania – testowanie i wdrażanie nowych technologii (np. nowa generacja akceleratorów, frameworki AI). Nasze oczekiwania Doświadczenie w architekturze HPC – doświadczenie w projektowaniu, implementacji oraz zarządzaniem klastrami HPC Bardzo dobra znajomość systemów operacyjnych Linux oraz ich optymalizacja pod kątem HPC Bardzo dobra znajomość Kubernetes Znajomość systemów kolejkowania zadań np. Slurm Doświadczenie w sieciach HPC – Infiniband Znajomość systemów plików HPC – Ceph, Lustre Optymalizacja aplikacji HPC – tuning wydajności, profiling, analiza wąskich gardeł Znajomość Ansible, Terraform Znajomość platformy run.ai – zarządzanie zasobami GPU Umiejętność rozwiązywania problemów – analiza wydajności, debugowanie aplikacji HPC Umiejętność pracy zespołowej – współpraca z inżynierami i administratorami Dobre umiejętności komunikacyjne – dokumentowanie architektury, prezentacje dla zespołów technicznych Samodzielność i inicjatywa – umiejetność prowadzenia projektów i proponowanie nowych rozwiązań Chęć nauki nowych technologii – śledzenie trendów w HPC i adaptacja nowych rozwiązań Oferujemy Pracę w wymiarze pełnego etatu w dynamicznie rozwijającej się firmie w sektorze IT Pracę hybrydową lub zdalną. Atrakcyjne wynagrodzenie adekwatne do posiadanych umiejętności. Rozwój zawodowy, w tym szkolenia i certyfikacje w obszarze AI Wymianę wiedzy i poszerzenie jej o kolejne rozwiązania. Samodzielność w działaniu i realny wpływ na strategię firmy. Bogaty pakiet socjalny (w tym Multikafeteria i lekcje języka angielskiego). Indywidualny fundusz szkoleniowy, prywatną opiekę medyczną i ubezpieczenie na życie. Przyjazne środowisko pracy i niezbędne narzędzia. Pracę z nowoczesnymi technologiami w centrach danych Beyond.pl Aplikuj

Tech Stack

GPULinuxKubernetesSlurmInfinibandCephLustreAnsibleTerraformrun.ai

Interested in this job?

Login to Apply

Use our AI to tailor your resume for this ML/AI Infrastructure Engineer position at beyond.pl.