Machine Learning Engineer – MLOps Lead

New Jersey, NJRemoteusvia direct

// Job Type

Full Time

// Salary

Not disclosed

// Posted

6 months ago

// Work Mode

remote

About the Role

Job Title: Machine Learning Engineer – MLOps Lead Duration: Contract role Location: Remote, United States Role Mission You are being hired to productionize machine learning at scale — eliminating fragile pilot models, building hardened MLOps pipelines, and delivering compliant, monitored, and continuously improving ML systems that directly support business operations. Your success is measured not by “knowing tools,” but by deploying, stabilizing, and scaling real ML systems in production. First-Year Outcomes (What You Must Deliver) Within First 30 Days <ul> <li class="MsoNoSpacing">Fully assess current ML pipelines, data flows, and deployment architecture</li> <li class="MsoNoSpacing">Identify top 3 reliability, security, and performance risks in current ML lifecycle</li> <li class="MsoNoSpacing">Produce a documented MLOps modernization roadmap</li> </ul> Within 90 Days You will: <ul> <li class="MsoNoSpacing">Stand up standardized CI/CD pipelines for model training, validation, and deployment</li> <li class="MsoNoSpacing">Implement automated monitoring, alerting, and versioning across active production models</li> <li class="MsoNoSpacing">Deploy at least one business-critical ML model into hardened production pipelines</li> <li class="MsoNoSpacing">Establish security, audit, and compliance controls for model governance</li> <li class="MsoNoSpacing">Reduce model deployment cycle time by 30–50%</li> </ul> Within 180 Days You will: <ul> <li class="MsoNoSpacing">Operate a fully standardized enterprise MLOps framework (MLflow/Kubeflow/Airflow based)</li> <li class="MsoNoSpacing">Enable continuous retraining and automated rollback capability</li> <li class="MsoNoSpacing">Achieve ≥ 99.5% model uptime</li> <li class="MsoNoSpacing">Establish retraining cadence that improves model accuracy and reliability quarter-over-quarter</li> <li class="MsoNoSpacing">Mentor junior engineers and codify ML engineering standards</li> </ul> Ongoing Success Metrics <table class="Table"> <thead> <tr> <td>Metric</td> <td>Target</td> </tr> </thead> <tbody> <tr> <td> <ul> <li class="MsoNoSpacing">Production model uptime</li> </ul> </td> <td> <ul> <li class="MsoNoSpacing">≥ 99.5%</li> </ul> </td> </tr> <tr> <td> <ul> <li class="MsoNoSpacing">Model deployment cycle time</li> </ul> </td> <td> <ul> <li class="MsoNoSpacing">↓ 30–50%</li> </ul> </td> </tr> <tr> <td> <ul> <li class="MsoNoSpacing">Automated pipeline coverage</li> </ul> </td> <td> <ul> <li class="MsoNoSpacing">100%</li> </ul> </td> </tr> <tr> <td> <ul> <li class="MsoNoSpacing">Compliance audit readiness</li> </ul> </td> <td> <ul> <li class="MsoNoSpacing">Continuous</li> </ul> </td> </tr> <tr> <td> <ul> <li class="MsoNoSpacing">Model accuracy improvement</li> </ul> </td> <td> <ul> <li class="MsoNoSpacing">QoQ measurable gains</li> </ul> </td> </tr> </tbody> </table> What You Will Build <ul> <li class="MsoNoSpacing">End-to-end MLOps pipelines (data → training → testing → deployment → monitoring → retraining)</li> <li class="MsoNoSpacing">Kubernetes-based model serving platforms</li> <li class="MsoNoSpacing">Cloud ML platforms (Vertex AI / SageMaker / Azure ML)</li> <li class="MsoNoSpacing">CI/CD automation for ML systems</li> <li class="MsoNoSpacing">Model observability and alerting using Prometheus / Grafana</li> <li class="MsoNoSpacing">Secure, version-controlled ML governance frameworks</li> </ul> Required Experience (Performance Evidence) You must have: <ul> <li class="MsoNoSpacing">Proven delivery of production ML pipelines (not just experiments)</li> <li class="MsoNoSpacing">Built CI/CD for ML models in Kubernetes environments</li> <li class="MsoNoSpacing">Implemented monitoring, retraining, and version governance</li> <li class="MsoNoSpacing">Delivered at least one enterprise-scale ML deployment</li> <li class="MsoNoSpacing">Hands-on experience with MLflow / Kubeflow / Airflow</li> <li class="MsoNoSpacing">Cloud ML production deployment (AWS, GCP, or Azure)</li> <li class="MsoNoSpacing">Strong Python engineering background</li> </ul>

View on Original Source

Interested in this job?

Use our AI to tailor your resume for this Machine Learning Engineer – MLOps Lead position at CoSourcing Partners.