AMER - Canada - Ontario - Toronto - University Ave, Canada
21 hours ago
Principal Machine Learning Operations Developer

Job Requisition ID #

25WD89881

Job Title: Principal Machine Learning Operations Developer for AI Research

Position Overview

The work we do at Autodesk touches nearly every person on the planet. By creating software tools for making buildings, machines, and even the latest movies, we influence and empower some of the most creative people in the world to solve problems that matter.

As a MLOps Developers at Autodesk Research, you will be working side-by-side with world-class AI researchers to build and scale foundation models trained on design data. You will focus on overcoming the challenges associated with large-scale model training and processing of vast amounts of diverse design data. Your expertise in distributed systems, ML infrastructure, and data engineering will be crucial in developing the next generation of ML-powered product features that will help our customers imagine, design, and make a better world.

You'll be joining a rapidly growing team working on a project that aims to revolutionize the design of nearly every aspect of the built environment. Your contributions will directly influence how designers, architects, and engineers interact with AI tools in the future.

This role is fully remote-friendly. Our team operates primarily remotely with team members distributed across the globe, with offices in London, Boston, Toronto and other locations worldwide. At Autodesk, we embrace remote work while fostering connection through regular team offsites for collaborative planning and relationship building. This balanced approach ensures you can work where you're most productive while maintaining meaningful connections with colleagues.

Responsibilities

Support AI researchers by building scalable ML training pipelines and infrastructure for foundation model development

Design efficient data processing workflows for large-scale design datasets and industry-specific file formats

Optimize distributed training systems and develop solutions for model parallelism, checkpointing, and efficient resource management

Analyze performance bottlenecks and provide solutions to scaling problems

Implement and maintain robust, testable code that is well documented and easy to understand

Collaborate on projects at the intersection of research and product with a diverse, global team of researchers and engineers

Present results to collaborators and leadership

Minimum Qualifications

BSc or MSc in Computer Science or related field, or equivalent industry experience

Experience with distributed systems for machine learning and deep learning at scale

Strong knowledge of ML infrastructure and model parallelism techniques, including frameworks like PyTorch, Lightning, Megatron, DeepSpeed, and FSDPProficiency in Python and strong software engineering practices

Experience with cloud services and architectures (AWS, Azure, etc.)

Familiarity with version control, CI/CD, and deployment pipelines

Excellent written documentation skills to document code, architectures, and experiments

Preferred Qualifications

Experience with AEC data formats (e.g., BIM models, IFC files, CAD files, Drawing Sets)

Knowledge of the AEC industry and its specific data processing challenges

Experience scaling ML training and data pipelines for large datasets

Experience with distributed data processing and ML infrastructure (e.g., Apache Spark, Ray, Docker, Kubernetes)

Experience with performance optimization, monitoring, and efficiency in large-scale ML systems

Experience with Autodesk or similar products (Revit, Sketchup, Forma)

The Ideal Candidate

A self-starter who can solve problems with minimal supervision while collaborating effectively with a global, remote-first team

Adaptable and creative, comfortable building new infrastructure or working within existing codebases

Thrives in ambiguous, rapidly evolving areas where learning and flexibility are essential

Excellent communicator who can convey complex technical concepts clearly to diverse audiences

______________________________________________________________________________________________________________

Ingénieur principal MLOps en IA"

Présentation du poste

Le travail que nous faisons chez Autodesk touche presque chaque personne sur la planète. En créant des outils logiciels pour construire des bâtiments, des machines et même les derniers films, nous influençons et donnons les moyens à certaines des personnes les plus créatives du monde de résoudre des problèmes importants.

En tant que développeur MLOps chez Autodesk Research,

vous travaillerez aux côtés de chercheurs en IA de renommée mondiale pour construire et mettre à l'échelle des modèles de base formés sur des données de conception. Vous vous concentrerez sur la résolution des défis associés à la formation de modèles à grande échelle et au traitement de vastes quantités de données de conception diverses. Votre expertise en matière de systèmes distribués, d'infrastructure d'apprentissage automatique et d'ingénierie des données sera cruciale pour développer la prochaine génération de fonctionnalités de produits basées sur l'apprentissage automatique qui aideront nos clients à imaginer, concevoir et créer un monde meilleur.

Vous rejoindrez une équipe en pleine croissance travaillant sur un projet qui vise à révolutionner la conception de presque tous les aspects de l'environnement bâti. Vos contributions influenceront directement la manière dont les designers, les architectes et les ingénieurs interagiront avec les outils d'IA à l'avenir.

Ce poste est entièrement adapté au télétravail. Notre équipe travaille principalement à distance, avec des membres répartis dans le monde entier, et des bureaux à Londres, Boston, Toronto et ailleurs. Chez Autodesk, nous encourageons le travail à distance tout en favorisant les liens entre les équipes grâce à des réunions régulières en dehors du bureau pour planifier la collaboration et renforcer les relations. Cette approche équilibrée vous permet de travailler là où vous êtes le plus productif tout en maintenant des liens significatifs avec vos collègues.

Responsabilités

Soutenir les chercheurs en IA en créant des pipelines et une infrastructure de formation ML évolutifs pour le développement de modèles de base

Concevoir des flux de traitement de données efficaces pour les ensembles de données de conception à grande échelle et les formats de fichiers spécifiques à l'industrie

Optimiser les systèmes de formation distribués et développer des solutions pour le parallélisme des modèles, le point de contrôle et la gestion efficace des ressources

Analyser les goulots d'étranglement en matière de performance et fournir des solutions aux problèmes d'évolutivité

Mettre en œuvre et maintenir un code robuste, testable, bien documenté et facile à comprendre

Collaborer à des projets à l'intersection de la recherche et du produit avec une équipe diversifiée et internationale de chercheurs et d'ingénieurs

Présenter les résultats aux collaborateurs et à la direction

Qualifications minimales

Licence ou master en informatique ou dans un domaine connexe, ou expérience équivalente dans l'industrie

Expérience des systèmes distribués pour l'apprentissage automatique et l'apprentissage profond à grande échelle

Solide connaissance de l'infrastructure d'apprentissage automatique et des techniques de parallélisme des modèles, y compris des frameworks tels que PyTorch, Lightning, Megatron, DeepSpeed et FSDP Maîtrise de Python et des bonnes pratiques en matière de génie logiciel

Expérience des services et architectures cloud (AWS, Azure, etc.)

Connaissance du contrôle de version, de l'intégration continue/développement continu et des pipelines de déploiement

Excellentes compétences en matière de documentation écrite pour documenter le code, les architectures et les expériences

Qualifications préférées

Expérience des formats de données AEC (par exemple, modèles BIM, fichiers IFC, fichiers CAO, jeux de dessins)

Connaissance du secteur AEC et de ses défis spécifiques en matière de traitement des données

Expérience de la mise à l'échelle de la formation en ML et des pipelines de données pour les grands ensembles de données

Expérience du traitement de données distribuées et de l'infrastructure ML (par exemple, Apache Spark, Ray, Docker, Kubernetes)

Expérience de l'optimisation des performances, de la surveillance et de l'efficacité des systèmes ML à grande échelle

Expérience avec Autodesk ou des produits similaires (Revit, Sketchup, Forma)

Le candidat idéal

Un esprit d'initiative qui peut résoudre des problèmes avec un minimum de supervision tout en collaborant efficacement avec une équipe mondiale, en priorité à distance

Adaptable et créatif, à l'aise pour construire de nouvelles infrastructures ou travailler dans des bases de code existantes

Épanoui dans des domaines ambigus et en évolution rapide où l'apprentissage et la flexibilité sont essentiels

Excellent communicateur capable de transmettre clairement des concepts techniques complexes à des publics divers

Learn More

About Autodesk

Welcome to Autodesk! Amazing things are created every day with our software – from the greenest buildings and cleanest cars to the smartest factories and biggest hit movies. We help innovators turn their ideas into reality, transforming not only how things are made, but what can be made.

We take great pride in our culture here at Autodesk – it’s at the core of everything we do. Our culture guides the way we work and treat each other, informs how we connect with customers and partners, and defines how we show up in the world.

When you’re an Autodesker, you can do meaningful work that helps build a better world designed and made for all. Ready to shape the world and your future? Join us!

Salary transparency

Salary is one part of Autodesk’s competitive compensation package. Offers are based on the candidate’s experience and geographic location. In addition to base salaries, our compensation package may include annual cash bonuses, commissions for sales roles, stock grants, and a comprehensive benefits package.

Diversity & Belonging
We take pride in cultivating a culture of belonging where everyone can thrive. Learn more here: https://www.autodesk.com/company/diversity-and-belonging

Are you an existing contractor or consultant with Autodesk?

Please search for open jobs and apply internally (not on this external site).

Por favor confirme su dirección de correo electrónico: Send Email