プロンプトエンジニア 求人

Senior AI Infrastructure Engineer, Model Serving Platform

0万円 〜 0万円
San Francisco, CA; New York, NY
正社員・契約社員
経験年数:
閲覧数:0

仕事内容

<p>As a Software Engineer on the ML Infrastructure team, you will design and build platforms for scalable, reliable, and efficient serving of LLMs. Our platform powers cutting-edge research and production systems, supporting both internal and external use cases across various environments.</p> <p>The ideal candidate combines strong ML fundamentals with deep expertise in backend system design. You’ll work in a highly collaborative environment, bridging research and engineering to deliver seamless experiences to our customers and accelerate innovation across the company.</p> <h2>You will:</h2> <ul> <li>Build and maintain fault-tolerant, high-performance systems for serving LLMs workloads at scale.</li> <li>Build an internal platform to empower LLM capability discovery.</li> <li>Collaborate with researchers and engineers to integrate and optimize models for production and research use cases.</li> <li>Conduct architecture and design reviews to uphold best practices in system design and scalability.</li> <li>Develop monitoring and observability solutions to ensure system health and performance.</li> <li>Lead projects end-to-end, from requirements gathering to implementation, in a cross-functional environment.&nbsp;</li> </ul> <h2>Ideally you'd have:</h2> <ul> <li>5+ years of experience building large-scale, high-performance backend systems.</li> <li>Strong programming skills in one or more languages (e.g., Python, Go, Rust, C++).</li> <li>Experience with LLM serving and routing fundamentals (e.g. rate limiting, token streaming, load balancing, budgets, etc.)</li> <li>Experience with LLM capabilities and concepts such as reasoning, tool calling, prompt templates, etc.</li> <li>Experience with containers and orchestration tools (e.g., Docker, Kubernetes).</li> <li>Familiarity with cloud infrastructure (AWS, GCP) and infrastructure as code (e.g., Terraform).</li> <li>Proven ability to solve complex problems and work independently in fast-moving environments.</li> </ul> <h2>

必須要件

求めるスキル

Python LLM Kubernetes Docker AWS GCP Rust C++

勤務条件

勤務時間
雇用形態 正社員・契約社員
勤務地 San Francisco, CA; New York, NY
リモートワーク 不可
Scale AI 公式採用ページ掲載求人

この求人に応募する

1日前に掲載

公式ページで応募する

※ 企業の公式採用ページへ移動します

人気求人

他の人気求人をチェック

求人一覧を見る

メールアドレスで無料会員登録

正しいメールアドレスを入力してください
※半角英数記6~40文字
パスワードは6文字以上で入力してください
利用規約プライバシーポリシー をご確認のうえ、「同意して登録する」を押してください。
すでにアカウントをお持ちの方

求職者ログイン

初めての方
掲載企業様の方はこちら

企業様 新規登録

求人掲載をご希望の企業様向けの登録フォームです
正しいメールアドレスを入力してください
※半角英数記6~40文字
パスワードは6文字以上で入力してください
すでにアカウントをお持ちの方

企業ログイン

初めての方
求職者の方はこちら

パスワードリセット

ご登録いただいたメールアドレスを入力してください。
パスワードリセット用のリンクをメールでお送りします。

正しいメールアドレスを入力してください
アカウントをお持ちの方

企業様 パスワードリセット

ご登録いただいたメールアドレスを入力してください。
パスワードリセット用のリンクをメールでお送りします。

正しいメールアドレスを入力してください
アカウントをお持ちの方

新しいパスワードを設定

新しいパスワードを入力してください。

※半角英数記6~40文字
パスワードは6文字以上で入力してください