プロンプトエンジニア 求人

Staff Machine Learning Engineer, Voice AI

0万円 〜 0万円
San Francisco
正社員・契約社員
経験年数:
閲覧数:0

仕事内容

<h3><strong>About the Role</strong></h3> <p>Together AI is building the best inference infrastructure for voice applications. Our Voice AI platform powers production-grade, real-time voice agents and applications — serving speech-to-text and text-to-speech models with best-in-class latency and reliability.</p> <p>We're looking for a Staff ML Engineer to drive the model serving layer for voice workloads. You'll work hands-on with inference engines like TRT-LLM and SGLang to optimize how we serve models like Whisper, Parakeet, Orpheus, and Kokoro — pushing latency and throughput to the frontier. You'll profile GPU utilization, design batching strategies for streaming audio, and ensure new model architectures can go from research to production quickly.</p> <p>This is a foundational hire on a small, high-impact team. Voice inference has unique challenges — streaming audio, tokenization, real-time latency budgets — that require dedicated ML engineering focus. You'll shape how Together serves voice models as the industry moves from pipeline architectures (ASR → LLM → TTS) toward end-to-end speech-to-speech.</p> <ul> <li>Own the model serving stack that powers Together's voice platform across STT, TTS, and speech-to-speech.</li> <li>Work directly with state-of-the-art accelerators (H100s, H200s, B200s) to optimize voice model inference.</li> <li>Collaborate with model partners (Cartesia, Deepgram, Rime, and others) to bring their models to production on Together's infrastructure.</li> <li>Build quality evaluation frameworks that guide model selection for customers and inform the roadmap.</li> <li>Join a small, early-stage team with outsized impact on a fast-growing product area.</li> </ul> <p class="font-claude-response-body break-words whitespace-normal leading-[1.7]">&nbsp;</p> <p class="font-claude-response-body break-words whitespace-normal leading-[1.7]"><strong>Responsibilities</strong></p> <ul class="[li_&amp;]:mb-0 [li_&amp;]:mt-1 [li_&amp;]:gap-1 [&amp;:not(:last-

必須要件

求めるスキル

Python PyTorch CUDA LLM

勤務条件

勤務時間
雇用形態 正社員・契約社員
勤務地 San Francisco
リモートワーク 不可
Together AI 公式採用ページ掲載求人

この求人に応募する

11日前に掲載

公式ページで応募する

※ 企業の公式採用ページへ移動します

人気求人

他の人気求人をチェック

求人一覧を見る

メールアドレスで無料会員登録

正しいメールアドレスを入力してください
※半角英数記6~40文字
パスワードは6文字以上で入力してください
利用規約プライバシーポリシー をご確認のうえ、「同意して登録する」を押してください。
すでにアカウントをお持ちの方

求職者ログイン

初めての方
掲載企業様の方はこちら

企業様 新規登録

求人掲載をご希望の企業様向けの登録フォームです
正しいメールアドレスを入力してください
※半角英数記6~40文字
パスワードは6文字以上で入力してください
すでにアカウントをお持ちの方

企業ログイン

初めての方
求職者の方はこちら

パスワードリセット

ご登録いただいたメールアドレスを入力してください。
パスワードリセット用のリンクをメールでお送りします。

正しいメールアドレスを入力してください
アカウントをお持ちの方

企業様 パスワードリセット

ご登録いただいたメールアドレスを入力してください。
パスワードリセット用のリンクをメールでお送りします。

正しいメールアドレスを入力してください
アカウントをお持ちの方

新しいパスワードを設定

新しいパスワードを入力してください。

※半角英数記6~40文字
パスワードは6文字以上で入力してください