Senior Python AI Engineer — LLM / Agents / Document Intelligence

Удаленно, Asia/Pacific или EU · SaaS для работы с документами

Наш клиент - быстрорастущая продуктовая компания (SaaS). Флагманский продукт в области работы с документами уже обслуживает сотни тысяч активных пользователей ежемесячно и показывает экспоненциальный рост благодаря смелым продуктовым решениям и внедрению передовых технологий.

Обязанности

Решать сложные задачи document intelligence: OCR, структурированное извлечение данных, chunking, layout-aware парсинг, преобразование PDF в заданные схемы
Проектировать и выводить в продакшн RAG-пайплайны (vector databases, hybrid retrieval, reranking, сборка структурированного контекста)
Интегрировать облачные LLM API (OpenAI, Anthropic), а также при необходимости — компактные self-hosted модели в продуктовые фичи
Создавать масштабируемые inference-сервисы с использованием vLLM, batching, streaming, caching и других оптимизаций по latency / стоимости
Строить production-grade пайплайны: обучение, оценка качества, управление промптами / версиями моделей, деплой
Определять и улучшать качество AI через offline-оценки, регрессионные датасеты, метрики точности, скорости и надёжности
Тесно сотрудничать с продуктовыми менеджерами, дизайнерами и full-stack разработчиками для вывода AI-фич от идеи до пользователя

Требования

Практический опыт работы с PyTorch + HuggingFace: обучение, fine-tuning, inference, дебаг моделей
Глубокое понимание устройства трансформеров, токенизации, эмбеддингов, decoding-стратегий, trade-off’ов в оценке
Реальный опыт интеграции OpenAI / Anthropic API именно в пользовательские продукты (не просто прототипы)
Практика построения RAG-систем: chunking, эмбеддинг-пайплайны, векторный поиск, reranking, сборка контекста, борьба с галлюцинациями
Опыт работы с векторными хранилищами (pgvector, FAISS и подобные); понимание, когда retrieval помогает, а когда лучше детерминированные пайплайны
Знакомство с задачами понимания документов: OCR, парсинг PDF, извлечение таблиц/форм, нормализация «грязных» реальных данных
Опыт создания масштабируемых систем inference / model-serving; будет преимуществом знакомство с vLLM или аналогичными стеками
Умение самостоятельно разбираться в проблемах качества моделей (промпты, retrieval, данные, eval-сеты, поведение на inference)
Готовность и комфорт владеть системами в продакшене: деплой, мониторинг, разбор инцидентов, итеративное улучшение

Будет большим плюсом

Опыт деплоя ML/AI-сервисов через Docker на GCP (Cloud Run, GKE)
Работа с OpenTelemetry, Prometheus, Grafana или аналогичными инструментами observability
Опыт с Neo4j или другими графовыми базами знаний, где graph retrieval реально улучшает продукт
Знание RLHF, preference data, ranking / reward modeling
Глубокий бэкграунд в document understanding, OCR, структурированном парсинге PDF
Оптимизация inference по latency и стоимости: batching, caching, routing, speculative decoding

Условия

Полностью удалённая работа (location independent)
Неограниченный отпуск — берёте, когда нужно, главное — оставаться на пике формы
Максимальная автономия в обмен на высокие стандарты исполнения
Часовые пояса: Asia/Pacific или EU
Оформление через Deel.com (стандартный контракт)

Расскажите об этой вакансии в соцсетях

Отклик на вакансию:

Ваше имя

Фамилия

Телефон

Адрес эл. почты

Сопроводительное письмо

Ссылка на резюме (если есть)

Прикрепление резюме

Я даю согласие на обработку перс. данных в соответствии с политикой конфиденциальности CHOICEIT