logo

Senior Python AI Engineer — LLM / Agents / Document Intelligence

Удаленно, Asia/Pacific или EU · SaaS для работы с документами
Откликнуться

Наш клиент - быстрорастущая продуктовая компания (SaaS). Флагманский продукт в области работы с документами уже обслуживает сотни тысяч активных пользователей ежемесячно и показывает экспоненциальный рост благодаря смелым продуктовым решениям и внедрению передовых технологий.

Обязанности

  • Решать сложные задачи document intelligence: OCR, структурированное извлечение данных, chunking, layout-aware парсинг, преобразование PDF в заданные схемы
  • Проектировать и выводить в продакшн RAG-пайплайны (vector databases, hybrid retrieval, reranking, сборка структурированного контекста)
  • Интегрировать облачные LLM API (OpenAI, Anthropic), а также при необходимости — компактные self-hosted модели в продуктовые фичи
  • Создавать масштабируемые inference-сервисы с использованием vLLM, batching, streaming, caching и других оптимизаций по latency / стоимости
  • Строить production-grade пайплайны: обучение, оценка качества, управление промптами / версиями моделей, деплой
  • Определять и улучшать качество AI через offline-оценки, регрессионные датасеты, метрики точности, скорости и надёжности
  • Тесно сотрудничать с продуктовыми менеджерами, дизайнерами и full-stack разработчиками для вывода AI-фич от идеи до пользователя


Требования


  • Практический опыт работы с PyTorch + HuggingFace: обучение, fine-tuning, inference, дебаг моделей
  • Глубокое понимание устройства трансформеров, токенизации, эмбеддингов, decoding-стратегий, trade-off’ов в оценке
  • Реальный опыт интеграции OpenAI / Anthropic API именно в пользовательские продукты (не просто прототипы)
  • Практика построения RAG-систем: chunking, эмбеддинг-пайплайны, векторный поиск, reranking, сборка контекста, борьба с галлюцинациями
  • Опыт работы с векторными хранилищами (pgvector, FAISS и подобные); понимание, когда retrieval помогает, а когда лучше детерминированные пайплайны
  • Знакомство с задачами понимания документов: OCR, парсинг PDF, извлечение таблиц/форм, нормализация «грязных» реальных данных
  • Опыт создания масштабируемых систем inference / model-serving; будет преимуществом знакомство с vLLM или аналогичными стеками
  • Умение самостоятельно разбираться в проблемах качества моделей (промпты, retrieval, данные, eval-сеты, поведение на inference)
  • Готовность и комфорт владеть системами в продакшене: деплой, мониторинг, разбор инцидентов, итеративное улучшение

Будет большим плюсом

  • Опыт деплоя ML/AI-сервисов через Docker на GCP (Cloud Run, GKE)
  • Работа с OpenTelemetry, Prometheus, Grafana или аналогичными инструментами observability
  • Опыт с Neo4j или другими графовыми базами знаний, где graph retrieval реально улучшает продукт
  • Знание RLHF, preference data, ranking / reward modeling
  • Глубокий бэкграунд в document understanding, OCR, структурированном парсинге PDF
  • Оптимизация inference по latency и стоимости: batching, caching, routing, speculative decoding

Условия

  • Полностью удалённая работа (location independent)
  • Неограниченный отпуск — берёте, когда нужно, главное — оставаться на пике формы
  • Максимальная автономия в обмен на высокие стандарты исполнения
  • Часовые пояса: Asia/Pacific или EU
  • Оформление через Deel.com (стандартный контракт)
Расскажите об этой вакансии в соцсетях

Отклик на вакансию:

Я даю согласие на обработку перс. данных в соответствии с политикой конфиденциальности CHOICEIT