Interr.io — продуктова AI-компанія, яка генерує дизайн інтер'єрів. Ми створюємо продукт, який перетворює фотографії порожніх приміщень на фотореалістичні дизайнерські концепти на основі текстових запитів користувачів.

Наша ціль — створити найрозумнішого автоматичного дизайнера на ринку.

Ми шукаємо ML Engineer, який побудує надійну інфраструктуру для запуску та масштабування цих мультимодальних моделей у продакшені, забезпечуючи низьку затримку та високу якість генерації.

Місія позиції:

Побудувати надійну, продуктивну та масштабовану ML-інфраструктуру, яка дозволить interr.io:

  • Запускати та підтримувати ML/LLM-функції в продакшені.
  • Забезпечувати стабільну якість результатів (боротьба з галюцинаціями).
  • Оптимізувати latency, cost та reliability системи.
  • Швидко експериментувати та оновлювати моделі.

Твоя головна мета: створити «серце» продукту — ML-системи, які працюють швидко, точно та стабільно.

Обов'язки та зони відповідальності:

  • Production ML: Розгортання та підтримка ML/LLM-моделей у продакшені (перехід від Notebooks до мікросервісів).
  • LLM Engineering: Робота з API (OpenAI, Gemini), open-source моделями та їхні fine-tuning.
  • RAG Architecture: Побудова повного циклу RAG: embeddings, векторні бази (Pinecone/Qdrant), retrieval стратегії.
  • Data Engineering: Побудова ETL/ELT-пайплайнів для підготовки даних під ML.
  • Integration: Тісна інтеграція моделей із backend-сервісами (FastAPI/Flask).
  • Optimization: Зниження затримок (latency) та вартості токенів, робота з пропускною здатністю (throughput).
  • Evaluation: Створення системи автоматичних тестів і бенчмарків для оцінки якості моделей і промптів.

У нас відбудеться метч, якщо ти маєш:

  • Досвід: 2.5+ років у ML Engineering / Data Science / NLP.
  • Продакшн-досвід впровадження моделей.
  • Python Strong: Глибокі знання Python (pandas, numpy, scikit-learn, pydantic).
  • LLM Stack: Досвід з OpenAI/Anthropic API, HuggingFace, розуміння принципів Prompt Engineering.
  • RAG & Vector DBs: Практичний досвід із векторним пошуком (Pinecone, Qdrant, Weaviate).
  • DevOps Skills: Docker, Kubernetes (базово), CI/CD. Ти маєш розуміти, як живе твій код на сервері.
  • Metrics: Розуміння, як оцінювати моделі (ROC, precision/recall, LLM eval frameworks).

Буде плюсом:

  • Досвід із LangChain або LlamaIndex.
  • Знання методів оптимізації (quantization, distillation, batching).
  • Досвід роботи з GPU та хмарними провайдерами (AWS/GCP/Azure).
  • Розуміння архітектури високонавантажених систем.

🤝 Ми пропонуємо:

  • Вплив: Ти будуєш архітектуру з нуля. Твої рішення визначають майбутнє продукту.
  • Розвиток: Прямий шлях до позицій Lead ML Engineer або AI Architect.
  • Команду: Пряма комунікація з фаундерами та сильною технічною командою.
  • Ремоут формат.

Процес найму: Call з рекрутером > Intro-call із менеджером > Тестове завдання > Технічне інтерв'ю > Офер.

Зацікавило? Надсилай резюме!