LEX — AI Legal Platform for Law Firms

AI-powered legal analysis platform for law firms and corporate counsel.

Features

Resources

Blog Articles

Technology

Built on AWS (EC2, Bedrock Claude AI, ALB, WAF, S3, ACM, KMS). PostgreSQL, Redis, Qdrant vector database. TypeScript, React, Node.js.

Start free — 50 credits on registration. Sign up

TECH 12 мин

Какие компетенции нам нужны от ML инженера: 9 пунктов, которые мы ждём в резюме

Google Cloud перед выделением GPU задаёт 5 вопросов. Мы разобрали их в 9 ML-компетенций — от LoRA на 70B и continued pre-training DeepSeek-V3 685B до RLHF с конституционным alignment и capacity planning для $200K+ training run. Конкретные примеры из нашего стека.

Какие компетенции нам нужны от ML инженера

Google Cloud перед выделением GPU задаёт пять вопросов. AWS — свои. Nebius — свои. Любой ML-инженер, которому мы доверим тренировку модели, должен знать ответы на все и понимать trade-offs за каждым. Вот детальный разбор компетенций — с конкретными примерами из нашего реального стека.


Контекст: пять вопросов от Google Cloud

На созвоне Dawid Szymula, Startup Territory Lead Google Cloud (Польша и Украина), попросил конкретику:

  1. Training / Fine-tuning / Inference — что именно, и как распределено во времени?
  2. Model specs — какая модель, сколько параметров, сколько тренировочных токенов?
  3. Concurrent users на пиковые моменты?
  4. Input/Output volume — средний промпт, длина ответа?
  5. TTFT (Time to First Token) — целевой показатель?

За этими пятью вопросами — вся дисциплина ML-инфраструктуры: от расчёта эффективного training plan до sizing GPU под inference. От кандидата на ML-роль у нас мы ждём свободного владения этими вопросами без подсказок — с конкретной разбивкой ниже.


1. Fine-tuning LLM 70B+ параметров

Что должно быть в резюме

Наш стек

Что проверим на pair-programming


2. Custom Embeddings Fine-tuning

Что должно быть в резюме

Наш стек

Что проверим


3. RLHF и Constitutional Alignment

Что должно быть в резюме

Наш стек

Что проверим


4. Cloud ML Infrastructure

Что должно быть в резюме

Наш стек

Что проверим


5. Inference Optimization

Что должно быть в резюме

Наш стек

Что проверим


6. Retrieval, RAG и Citation Verification

Что должно быть в резюме

Наш стек

Что проверим


7. Capacity Planning и Cost Modeling

Что должно быть в резюме

Наш стек

Что проверим


8. Evaluation Methodology

Что должно быть в резюме

Наш стек

Что проверим


9. Data Engineering для больших корпусов

Что должно быть в резюме

Наш стек

Что проверим


Bonus: что мы НЕ ищем


Как начать

Если вы чувствуете уверенность хотя бы в 4 из 9 пунктов выше — напишите на vladimir@legal.org.ua. Покажите:

  1. Один training run, которым гордитесь — что тренировали, на каком datascale, какие метрики
  2. Один inference-optimization win — что уменьшили, на сколько, как
  3. Почему вам интересен юридический домен — честно, без пафоса

Мы отвечаем в течение 48 часов. Первый шаг — pair-programming на реальной ML-задаче из нашего backlog (Бакет 2 в предыдущей статье).


Открытое репо: https://github.com/overthelex/secondlayer Issues для контрибьюторов: https://github.com/overthelex/secondlayer/labels/good-first-issue Контакт: vladimir@legal.org.ua


Claude Code welcome. Но ответы на технические вопросы — ваши, не агента.