LEX — AI Legal Platform for Law Firms

AI-powered legal analysis platform for law firms and corporate counsel.

Features

Resources

Blog Articles

Technology

Built on AWS (EC2, Bedrock Claude AI, ALB, WAF, S3, ACM, KMS). PostgreSQL, Redis, Qdrant vector database. TypeScript, React, Node.js.

Start free — 50 credits on registration. Sign up

TECH 12 хв

Які компетенції нам потрібні від ML інженера: 9 пунктів, які ми чекаємо у резюме

Google Cloud перед виділенням GPU ставить 5 питань. Ми розібрали їх у 9 ML-компетенцій — від LoRA на 70B і continued pre-training DeepSeek-V3 685B до RLHF із конституційним alignment і capacity planning для $200K+ training run. Конкретні приклади з нашого stack.

Які компетенції нам потрібні від ML інженера

Google Cloud перед виділенням GPU ставить п'ять запитань. AWS — свої. Nebius — свої. Будь-який ML-інженер, якому ми довіримо тренування моделі, має знати відповіді на всі з них і розуміти trade-offs за кожним. Ось детальний розбір компетенцій, які ми шукаємо — з прикладами з нашого реального стеку.


Контекст: п'ять питань від Google Cloud

На зустрічі Dawid Szymula, Startup Territory Lead Google Cloud (Польща і Україна), попросив від нас конкретику:

  1. Training / Fine-tuning / Inference — що саме, і як розподілено у часі?
  2. Model specs — яка модель, скільки параметрів, скільки тренувальних токенів?
  3. Concurrent users на пікові моменти?
  4. Input/Output volume — середній промпт, довжина відповіді?
  5. TTFT (Time to First Token) — цільовий показник?

За цими п'ятьма питаннями стоїть уся дисципліна ML-інфраструктури: від розрахунку ефективної моделі тренування до sizing GPU під inference. Від кандидата на ML-роль у нас ми очікуємо володіння цими питаннями без підказок — з подальшою конкретикою нижче.


1. Fine-tuning LLM 70B+ параметрів

Що має бути за плечима

Наш стек

Що перевіримо на pair-programming


2. Custom Embeddings Fine-tuning

Що має бути за плечима

Наш стек

Що перевіримо


3. RLHF і Constitutional Alignment

Що має бути за плечима

Наш стек

Що перевіримо


4. Cloud ML Infrastructure

Що має бути за плечима

Наш стек

Що перевіримо


5. Inference Optimization

Що має бути за плечима

Наш стек

Що перевіримо


6. Retrieval, RAG і Citation Verification

Що має бути за плечима

Наш стек

Що перевіримо


7. Capacity Planning і Cost Modeling

Що має бути за плечима

Наш стек

Що перевіримо


8. Evaluation Methodology

Що має бути за плечима

Наш стек

Що перевіримо


9. Data Engineering для великих корпусів

Що має бути за плечима

Наш стек

Що перевіримо


Bonus: що ми НЕ шукаємо


Як почати

Якщо ви почуваєтесь упевнено хоча б у 4 з 9 пунктів вище — напишіть на vladimir@legal.org.ua. Покажіть:

  1. Один training run, яким ви пишаєтесь — що тренували, на якому datascale, які метрики
  2. Один inference-optimization win — що зменшили, на скільки, як
  3. Чому вам цікавий юридичний домен — чесно, без пафосу

Ми відповідаємо протягом 48 годин. Перший крок — pair-programming на реальній ML-задачі з нашого backlog (Bucket 2 у попередній статті).


Відкрите репо: https://github.com/overthelex/secondlayer Issues для контрибʼюторів: https://github.com/overthelex/secondlayer/labels/good-first-issue Контакт: vladimir@legal.org.ua


Claude Code welcome. Але відповіді на технічні питання — ваші, не агента.