TECH 2026-04-17 6 хв

Відкриваємо двері: шукаємо незалежних AI/ML інженерів і open-source контрибʼюторів

Name: LEX
Author: SecondLayer

LEX AI відкриває платформу як open source. Запрошуємо сильних інженерів — AI/ML, backend, data, frontend — долучатися контрибʼюторами або приєднуватися до команди. Що вже відкрито, кого шукаємо, і як долучитися.

Відкриваємо двері: шукаємо незалежних AI/ML інженерів і open-source контрибʼюторів

LEX AI будується з 2024 року невеликою командою. Зараз ми відкриваємо частину платформи як open source і хочемо, щоб до проєкту долучались незалежні інженери — як контрибʼютори і як майбутні члени команди.

Що таке LEX AI

LEX — українська юридична AI-платформа. Семантичний пошук по 100+ млн судових рішень (EDRSR — найбільший відкритий реєстр судових рішень у Європі), законодавство з Верховної Ради, OSINT і due diligence, консультації, білінг. Увесь стек зібрано як MCP (Model Context Protocol) сервери з уніфікованим gateway.

Наш окремий продукт — Panoptic (panoptic.com.ua) — OSINT-платформа з 18+ джерел intelligence-даних: санкції, корпоративне володіння, credential breaches, IP/domain reputation, GDELT, INTERPOL, World Bank Debarment.

Будуємо Harvey.ai-рівень якості для української юриспруденції на відкритих моделях — DeepSeek-V3, Llama, Qwen — бо дані унікальні (таких корпусів у ЄС немає), а open-weight моделі після continued pre-training дають 90%+ від flagship LLM на доменних задачах за долю вартості.

Структура наших репозиторіїв

Ми підтримуємо два репозиторії — і це важливо розуміти з самого початку.

1. `overthelex/secondlayer` — публічний, open source

Основне монорепо, тепер публічне:

https://github.com/overthelex/secondlayer

Майже вся платформа там:

Три MCP-сервери (mcp_backend, mcp_rada, mcp_openreyestr) — судова практика, парламент, бізнес-реєстри
Веб-фронтенд (lexwebapp) — React 19, Vite, TailwindCSS, Zustand, TanStack Query
Shared TypeScript-пакет (packages/shared) — LLM manager, logger, cost tracker, SSE handler, database base class
Developer Console (platform) — platform.legal.org.ua, портал для розробників: API ключі, документація, приклади інтеграцій
Data importers для 340M+ записів з 15 державних API — EDRSR, Верховна Рада, НАЗК, OpenReyestr, OpenSanctions, GLEIF, ICIJ Offshore Leaks, HIBP, NVD, INTERPOL, World Bank
Повний CI/CD — self-hosted GitHub Actions runner, blue-green deploy через SSH, Claude Code auto-fix агенти для падаючих білдів
Вся deployment-конфігурація — Docker Compose локально, blue-green compose на проді, nginx, manage-gateway script
Playwright E2E + Jest/Vitest unit tests
Міграції для трьох PostgreSQL-інстансів
Внутрішня документація, архітектурні нотатки

Клонуйте, читайте, запускайте локально. Все необхідне для робочого інстансу — там.

2. `overthelex/secondlayer-core` — приватний, closed source

Окремий репозиторій, який ми свідомо залишаємо приватним. Містить:

Логіку чату та оркестрації — як запити користувача класифікуються, маршрутизуються між tools і компонуються в багатокрокові відповіді
Продуктові промпти — конкретні шаблони, few-shot приклади, system messages для класифікації, сумаризації, перевірки цитат, вибору tool
Білінг та бізнес-логіку платежів — правила списання кредитів, розвʼязання підписочних тарифів, Monobank callback handlers
Anti-abuse і rate-limiting евристики, які ми не хочемо віддавати адверсаріям

Це мінімальна закрита поверхня, яка захищає наше продуктове позиціонування без стримування відкритих частин. Уся "chat logic" — prompt engineering, tool orchestration, каскадування моделей, композиція відповідей — живе тут, і вона не публічна. Відкритий репозиторій очікує цей шар як залежність, але постачає повнофункціональні stub-реалізації для контрибʼюторів.

Якщо ви приєднуєтесь до команди — отримуєте доступ до secondlayer-core з першого дня. Якщо контрибʼютите ззовні — працюєте з відкритим репо і стабами, що вже покриває все окрім продуктового prompt engineering.

Кого шукаємо

Ми не наймаємо за назвою посади. Ми шукаємо людей, які вже роблять сильні речі — і хочуть робити їх на осмисленому домені, з реальними даними і реальними користувачами.

AI/ML engineers:

LoRA fine-tuning великих моделей (70B+), continued pre-training
Embeddings fine-tuning (BGE-M3, custom encoders) для ретривалу
RLHF, constitutional alignment, adversarial training setups
Практика з Vertex AI / SageMaker HyperPod / Trainium / TPU v5p на multi-node clusters
Retrieval-augmented generation, citation verification, hallucination guards

Backend / distributed systems:

PostgreSQL на мільярди рядків (pgvector, partitioning, TOAST-оптимізації)
Event-driven архітектури, черги, реплікація, PgBouncer
MCP servers, tool orchestration, LLM gateways, cost tracking

Data engineering / OSINT:

Scraping на scale (rate-limiting, проксі-ротація, resume logic, checkpointing)
ETL для державних відкритих реєстрів
Sanctions screening, KYC/AML, due diligence pipelines

Frontend:

React 19 + TypeScript на продакшн-рівні
Складні UI для юридичної аналітики (data-heavy dashboards, evidence panels)
Ukrainian i18n, accessibility, performance optimization

Філософія

Відкрито все, що не ламає бізнес. Ми не приховуємо архітектуру — вона не є конкурентною перевагою. Перевага — дані, доменна якість моделей і швидкість ітерацій.
Прагматизм над хайпом. Distributed monolith сьогодні може бути правильною відповіддю. Мікросервіси ≠ чеснота. Фреймворк ≠ відповідь на задачу.
Юридична сфера заслуговує серйозної AI-розробки. Не "чатбот із законами", а справжнє моделювання юриспруденції: конституційне alignment, перевірка цитат, юрисдикційна спеціалізація.
Open source як дефолт. Якщо код не містить пропрієтарних промптів, API-ключів чи клієнтських даних — він публічний.

Як долучитися

Як contributor:

Подивіться відкриті issues на GitHub (github.com/overthelex/secondlayer)
Запропонуйте PR — ми робимо review протягом 48 годин
Для великих змін — відкрийте discussion першим

Як кандидат на роль:

Напишіть на vladimir@legal.org.ua з коротким резюме. Cover letter на сторінку не потрібен — покажіть три речі:

Що ви робили раніше (GitHub, посилання на конкретний проєкт із деталями)
Чому вам цікавий саме цей домен — юридична AI, open data, OSINT
Що хочете побудувати в наступні 6 місяців

Ми відповідаємо швидко. Interview — технічна дискусія (без LeetCode), pair-programming сесія на реальній задачі з бекапу, coffee chat із командою.

Наша обіцянка

Повністю remote. Команда розподілена Європою.
Без micromanagement. Довіра за замовчуванням. Результат важливіший за присутність у Slack.
Prod-доступ з першого дня. Ніяких "пробних місяців" у read-only.
Бюджет на обчислення. Якщо для ідеї потрібен GPU-кластер — ми говоримо з Google Cloud, AWS, Nebius і знаходимо ресурс.
Публікації під вашим імʼям. Ваша робота — ваша заслуга. Ми не приховуємо контрибʼюторів.

Про контекст

Ми зараз у активних переговорах із Google Cloud і AWS про sponsorship на 12-місячний ML training план ($195K–$265K, DeepSeek-V3 685B continued pre-training на 50–80B токенів корпусу EDRSR). Маємо платящих користувачів і B2B-клієнтів. Не startup-у-гаражі і не ще один enterprise-клон. Щось посередині — і це робить роботу цікавою.

Якщо вас запалює ідея побудувати реальну AI-інфраструктуру для юриспруденції на найбільшому відкритому корпусі судових рішень у Європі — давайте поговоримо.

Відкрите репо: https://github.com/overthelex/secondlayer Закритий core (chat logic): overthelex/secondlayer-core — приватний, надається при наймі Контакт: vladimir@legal.org.ua Сайт: https://legal.org.ua

Відкриваємо двері: шукаємо незалежних AI/ML інженерів і open-source контрибʼюторів

Відкриваємо двері: шукаємо незалежних AI/ML інженерів і open-source контрибʼюторів

Що таке LEX AI

Структура наших репозиторіїв

1. overthelex/secondlayer — публічний, open source

2. overthelex/secondlayer-core — приватний, closed source

Кого шукаємо

Філософія

Як долучитися

Наша обіцянка

Про контекст

1. `overthelex/secondlayer` — публічний, open source

2. `overthelex/secondlayer-core` — приватний, closed source