Открываем двери: ищем независимых AI/ML инженеров и open-source контрибьюторов
LEX AI открывает платформу как open source. Приглашаем сильных инженеров — AI/ML, backend, data, frontend — подключаться контрибьюторами или присоединяться к команде. Что уже открыто, кого ищем, и как подключиться.
Открываем двери: ищем независимых AI/ML инженеров и open-source контрибьюторов
LEX AI строится с 2024 года небольшой командой. Сейчас мы открываем часть платформы как open source и приглашаем независимых инженеров — как контрибьюторов и будущих членов команды.
Что такое LEX AI
LEX — украинская юридическая AI-платформа. Семантический поиск по 100+ млн судебных решений (EDRSR — крупнейший открытый реестр судебных решений в Европе), законодательство от Верховной Рады, OSINT и due diligence, консультации, биллинг. Весь стек собран как MCP (Model Context Protocol) серверы за унифицированным gateway.
Наш второй продукт — Panoptic (panoptic.com.ua) — OSINT-платформа, агрегирующая 18+ источников intelligence-данных: санкции, корпоративное владение, credential breaches, IP/domain reputation, GDELT, INTERPOL, World Bank Debarment.
Строим уровень качества Harvey.ai для украинской юриспруденции на открытых моделях — DeepSeek-V3, Llama, Qwen — потому что данные уникальны (такого корпуса в ЕС нет), а open-weight модели после continued pre-training дают 90%+ от flagship LLM на доменных задачах за долю стоимости.
Структура наших репозиториев
Мы поддерживаем два репозитория — и это важно понимать с самого начала.
1. overthelex/secondlayer — публичный, open source
Основное монорепо, теперь публичное:
https://github.com/overthelex/secondlayer
Почти вся платформа там:
- Три MCP-сервера (
mcp_backend,mcp_rada,mcp_openreyestr) — судебная практика, парламент, бизнес-реестры - Веб-фронтенд (
lexwebapp) — React 19, Vite, TailwindCSS, Zustand, TanStack Query - Shared TypeScript-пакет (
packages/shared) — LLM manager, logger, cost tracker, SSE handler, database base class - Developer Console (
platform) — platform.legal.org.ua, портал для разработчиков: API ключи, документация, примеры интеграций - Data importers для 340M+ записей из 15 государственных API — EDRSR, Верховная Рада, НАПК, OpenReyestr, OpenSanctions, GLEIF, ICIJ Offshore Leaks, HIBP, NVD, INTERPOL, World Bank
- Полный CI/CD — self-hosted GitHub Actions runner, blue-green deploy через SSH, Claude Code auto-fix агенты для падающих билдов
- Вся deployment-конфигурация — Docker Compose локально, blue-green compose на проде, nginx, manage-gateway script
- Playwright E2E + Jest/Vitest unit tests
- Миграции для трёх PostgreSQL-инстансов
- Внутренняя документация, архитектурные заметки
Клонируйте, читайте, запускайте локально. Всё необходимое для рабочего инстанса — там.
2. overthelex/secondlayer-core — приватный, closed source
Отдельный репозиторий, который мы сознательно оставляем приватным. Содержит:
- Логику чата и оркестрации — как запросы пользователя классифицируются, маршрутизируются между tools и компонуются в многошаговые ответы
- Продуктовые промпты — конкретные шаблоны, few-shot примеры, system messages для классификации, суммаризации, проверки цитат, выбора tool
- Биллинг и бизнес-логику платежей — правила списания кредитов, разрешение тарифов подписок, Monobank callback handlers
- Anti-abuse и rate-limiting эвристики, которые мы не хотим раскрывать адверсариям
Это минимальная закрытая поверхность, которая защищает наше продуктовое позиционирование без торможения открытых частей. Вся "chat logic" — prompt engineering, tool orchestration, каскадирование моделей, композиция ответов — живёт здесь, и она не публичная. Открытый репозиторий ожидает этот слой как зависимость, но поставляет полнофункциональные stub-реализации для контрибьюторов.
Если вы присоединяетесь к команде — получаете доступ к secondlayer-core с первого дня. Если контрибьютите извне — работаете с открытым репо и стабами, что уже покрывает всё кроме продуктового prompt engineering.
Кого ищем
Мы не нанимаем по названию должности. Мы ищем людей, которые уже делают сильные вещи — и хотят делать их на осмысленном домене, с реальными данными и реальными пользователями.
AI/ML engineers:
- LoRA fine-tuning больших моделей (70B+), continued pre-training
- Embeddings fine-tuning (BGE-M3, custom encoders) для ретривала
- RLHF, constitutional alignment, adversarial training setups
- Практика с Vertex AI / SageMaker HyperPod / Trainium / TPU v5p на multi-node clusters
- Retrieval-augmented generation, citation verification, hallucination guards
Backend / distributed systems:
- PostgreSQL на миллиарды строк (pgvector, partitioning, TOAST-оптимизации)
- Event-driven архитектуры, очереди, репликация, PgBouncer
- MCP servers, tool orchestration, LLM gateways, cost tracking
Data engineering / OSINT:
- Scraping на scale (rate-limiting, прокси-ротация, resume logic, checkpointing)
- ETL для государственных открытых реестров
- Sanctions screening, KYC/AML, due diligence pipelines
Frontend:
- React 19 + TypeScript на продакшн-уровне
- Сложный UI для юридической аналитики (data-heavy dashboards, evidence panels)
- Ukrainian i18n, accessibility, performance optimization
Философия
- Открыто всё, что не ломает бизнес. Мы не скрываем архитектуру — она не является конкурентным преимуществом. Преимущество — данные, доменное качество моделей и скорость итераций.
- Прагматизм важнее хайпа. Distributed monolith сегодня может быть правильным ответом. Микросервисы ≠ добродетель. Фреймворк ≠ ответ на задачу.
- Юридическая сфера заслуживает серьёзной AI-разработки. Не "чатбот с законами", а настоящее моделирование юриспруденции: конституционное alignment, проверка цитат, юрисдикционная специализация.
- Open source по умолчанию. Если код не содержит проприетарных промптов, API-ключей или клиентских данных — он публичный.
Как подключиться
Как contributor:
- Посмотрите открытые issues на GitHub (
github.com/overthelex/secondlayer) - Предложите PR — ревью в течение 48 часов
- Для крупных изменений — откройте discussion первым
Как кандидат на роль:
Напишите на vladimir@legal.org.ua с кратким резюме. Cover letter на страницу не нужен — покажите три вещи:
- Что делали раньше (GitHub, ссылка на конкретный проект с деталями)
- Почему интересен именно этот домен — юридическая AI, open data, OSINT
- Что хотите построить в ближайшие 6 месяцев
Мы отвечаем быстро. Interview — техническая дискуссия (без LeetCode), pair-programming сессия на реальной задаче из бэклога, coffee chat с командой.
Наше обещание
- Полностью remote. Команда распределена по Европе.
- Без micromanagement. Доверие по умолчанию. Результат важнее присутствия в Slack.
- Prod-доступ с первого дня. Никаких "испытательных месяцев" в read-only.
- Бюджет на вычисления. Если для идеи нужен GPU-кластер — мы говорим с Google Cloud, AWS, Nebius и находим ресурс.
- Публикации под вашим именем. Ваша работа — ваша заслуга. Мы не скрываем контрибьюторов.
О контексте
Сейчас мы в активных переговорах с Google Cloud и AWS о sponsorship на 12-месячный ML training план ($195K–$265K, DeepSeek-V3 685B continued pre-training на 50–80B токенов корпуса EDRSR). Есть платящие пользователи и B2B-клиенты. Не startup-в-гараже и не очередной enterprise-клон. Что-то посередине — и это делает работу интересной.
Если вас зажигает идея построить реальную AI-инфраструктуру для юриспруденции на крупнейшем открытом корпусе судебных решений в Европе — давайте поговорим.
Открытое репо: https://github.com/overthelex/secondlayer
Закрытый core (chat logic): overthelex/secondlayer-core — приватный, предоставляется при найме
Контакт: vladimir@legal.org.ua
Сайт: https://legal.org.ua