LEX — AI Legal Platform for Law Firms

AI-powered legal analysis platform for law firms and corporate counsel.

Features

Resources

Blog Articles

Technology

Built on AWS (EC2, Bedrock Claude AI, ALB, WAF, S3, ACM, KMS). PostgreSQL, Redis, Qdrant vector database. TypeScript, React, Node.js.

Start free — 50 credits on registration. Sign up

LEX AI Blog

Статті про AI в юриспруденції, юридичні технології, аналіз судових рішень, fine-tuning LLM на судовій практиці та цифрову трансформацію правничої практики.

Few-Shot Degradation in Morphologically Rich Languages: Cross-Domain and Cross-Lingual Evidence from Ukrainian

Follow-up to our tokenizer fertility study. Five experiments across SIB-200, EU Acts (24 languages), and ULP datasets. Tokenizer fertility is domain-invariant (1.63x on news vs 1.60x on legal). Few-shot degradation is task-dependent, not language-intrinsic. Ukrainian costs 20-40% more to tokenize than cognate Slavic languages.

ACADEMIC 15 min read (experiments in progress)
#Few-Shot Learning #Tokenizer #Ukrainian NLP #Cross-Lingual #SIB-200 #Slavic Languages

Архітектура персистентної пам\

Крос-доменна валідація на трьох незалежних датасетах підтверджує: надлишковість контексту ~50-60% є системною для автономних агентів; ротація операторів коштує +136% діалогових раундів (Hedges\

ACADEMIC PDF, 22 стор., українською
#Проблеми програмування #БПЛА #Пам\ #, #, #, #,

Automatic Construction of a Legal Citation Graph from 100 Million Ukrainian Court Decisions

Half a billion citation edges extracted from 100.7 million Ukrainian court decisions reveal that judicial citation structure encodes legal domain boundaries without supervision and predicts future legislative importance with near-perfect accuracy (AUC = 0.9984).

ACADEMIC PDF, 9 pages
#Citation Graph #Legal NLP #EDRSR #Ontology #Network Analysis

Edit-Trace Oversight: Scalable Alignment Signal from Agentic Workflows

Edit-traces from production agentic workflows produce alignment signal that is denser, more outcome-predictive, and distributionally unlike conventional RLHF preference data. 80.7% of edits are substantive rewrites; binary rejection correlates with 78% positive outcomes — the strongest oversight signal.

ACADEMIC PDF, 28 pages
#arXiv preprint #RLHF #Edit-Trace #Alignment #Agentic Workflows

From Ontology-Controlled Systems to Oversight-Controlled Training: Formal Foundations for Human–LLM Alignment Signal Validation

Ontology-based filtering of human oversight signal predicts downstream outcome quality: sessions classified as full oversight by a formal domain constitution exhibit 3-6x higher rejection rate, concentrating the most informative alignment action.

ACADEMIC PDF, 30 pages
#Cybernetics & Systems Analysis #Ontology #OWL 2 DL #Alignment #Formal Methods

Workflow Memory for Long-Horizon Agentic Composition: Architecture, Dual-Mode Retrieval, and Retrieval-Correction Signal

Sixty percent of context tokens in current LLM agentic sessions are wasted — redundant re-explanation of decisions already made in prior sessions. The key insight: the memory layer produces alignment data (retrieval-correction signal), not just consumes it.

ACADEMIC PDF, 32 pages
#arXiv preprint #Memory Architecture #Agentic AI #RAG #Oversight

Tokenizer Fertility and Zero-Shot Performance of Foundation Models on Ukrainian Legal Text: A Comparative Study

Tokenizer fertility varies 1.6x across foundation models on Ukrainian legal text, yet this cost-critical dimension is absent from model selection practice. Qwen 3 consumes 60% more tokens than Llama-family; NVIDIA Nemotron Super 3 (120B) outperforms Mistral Large 3 at 1/3 the cost.

ACADEMIC PDF, 24 pages
#arXiv preprint #Tokenizer #Ukrainian NLP #Foundation Models #Legal AI

RAG підсвічує, тренінг орієнтує: що робити з неоднорідністю судової практики

Під попередньою статтею прийшов коментар: "задача змістилася від доступу до практики до управління її неоднорідністю". Точне формулювання. Розбираємо, чому ваги авторитетності у RAG — полмера, що саме додає тренінг власної моделі, і чому в проді потрібні обидва шари.

TECH 8 хв
#RAG #DPO #MoE #ЄДРСР #Legal AI #ML Training

2 ТБ українського права + DeepSeek V3 860B на GCP: що ми отримаємо

У нас на проді ~1.5 ТБ ЄДРСР із векторами + ~550 ГБ реєстрів, законодавства, іспанських джерел і EU-Lex. Якщо прогнати це крізь MoE-модель розміру DeepSeek V3, масштабовану до 860B на TPU v5p — що вийде? Розбираємо датасет, архітектуру, ціну прогону і властивості моделі.

TECH 9 хв
#DeepSeek V3 #MoE #TPU v5p #GCP #ЄДРСР #ML Training

Як ми векторизуємо 33.7M судових рішень ЄДРСР через Voyage AI

ЄДРСР — вся судова практика України у відкритому доступі. 44M+ векторів у Qdrant, 14.3M цивільних справ уже оброблено з 33.7M. Розбираємо пайплайн: чанкінг, паралелізм, checkpoint/resume, виділений EC2 для Qdrant, і скільки це коштує.

TECH 7 хв
#Voyage AI #Qdrant #ЄДРСР #RAG #Vector Search #PostgreSQL

SneakyPiper: 16.7M entities, 31K dark-web subjects, 30+ OSINT джерел у продакшні

Наш OSINT-продукт SneakyPiper.com робить due diligence для американського бізнесу. Під капотом — 16.7M сущностей OpenSanctions, 31K класифікованих тем із даркнет-форумів, жива стрічка ransomware-жертв і GitHub credential leaks. Розбираємо, звідки що беремо і як це працює у проді.

TECH 10 хв
#OSINT #Due Diligence #Sanctions #Dark Web #Open Data #Panoptic

Які компетенції нам потрібні від ML інженера: 9 пунктів, які ми чекаємо у резюме

Google Cloud перед виділенням GPU ставить 5 питань. Ми розібрали їх у 9 ML-компетенцій — від LoRA на 70B і continued pre-training DeepSeek-V3 685B до RLHF із конституційним alignment і capacity planning для $200K+ training run. Конкретні приклади з нашого stack.

TECH 12 хв
#Machine Learning #LLM #Hiring #RLHF #Fine-tuning #Vertex AI

Що ми делегуємо незалежним розробникам: PR замість інтервʼю, Claude Code вітається

Конкретні бакети задач, які чекають контрибʼюторів: OpenData-адаптери, ML-експерименти, frontend, performance, тести. Наш єдиний "інтервʼю" — ваш перший pull request. AI-assisted код вітається — ми самі щодня пишемо з Claude Code.

TECH 8 хв
#Open Source #Hiring #Community #Claude Code #Contributing

Відкриваємо двері: шукаємо незалежних AI/ML інженерів і open-source контрибʼюторів

LEX AI відкриває платформу як open source. Запрошуємо сильних інженерів — AI/ML, backend, data, frontend — долучатися контрибʼюторами або приєднуватися до команди. Що вже відкрито, кого шукаємо, і як долучитися.

TECH 6 хв
#Open Source #Hiring #Community #AI/ML #Careers

Швидкий білд в AWS: як перенести CI/CD runners у хмару та забути про OOM на ноутбуці

Ваш ноутбук не має 32 CPU. npm install конкурує за диск з Docker. TypeScript падає з OOM на великому монорепо, а Playwright не витягує паралелізм. Розбираємо, як перенести GitHub Actions runners на AWS — від c7g Spot до actions-runner-controller на EKS — і отримати 3-5× пришвидшення білду без пекла на локальній машині.

TECH 12 хв
#AWS #CI/CD #GitHub Actions #DevOps #Performance

Opus + RAG vs Fine-tuned LLM + RAG: два підходи до юридичного AI на прикладі LEX та Harvey

Harvey витратив $100M+ і 10B токенів на fine-tuning case law моделі з OpenAI. Ми підключили Opus до 100M+ судових рішень ЄДРСР через RAG. Обидва шляхи працюють — але для різних реальностей.

TECH 22 хв
#LLM #Fine-tuning #RAG #Claude Opus #Harvey AI #OpenAI #Google #DeepSeek #EDRSR #Legal AI

Як я написав 1 200+ комітів за 50 днів: Claude Code як повноцінний інженерний напарник

800+ сесій, 10 000+ повідомлень, 1 200+ комітів, 328 000 рядків коду, 40 000+ bash-команд — і жодного найнятого розробника. Реальна статистика 50 днів безперервної роботи з Claude Code для побудови legal tech платформи.

TECH 15 хв
#Claude Code #AI #Productivity #Startups #DevOps #MCP

Безпека AI-моделей навчених на відкритих реєстрах: закони Азімова

Як забезпечити, щоб модель з доступом до 50M+ записів не стала інструментом тиску на невинних? Три закони Азімова адаптовані до юридичного AI, сценарії загроз та архітектурні рішення.

LEGAL 18 хв

Проблема Long Tail при RLHF-навчанні юридичної моделі

5 категорій покривають 90% корпусу ЄДРСР. Як Long Tail руйнує RLHF, чому модель стає «цивілістом» і які стратегії подолання ми впроваджуємо на GCP за $240K/6 міс.

TECH 16 хв

Конституція України як reward signal: конституційне RLHF

Як статті 3, 28, 32, 62 Конституції стають reward-функціями при RLHF-навчанні. Презумпція невинуватості як hardcoded правило, конституційні колізії та benchmark з 500+ сценаріїв.

LEGAL 20 хв

Експериментальний AI-суд: моделювання процесів через всі інстанції

Три окремі моделі — суддя, прокурор, адвокат — з інформаційною ізоляцією відтворюють змагальність. Інстанційна спеціалізація, дерево результатів та adversarial training на GCP.

TECH 22 хв

Конституція LegalTech LLM: звід правил для юридичних AI-моделей

30 статей, 9 розділів, відкрита ліцензія. ТОВ «Лекс ЕйАй» ініціює розробку галузевого стандарту для LegalTech моделей — від презумпції невинуватості до захисту у воєнний час, з прямою імплементацією у reward model.

LEGAL 24 хв

Distributed Monolith: коли мікросервіси — це моноліт із мережевими затримками

3 сервіси, 1 PostgreSQL, спільний Redis, один docker-compose — і ілюзія незалежності. Як розпізнати distributed monolith у власній архітектурі, коли він корисний, і коли настає час справжнього розділення.

TECH 14 хв
#Architecture #Microservices #Monolith #Scaling #DevOps

Як ми синхронізуємо 380M+ записів з 40+ джерел даних, які постійно падають

Multi-IP імпорт, автоматичний scheduler, freshness-моніторинг, міжнародна експансія — інженерія data pipeline для відкритих даних. Від першого 404 до стабільного оновлення 110+ таблиць щоночі.

TECH 15 хв
#OpenData #Data Pipeline #DevOps #Моніторинг #API #PostgreSQL

CI/CD з blue-green preview та самозцілюваними тестами

Як ми побудували pipeline, що не падає о 3 ночі: blue-green з approval gate, prod safety guard, і 8 PR за 3 години щоб приборкати Vitest OOM.

TECH 18 хв
#CI/CD #Blue-Green #Vitest #GitHub Actions #DevOps

Аналіз судової практики ВП ВС за березень 2026: що не враховано в огляді

Глибокий аналіз 5 справ Великої Палати ВС та рішень про штрафи ТЦК на основі повних текстів рішень та окремих думок суддів. Знайдено фактичні помилки, пропущені окремі думки суддів Мазура, Погрібного та Ємця, ключовий висновок про пропорційність та неточності щодо складу учасників.

LEGAL 20 хв
#Судова практика #Велика Палата ВС #ТЦК #Земельне право #Газ #Прокурор

Безпека LEX AI: GDPR-аудит, 10 виправлень і 7 рівнів захисту

5 паралельних white-hat агентів перевірили платформу на відповідність GDPR та OWASP Top 10. Знайшли 23 вразливості — від SQL-ін\

TECH 15 хв
#Security #GDPR #OWASP #Cloudflare #WebAuthn #E2EE

340 мільйонів записів і 64 інструменти: повна карта даних LEX AI

ЄДРСР, санкції, патенти, адвокати, судді, законодавство, парламент, реєстри — усі джерела відкритих даних, які зараз працюють на продакшені. Що є, як користуватись, і що буде далі.

TECH 12 хв
#OpenData #MCP #ЄДРСР #Sanctions #IP #Rada

86 готових запитів до LEX AI: один на кожен інструмент

Ми зібрали 66 запитів, кожен з яких активує конкретний інструмент платформи — від пошуку судових рішень до перевірки торгових марок. Плюс 20 комплексних запитів, що задіюють 2–3 інструменти одночасно. Усі працюють із мінімальним використанням LLM — максимум точності, мінімум витрат.

TECH 12 хв
#MCP #Tools #Prompts #LegalTech #Реєстри #ЄДРСР

Як AI змінює роботу українського адвоката у 2026 році

56 інструментів замість 12 вкладок у браузері. Семантичний пошук по 45M рішень. Повнотекстовий аналіз за секунди. Due diligence одним запитом. Не заміна юриста — а екзоскелет для його мозку.

LEGAL 10 хв
#AI #LegalTech #Адвокат #Автоматизація

Вихід на ринок Іспанії: як українська LegalTech платформа адаптується до європейського права

Імпорт іспанських правових даних з BOE та CENDOJ. Гео-детекція локалі. Автоматична локалізація на 4 мови. Нові MCP-інструменти для іспанського законодавства. Від Києва до Мадрида — одна кодова база.

TECH 8 хв
#Spain #i18n #Expansion #EU #LegalTech

API для розробників: як інтегрувати 56+ юридичних MCP інструментів у свій продукт

6 вкладок документації: Overview, каталог 56 інструментів, автентифікація, приклади коду (curl/TS/Python/SSE), конфіги MCP-клієнтів (Claude Desktop/Cursor/VS Code), прайсинг. Від реєстрації до першого запиту — 5 хвилин.

TECH 9 хв
#API #Documentation #MCP #Developer #Integration

Дія.Підпис для бізнесу: технічні виклики інтеграції з державним сервісом

ECDSA + SHA256 для хешування. Redis key mismatch між start та verify. QR-код і deep link. Оновлення даних ФОП/ТОВ при кожному логіні. 4 фікси за добу. Реальна історія інтеграції з Дією — без прикрас.

TECH 8 хв
#Diia #Auth #Integration #ECDSA #Government

41.8 мільйонів записів з відкритих реєстрів України — тепер доступні через AI

11 державних реєстрів з data.gov.ua імпортовано на платформу: виконавчі провадження, боржники, нотаріуси, банкрутство, ЄДРНПА та інші — всі доступні юристу через AI-чат.

TECH 7 хв
#OpenData #NAIS #MCP #data.gov.ua

Developer Platform: 56 юридичних AI-інструментів через один API

Ми відкрили platform.legal.org.ua — портал для розробників, які хочуть інтегрувати юридичний AI у свої продукти. API-ключі, аналітика використання, документація на 56 інструментів, приклади для Python і TypeScript. MCP SSE, REST, batch — три транспорти на вибір. Від реєстрації до першого запиту — 5 хвилин.

TECH 7 хв
#API #DeveloperPlatform #MCP #Integration

AI для військового адвоката: пошук по 273K+ рішень за секунди

126 934 рішень по ст. 407 КК. 26 926 справ по ухиленню від мобілізації. 1 721 постанова касації. Повнотекстовий пошук по 110M+ документів. Тексти законодавства за 2 секунди. Ланцюжки оскаржень. Все в одній платформі.

LEGAL 8 хв
#MilitaryLaw #AI #CourtPractice #EDRSR #CriminalLaw

EDRSR: як ми імпортували мільйони судових рішень з держреєстру

60 мільйонів повних текстів. 283 ГБ на 4 шардах. Кастомний RTF-парсер з depth-tracking для Windows-1251 кирилиці. Двофазний ETL з idempotent upsert через temp-таблиці. Application-level sharding по doc_id з незалежними backup domains. PostgreSQL shared memory exhaustion і три рівні захисту. Все на відкритих даних ЄДРСР.

TECH 15 хв
#EDRSR #OpenData #PostgreSQL #DataPipeline #Python #Sharding

Як ми зменшили латентність чату: 7 фаз оптимізації

Від 12 секунд до 2.8 — історія про те, як ми перетворили повільний юридичний чат на інструмент, яким приємно користуватись

TECH 9 хв
#Performance #Chat #SSE #Optimization

AWS Bedrock як LLM-провайдер: від OpenAI fallback до Claude + Nova Pro

Один SDK замість двох бібліотек. IAM замість API-ключів. Дані в ЄС замість США. Єдиний білінг замість двох інвойсів. Ось як ми перевели весь fallback-шар на AWS Bedrock — і чому це змінило більше, ніж ми очікували.

TECH 7 хв
#AWS #Bedrock #LLM #CostOptimization

Реєстр боржників та банки НБУ: нові інструменти для due diligence

LEX AI тепер перевіряє контрагентів у Єдиному реєстрі боржників та верифікує банки через реєстр НБУ — автоматично, в один запит. 18 реєстрів замість 16.

LEGAL 5 хв
#DueDiligence #Registry #Compliance #LegalTech

Server-side evidence extraction: як ми винесли аналіз доказів на бекенд

Фронтенд парсив докази з тексту відповіді regex-ами — мобільний Safari зависав на секунду. Ми перенесли витяг доказів на бекенд, додали SSE-подію evidence, і тепер клієнт просто рендерить готові об\

TECH 6 хв
#Architecture #Evidence #SSE #Performance

Від одного сервера до хмари: як ми масштабуємо legal.org.ua на Google Cloud

Cloud Run з автоскейлінгом до нуля. Cloud SQL з автобекапами. Qdrant на виділеній VM. Вся інфраструктура за $280–430/міс з можливістю масштабування від 10 до 10 000 користувачів без змін архітектури.

TECH 11 хв
#GCP #Cloud Run #Infrastructure #Scaling

Маркетплейс юридичних консультацій: від реєстру ЄРАУ до оплати через Monobank

Верифікація адвоката через реєстр ЄРАУ за 2 секунди. Онбордінг у 3 кроки. Запит консультації з документами зі сховища. Real-time чат між клієнтом і адвокатом. Escrow-платіж через Monobank. 10% комісія платформи. Повний цикл — від "мені потрібен адвокат" до оплаченої консультації.

TECH 9 хв
#Marketplace #LegalTech #Payments #ЄРАУ

MCP-токени та інтеграція з Claude Desktop: юридичний AI у вашому робочому столі

Один токен. Одна команда. 56 юридичних AI-інструментів прямо в Claude Desktop. Пошук судової практики, аналіз законодавства, перевірка контрагентів — без відкриття браузера. Створіть токен у профілі, вставте команду в термінал, і LEX AI стає розширенням вашого робочого столу.

LEGAL 5 хв
#MCP #ClaudeDesktop #Integration #Productivity

Чому ми відмовились від Round-Robin між OpenAI та Anthropic

Ми інтегрували OpenAI та Anthropic із round-robin маршрутизацією. На архітектурній діаграмі це виглядало ідеально. У продакшені це ледь не вбило наш продукт. Один і той самий промпт давав різні результати залежно від провайдера. Дебагінг 5-крокового агентного циклу? Це не інженерія — це археологія. Ми все вирізали. Захардкодили одного провайдера. Найкращий рядок коду за рік.

TECH 8 хв
#LLM #Architecture #OpenAI #AWS Bedrock

Як ми побудували MCP-сервер на 56 інструментів для юридичного AI

Один endpoint. Три сервіси. 58 MCP-інструментів. Потрійний транспорт: stdio для Claude Desktop, HTTP REST для веб-додатків, SSE для стрімінгу. Кожен tool call проходить 11-кроковий пайплайн з трекінгом витрат на кожному етапі. Кількість інструментів зростатиме. Архітектурі все одно.

TECH 10 хв
#MCP #Architecture #TypeScript #BuildInPublic

Семантичний пошук по 5 000+ статтях законодавства: embeddings, chunking та Qdrant

Ключові слова знаходять те, що ви вже знаєте. Семантичний пошук знаходить те, що вам потрібно. Ми розбили 12 українських кодексів на 5 191 статтю, векторизували кожну через VoyageAI embeddings, і тепер запит "відповідальність за неякісний ремонт" знаходить статті, які не містять жодного з цих слів.

TECH 7 хв
#Embeddings #Qdrant #SemanticSearch #NLP

RAG для юридичних документів: HallucinationGuard та CitationValidator у продакшені

AI впевнено цитує неіснуючі статті та вигадує номери справ. У юридичній сфері це не просто помилка — це мальпрактіс. Ми побудували два рівні захисту: HallucinationGuard перевіряє кожне твердження, CitationValidator валідує кожне посилання. Нульова толерантність до вигадок.

TECH 7 хв
#RAG #Hallucinations #LegalAI #Validation

Від моноліту до MCP: як Model Context Protocol змінив нашу архітектуру

Ми починали як REST API з 10 ендпоінтами. Зараз у нас 70 MCP-інструментів через 3 сервіси з потрійним транспортом. MCP дав нам те, чого REST не міг: стандартний спосіб для AI самостійно знаходити і використовувати інструменти. AI стає клієнтом, а не вами.

TECH 6 хв
#MCP #Migration #Architecture #REST

Авторизація через Дію: як ми інтегрували національну цифрову ідентифікацію в юридичну платформу

Паспорт у смартфоні — тепер ключ до юридичного AI. Ми інтегрували Дія.Підпис для авторизації: deep link на мобільному, QR-код на десктопі, ECDSA + SHA256 для хешування, і юрист підтверджує особу тим самим додатком, яким показує документи на блокпості. Без паролів. Без реєстрації. Один тап — і ви в системі.

TECH 7 хв
#Diia #Auth #DigitalIdentity #Ukraine

MCP Connect: як ми підключили Nextcloud, Google Drive та 1400+ відкритих датасетів до юридичного AI

Юрист зберігає договори в Nextcloud, листування в Google Drive, а судову практику шукає в ЄДРСР. Три різні системи, три різні вікна, нуль зв\

LEGAL 6 хв
#MCP #Nextcloud #OpenData #Integration

AI не замінить юриста — але юрист з AI замінить юриста без нього

AI не замінить юриста. Але юрист у фірмі навпроти, який використовує AI? Ось ваша справжня конкуренція. Його аналіз практики покриває 300 справ замість 30. Його due diligence перевіряє 16 реєстрів за 2 секунди. Він не білить менше годин — він білить ті самі години за драматично кращий результат.

LEGAL 9 хв
#LegalInnovation #FutureOfLaw #LawyersOfLinkedIn

Пошук судових рішень за змістом, а не за ключовими словами

Ви шукаєте "відшкодування збитків за затоплення квартири" і не знаходите справу, де суд пише про "деліктну відповідальність за пошкодження майна внаслідок аварії інженерних мереж". Ключові слова знаходять слова. Семантичний пошук знаходить значення.

LEGAL 5 хв
#SemanticSearch #CourtPractice #LegalResearch

Як AI аналізує мільйони судових рішень — і що це означає для вашої практики

Людина переглядає 30-40 рішень за сесію. AI обробляє 200-300 за хвилину. Але справа не в швидкості — справа в повноті. Коли ви бачите всю картину, а не фрагмент, стратегічні рішення стають якісно іншими.

LEGAL 6 хв
#AI #CourtPractice #BigData #LegalAnalytics

Due Diligence з AI: від реєстрів до бенефіціарів за один запит

Перевірка контрагента: 4 сайти реєстрів, 30 хвилин ручної роботи, і все одно можете пропустити виконавче провадження. Або: один запит, 2 секунди, 18 реєстрів, повна картина — ЄДРПОУ, засновники, бенефіціари, боржники, виконавчі провадження, банкрутство, банки НБУ.

LEGAL 5 хв
#DueDiligence #Registry #Compliance #LegalTech

Конфіденційність та AI: як ми захищаємо дані клієнтів у юридичній платформі

Юристи не можуть використовувати ChatGPT для клієнтських справ — дані потрапляють на сервери OpenAI. Ми побудували платформу, де кожна справа ізольована, кожна дія в аудит-трейлі, legal holds блокують видалення, а GDPR — не галочка, а архітектура.

LEGAL 6 хв
#GDPR #DataPrivacy #Compliance #Security