340 мільйонів записів і 64 інструменти: повна карта даних LEX AI
ЄДРСР, санкції, патенти, адвокати, судді, законодавство, парламент, реєстри — усі джерела відкритих даних, які зараз працюють на продакшені. Що є, як користуватись, і що буде далі.
340 мільйонів записів і 64 інструменти: повна карта даних LEX AI
Платформа LEX AI побудована на простій ідеї: юрист не має витрачати час на ручний пошук по десятках сайтів. Замість цього — одне питання в чат, і AI сама знаходить потрібні дані з усіх доступних джерел.
Сьогодні на продакшені працює 340+ мільйонів записів з 30+ джерел, об'єднаних через 64 MCP-інструменти (Model Context Protocol). Ця стаття — повний огляд: що є, звідки, і як це працює.
Загальна картина
| Категорія | Записів | Інструментів |
|---|---|---|
| ЄДРСР (судові рішення) | ~208M | 6 |
| Судова система | 30.5M+ | 7 |
| OpenReyestr + NAIS | 41.8M | 24 |
| Санкції та антикорупція | 1.7M | 4 |
| АРМА + Due Diligence | 2M+ | 5 |
| Інтелектуальна власність | 295K | 3 |
| Публічні фінанси | 1M+ | 4 |
| Верховна Рада | 85K | 4 |
| Законодавство | 318K | 3 |
| Адвокати та судді | 73K+ | 3 |
| Разом | ~340M+ | 64 |
1. ЄДРСР — серце платформи (208M записів)
Єдиний державний реєстр судових рішень — найбільше джерело на платформі. Два масиви:
- edrsr_documents — 93M метаданих (суд, суддя, дата, категорія, сторони)
- edrsr_fulltext — 115M повних текстів рішень (~1 TB)
Що можна
"Знайди рішення Верховного Суду про відшкодування моральної шкоди
за 2024-2025 рр."
AI обирає один із 6 інструментів:
| Інструмент | Для чого |
|---|---|
search_edrsr_decisions |
Фільтрований пошук за метаданими |
search_edrsr_fulltext |
Повнотекстовий пошук з підсвіткою |
search_edrsr_semantic |
Семантичний пошук за змістом (Voyage AI) |
get_edrsr_decision_fulltext |
Повний текст рішення |
get_court_decision |
Текст з розбивкою на ФАКТИ / МОТИВИ / РІШЕННЯ |
get_citation_graph |
Граф цитувань між рішеннями |
Семантичний пошук — це коли ви описуєте ситуацію своїми словами, а система знаходить рішення зі схожими обставинами. Навіть якщо жодне ключове слово не збігається.
2. Судова система (30.5M+ записів)
Окрім самих рішень, платформа має дані про весь судовий процес:
| Джерело | Записів | Що містить |
|---|---|---|
| Судові засідання | 30.5M | Дата, суд, суддя, сторони, результат |
| Судді (ВККС) | 417K | Досьє, стаж, рішення, дисциплінарки |
| Статус справ | 1.25M | Трекінг руху справи по інстанціях |
| Розклад засідань | 480K | Заплановані засідання на 2026 |
| Судові експерти | 80K | Атестовані експерти МінЮсту |
| Практика ЄСПЛ | 11K | Рішення Європейського суду |
| Рішення ВРП | 16.5K | Дисциплінарні рішення щодо суддів |
| ВККС (розширені) | 4.8K | Кваліфікація, оцінювання, вакансії |
| Автоматичний розподіл | 71K | Протоколи ДСАУ |
Процесуальні інструменти
Окрема група інструментів допомагає з процесуальною роботою:
calculate_procedural_deadlines— розрахунок строків оскарження за кодом процедури (ЦПК, ГПК, КАС, КПК)search_procedural_norms— пошук релевантних статей процесуальних кодексівbuild_procedural_checklist— генерація чеклісту для конкретної стадії справи
"Який строк апеляційного оскарження рішення господарського суду?"
→ Стаття 256 ГПК: 20 днів з дня складення повного тексту
3. OpenReyestr + NAIS (41.8M записів)
11 державних реєстрів з data.gov.ua плюс дані ЄДР — найповніша база для due diligence:
| Реєстр | Записів |
|---|---|
| Виконавчі провадження (АСВП) | 29M |
| Реєстр боржників | 10.4M |
| ФОП | 6.9M |
| Засновники компаній | 3M |
| Підписанти | 2.8M |
| Юридичні особи | 2M |
| Спецбланки нотаріусів | 1.8M |
| Вулиці (адресний реєстр) | 1.5M |
| Адмінтериторіальний устрій | 924K |
| Податковий борг | 861K |
| Борг з ЄСВ | 669K |
| Платники ПДВ | 264K |
| Єдиний податок | 153K |
| Банкрутство | 36K |
| Нотаріуси | 5.8K |
| Арбітражні керуючі | 3.4K |
| Методики судових експертиз | 1.5K |
24 інструменти OpenReyestr покривають: пошук компаній, бенефіціарів, боржників, виконавчих проваджень, банкрутств, нотаріусів, експертів, ПДВ, ЄСВ та адресних даних.
Приклад: Due Diligence за 30 секунд
"Перевір контрагента за ЄДРПОУ 12345678"
AI автоматично перевіряє:
- ✅ Реєстрацію в ЄДР (юрособа/ФОП)
- ✅ Виконавчі провадження (АСВП)
- ✅ Реєстр боржників
- ✅ Банкрутство
- ✅ Санкційні списки
- ✅ Судові рішення (ЄДРСР)
- ✅ Податковий борг
Результат — структурований звіт з усіх джерел в одному вікні.
4. Санкції та антикорупція (1.7M записів)
| Джерело | Записів | Покриття |
|---|---|---|
| OpenSanctions | 1.25M | РНБО, OFAC, EU, UN, UK + 340 програм |
| НАЗК декларації | 322K | Перевірки декларацій чиновників |
| Корупціонери | 107.5K | Реєстр осіб, причетних до корупції |
| Перевірки декларацій | 2K | Результати перевірок НАЗК |
"Чи є Іванов Петро Сергійович в санкційних списках?"
→ Пошук по 1.25M записів: РНБО, OFAC, EU, UN, UK та 340+ інших програм
→ Нечіткий пошук за іменем, ІПН, паспортом, ЄДРПОУ
5. Інтелектуальна власність (295K записів)
| Джерело | Записів |
|---|---|
| Патенти (Укрпатент) | 118K |
| Торгові марки | 176K |
| Акціонери (НКЦПФР) | 1.3K |
Пошук по назві, власнику, класу NICE (для ТМ) або МПК (для патентів), номеру заявки.
"Знайди торгові марки зі словом 'Legal' в класі 42"
→ 3 результати: LEX AI (свідоцтво №345678), LegalTech Pro...
6. Публічні фінанси (1M+ записів)
| Джерело | Записів |
|---|---|
| Prozorro тендери | 1M |
| Spending.gov.ua контракти | 2.8K |
| ДССУ фінансові дані | 8.4K |
| Плани інспекцій | 32K |
7. Верховна Рада (85K записів)
4 інструменти для моніторингу парламентської діяльності:
| Дані | Записів |
|---|---|
| Законопроєкти | 14.8K |
| Голосування | 21.9K |
| Депутати | 463 |
| Помічники депутатів | 4.4K |
| Тексти законів (повні) | 44K |
"Хто з депутатів голосував за законопроєкт 1234?"
→ Повний список із розбивкою по фракціях
8. Законодавство (318K записів)
| Джерело | Записів |
|---|---|
| ЄДРНПА (картки) | 141K |
| ЄДРНПА (тексти) | 141K |
| Секції законів (чанки) | 25K |
| Статті (структуровані) | 12K |
3 інструменти для роботи із законодавством:
search_legislation— семантичний пошук по тексту законівget_legislation_article— конкретна стаття ("ст. 625 ЦК")get_legislation_history— історія змін та редакцій
Система розуміє aliases: "Конституція", "ЦК", "КПК", "ГК" тощо.
9. Аналітичні інструменти
Окрім пошуку, платформа має інструменти для юридичного аналізу:
| Інструмент | Що робить |
|---|---|
analyze_case_pattern |
Аналіз аргументів, ризиків, статистики результатів |
compare_practice_pro_contra |
Порівняння практики "за" і "проти" тези |
find_similar_reasoning |
Пошук рішень зі схожою мотивувальною частиною |
check_precedent_status |
Перевірка чинності прецеденту (діє / скасовано / обмежено) |
validate_response |
Антигалюцинаційна перевірка відповіді |
Архітектура: як це працює
Юрист → Чат → AI-модель → Класифікатор намірів
↓
Вибір інструментів (1-5 з 64)
↓
PostgreSQL / Qdrant / Redis
↓
Структурована відповідь
Кожен інструмент — це MCP-tool (Model Context Protocol). AI-модель сама обирає, які інструменти викликати, на основі контексту запиту.
Три транспорти:
- MCP stdio — для Claude Desktop
- HTTP API — для веб-додатків
- SSE — для стримінгу результатів
Що далі
На черзі:
- Дозавантаження УІПВ — торгові марки (46% завантажено), корисні моделі (162K), промислові зразки (48K)
- ДРРП (реєстр нерухомості) — договір з NAIS
- ДРОРМ (обтяження рухомого майна) — договір з NAIS
- ДЗК (земельний кадастр) — договір з Держгеокадастром
- Spending.gov.ua — акти, додаткові угоди, пені (API готовий)
- Bulk download RTF — повні тексти рішень ЄДРСР
Підсумок
LEX AI — це не просто пошук. Це єдина точка доступу до всіх відкритих юридичних даних України:
- 340M+ записів з 30+ джерел
- 64 MCP-інструменти для пошуку, аналізу та перевірки
- Семантичний пошук — описуєте ситуацію, знаходите рішення
- Due diligence — перевірка контрагента за 30 секунд
- Процесуальні калькулятори — строки, чеклісти, норми
Усе це працює прямо зараз на legal.org.ua.
Реєстрація: legal.org.ua