Архітектура персистентної пам\
Крос-доменна валідація на трьох незалежних датасетах підтверджує: надлишковість контексту ~50-60% є системною для автономних агентів; ротація операторів коштує +136% діалогових раундів (Hedges\
Архітектура персистентної пам'яті для довгострокових автономних місій з ротацією операторів
Дворежимне витягування та сигнал корекції
Овчаров В.О. -- LEX AI LLC, Київ, Україна
Анотація
Крос-доменна валідація на трьох незалежних датасетах підтверджує: надлишковість контексту ~50-60% є системною для автономних агентів; ротація операторів коштує +136% діалогових раундів (Hedges' g=0.81); повнота контексту прогнозує потребу в корекції (r=-0.60, g=1.73). Чотири внески: трирівнева пам'ять, дворежимне витягування, сигнал корекції витягування, деградований режим для ескалації подій.
Крос-доменна валідація (нове у v2)
Крос-доменна валідація на трьох незалежних датасетах підтверджує універсальність ключових ефектів:
| Експеримент | Датасет | Ключовий результат |
|---|---|---|
| Exp 5 | DevGPT (615 репозиторіїв, 140 розробників) | Ротація +131% діалогових раундів, Hedges' g=0.81, p<0.001 |
| Exp 6 | RAGBench (95 378 прикладів, 12 доменів) | Повнота контексту → корекції: r=-0.60, g=1.73 |
| Exp 7 | SWE-agent (6 636 траєкторій) | Надлишковість 50% (порівнянно з 60% LEX AI), waste→failure g=0.39 |
Покращення аналізу (нове у v2)
- Exp 2: PELT change-point detection підтверджує лінійний ріст CLAUDE.md (0 структурних переломів)
- Exp 4: Hedges' g=0.28 (bias-corrected), пермутаційний тест, CLES=0.60
- Phase 0: BERTopic на 925 промптах -- 39 тем, 48% мультирепо-сесій
Військове застосування
Обговорюється застосовність до систем управління БПЛА та ситуаційних центрів з посиланнями на:
- Українську систему «Дельта» (8 ситуаційних центрів, Avengers AI)
- NDU «Agentic Database and Military Command» (2025)
- NATO C2SIM (SISO-STD-019-2020) та JC3IEDM (STANAG 5525)
- SCSP «Reimagining Military C2 in the Age of AI» (2024)
22 сторінки, 7 експериментів, 41 reference.