Subquadratic заявила о прорыве в LLM: длинный контекст без классической цены dense attention

Стартап Subquadratic утверждает, что нашёл способ обойти один из главных вычислительных узких мест больших языковых моделей. MIT Technology Review пишет, что компания сначала вышла из stealth-режима с громким заявлением и ограниченным набором собственных тестов, а теперь опубликовала больше данных, включая независимую оценку от Appen.

Суть заявления касается механизма attention. Современные LLM обычно опираются на transformer-архитектуру и dense attention: модель сравнивает токены друг с другом, чтобы понять связи внутри текста. Такой подход даёт качество, но плохо масштабируется по длине контекста. Чем больше входной текст, тем быстрее растёт число операций: удвоение длины примерно учетверяет вычислительную нагрузку. Именно поэтому длинные документы, большие кодовые базы и массивы корпоративных данных остаются дорогими задачами для AI-систем.

Subquadratic говорит, что её модель SubQ использует sparse attention вместо dense attention. Идея не новая: не все пары токенов одинаково важны, поэтому можно выбирать только часть связей и сокращать число вычислений. Но исторически такие подходы часто проигрывали классическим transformer-моделям по качеству или плохо работали в универсальных задачах. Поэтому рынок встретил заявление Subquadratic скептически.

Компания утверждает, что SubQ быстрее, дешевле и энергоэффективнее существующих моделей, а также способна обрабатывать до 12 раз больше текста за один проход по сравнению с большинством конкурентов. При этом, по словам стартапа, модель почти не уступает лидерам от Google DeepMind, OpenAI и Anthropic в ключевых задачах вроде программирования.

MIT Technology Review подчёркивает: публичного доступа к SubQ пока нет, поэтому полностью проверить заявления невозможно. Однако независимое тестирование Appen, по словам издания, частично подтверждает тезисы стартапа. Директор Appen по generative AI research Жанин Синанан-Сингх назвала результаты потенциально важными, потому что скорость и неэффективность остаются хроническими проблемами крупных моделей.

При этом даже позитивная внешняя оценка не превращает SubQ в доказанный новый стандарт. Эксперты напоминают, что sparse attention пробовали многие команды, и добиться одновременно экономии, качества и универсальности крайне сложно. Один из независимых AI-исследователей сравнил такую задачу с «четырёхминутной милей»: не невозможной, но требующей исключительного результата.

Если Subquadratic действительно удержит качество при резком снижении вычислительной цены, последствия будут большими. Длинный контекст станет доступнее для анализа архивов, юридических документов, научных корпусов и кодовых репозиториев, а затраты на inference могут снизиться. Но до открытого тестирования и повторяемых бенчмарков это остаётся многообещающей заявкой, а не доказанной сменой эпохи transformer-моделей.

Источник: MIT Technology Review, 19 июня 2026

Subquadratic заявила о прорыве в LLM: длинный контекст без классической цены dense attention

Подпишитесь на наш Telegram-канал