большие языковые модели на грани фантастики

Самые мощные LLM с открытым контуром рассуждений, мультимодальность и контекст до 1M токенов. Меняем представление о генерации.

1Mконтекст
98%MMLU
54языка
> llm.generate("будущее ИИ") { "ответ": "уже здесь", "уверенность": 0.99 }

архитектура нового поколения

99aa Ultra

Смесь экспертов (MoE) с 405B активных параметров. MMLU 98.7%, HumanEval 96.2%.

мультиязычность

OmniModal

Видео, аудио, графика. Любые модальности в едином пространстве. 4K видео.

мультимодальный

Infini-1M

Окно внимания в 1 млн токенов + механизм бесконечной памяти.

сверхдлинный контекст

интерактивный llm

выберите модель — пример генерации

Ultra 405B
OmniModal
Infini-1M
Модель Ultra: анализирует квантовую запутанность на уровне эксперта.
latency < 150ms 99.9% аптайм

сравнение архитектур

рейтинг среди SOTA

89%
89% GPT-4o
100%
100% 99aa Ultra
78%
78% Claude-3

4.7x

ускорение инференса

спецификации

МодельПараметрыКонтекстМультимод.Цена
Ultra 405B405B128K$2.5
OmniModal70B32K видео$1.8
Infini-1M22B1M$0.8

дорожная карта 2025–2026

Q2 2025

Релиз Ultra 405B

Открытое API, 50+ языков, Chain-of-Thought.

Q4 2025

OmniModal 2.0

Генерация видео, аудио в реальном времени.

Q2 2026

Infini-1M Pro

Контекст 10M токенов, внешняя память.

команда

Алексей В.

chief scientist

Мария С.

lead engineer

Дмитрий В.

head of product

Екатерина Л.

research

вопросы и ответы

❓ Как получить доступ к API?

Регистрация на портале, бесплатный пробный период 500K токенов.

❓ Локальное развертывание?

Да, для enterprise клиентов доступна on-prem инсталляция.

❓ Какие языки поддерживает Ultra?

Более 50 языков, включая редкие.

❓ Можно ли дообучать?

Да, fine-tuning и LoRA адаптеры.

будьте в курсе

анонсы, статьи, бета-тесты

@99aa_lab