Загрузка…

Перейти к содержимому

Модели Площадка Рейтинги Новости

Войти Начать

MnogoAI

Единый интерфейс для работы с языковыми моделями. Доступ к 300+ моделям через одно API.

Продукт

Модели
Площадка
Рейтинги
Новости

Аккаунт

Регистрация
Войти
Личный кабинет
Кредиты
Галерея
Организации

Документы

Публичная оферта
Политика конфиденциальности
Правила пользования
Политика использования (AUP)

© 2026 MnogoAI. Все права защищены.

На базе OpenRouter

Модели

342+ активных моделей от 60+ провайдеров

Контекст:

331 моделей

AI21: Jamba Large 1.7ai21

Jamba Large 1.7 — новейшая модель в семействе Jamba open, предлагающая улучшения в области привязки к контексту, следования инструкциям и общей эффективности. Построена на гибридной архитектуре SSM-Transformer с контекстом 256K...

ctx 256.0Kвх 180 ₽/Mвых 720 ₽/M

Контекст

AionLabs: Aion-1.0aion-labs

Aion-1.0 — это мультимодельная система, разработанная для высокой производительности в различных задачах, включая рассуждения и программирование. Она построена на DeepSeek-R1, дополнена дополнительными моделями и техниками, такими как Tree...

ctx 131.1Kвх 360 ₽/Mвых 720 ₽/M

Контекст

AionLabs: Aion-1.0-Miniaion-labs

Aion-1.0-Mini — модель с 32 миллиардами параметров, являющаяся дистиллированной версией модели DeepSeek-R1, разработанной для высокой производительности в областях рассуждений, таких как математика, программирование и логика. Это модифицированный вариант...

ctx 131.1Kвх 63 ₽/Mвых 126 ₽/M

Контекст

AionLabs: Aion-2.0aion-labs

Aion-2.0 — это вариант DeepSeek V3.2, оптимизированный для иммерсивного ролевого отыгрыша и повествования. Он особенно силен в создании напряжения, кризисов и конфликтов в историях, делая повествования более увлекательными....

ctx 131.1Kвх 72 ₽/Mвых 144 ₽/M

Контекст

AionLabs: Aion-RP 1.0 (8B)aion-labs

Aion-RP-Llama-3.1-8B занимает наивысшее место в части оценки персонажей бенчмарка RPBench-Auto, ролевого варианта Arena-Hard-Auto, где LLM оценивают ответы друг друга. Это дообученная базовая модель...

ctx 32.8Kвх 72 ₽/Mвых 144 ₽/M

Контекст

AllenAI: Olmo 3 32B Thinkallenai

Olmo 3 32B Think — это крупномасштабная модель с 32 миллиардами параметров, специально разработанная для глубоких рассуждений, сложных логических цепочек и сценариев продвинутого следования инструкциям. Ее возможности обеспечивают высокую производительность в требовательных оценочных задачах и...

ctx 65.5Kвх 14 ₽/Mвых 45 ₽/M

Контекст

Amazon: Nova 2 Liteamazon

Nova 2 Lite — быстрая, экономичная модель для рассуждений, предназначенная для повседневных рабочих нагрузок, которая может обрабатывать текст, изображения и видео для генерации текста. Nova 2 Lite демонстрирует выдающиеся возможности в обработке...

ctx 1.0Mвх 27 ₽/Mвых 225 ₽/M

Контекст

Amazon: Nova Lite 1.0amazon

Amazon Nova Lite 1.0 — очень недорогая мультимодальная модель от Amazon, ориентированная на быструю обработку входных данных изображений, видео и текста для генерации текстового вывода. Amazon Nova Lite...

ctx 300.0Kвх 5 ₽/Mвых 22 ₽/M

Контекст

Amazon: Nova Micro 1.0amazon

Amazon Nova Micro 1.0 — модель только для текста, которая обеспечивает наименьшую задержку ответов в семействе моделей Amazon Nova при очень низкой стоимости. С длиной контекста...

ctx 128.0Kвх 3 ₽/Mвых 13 ₽/M

Контекст

Amazon: Nova Premier 1.0amazon

Amazon Nova Premier — самая мощная из мультимодальных моделей Amazon для сложных задач рассуждений и в качестве лучшего учителя для дистилляции пользовательских моделей.

ctx 1.0Mвх 225 ₽/Mвых 1125 ₽/M

Контекст

Amazon: Nova Pro 1.0amazon

Amazon Nova Pro 1.0 — это мощная мультимодальная модель от Amazon, ориентированная на обеспечение сочетания точности, скорости и стоимости для широкого спектра задач. По состоянию на декабрь...

ctx 300.0Kвх 72 ₽/Mвых 288 ₽/M

Контекст

Anthropic Claude Haiku Latest~anthropic

Эта модель всегда перенаправляет на последнюю модель в семействе Anthropic Claude Haiku.

ctx 200.0Kвх 90 ₽/Mвых 450 ₽/M

Контекст

Anthropic Claude Sonnet Latest~anthropic

Эта модель всегда перенаправляет на последнюю модель в семействе Anthropic Claude Sonnet.

ctx 1.0Mвх 270 ₽/Mвых 1350 ₽/M

Контекст

Anthropic: Claude 3 Haikuanthropic

Claude 3 Haiku — самая быстрая и компактная модель Anthropic для практически мгновенной реакции. Быстрая и точная целевая производительность. См. объявление о запуске и результаты бенчмарков [здесь](https://www.anthropic.com/news/claude-3-haiku) #multimodal

ctx 200.0Kвх 23 ₽/Mвых 113 ₽/M

Контекст

Anthropic: Claude 3.5 Haikuanthropic

Claude 3.5 Haiku предлагает расширенные возможности в области скорости, точности кодирования и использования инструментов. Разработанная для работы в приложениях реального времени, она обеспечивает быстрое время отклика, необходимое для динамичных...

ctx 200.0Kвх 72 ₽/Mвых 360 ₽/M

Контекст

Anthropic: Claude Fable 5anthropic

Claude Fable 5 — это модель класса Mythos от Anthropic, разработанная для автономной работы со знаниями и программирования. Она поддерживает ввод текста, изображений и файлов с выводом текста, с поддержкой рассуждений и...

ctx 1.0Mвх 900 ₽/Mвых 4500 ₽/M

Контекст

Anthropic: Claude Fable Latest~anthropic

Эта модель всегда перенаправляет на последнюю модель из семейства Claude Fable.

ctx 1.0Mвх 900 ₽/Mвых 4500 ₽/M

Контекст

Anthropic: Claude Haiku 4.5anthropic

Claude Haiku 4.5 — самая быстрая и эффективная модель Anthropic, обеспечивающая почти передовые возможности при доле стоимости и задержки более крупных моделей Claude. Соответствует производительности Claude Sonnet 4...

ctx 200.0Kвх 90 ₽/Mвых 450 ₽/M

Контекст

Anthropic: Claude Opus 4anthropic

Claude Opus 4 — на момент выпуска является лучшей в мире моделью для кодирования, обеспечивая стабильную производительность в сложных, длительных задачах и рабочих процессах агентов. Она устанавливает новые стандарты в...

ctx 200.0Kвх 1350 ₽/Mвых 6750 ₽/M

Контекст

Anthropic: Claude Opus 4.1anthropic

Claude Opus 4.1 — обновленная версия флагманской модели Anthropic, предлагающая улучшенную производительность в задачах кодирования, рассуждений и агентов. Она достигает 74,5% на SWE-bench Verified и демонстрирует заметные улучшения...

ctx 200.0Kвх 1350 ₽/Mвых 6750 ₽/M

Контекст

Anthropic: Claude Opus 4.5anthropic

Claude Opus 4.5 — передовая модель Anthropic для рассуждений, оптимизированная для сложной разработки программного обеспечения, рабочих процессов агентов и длительного использования компьютеров. Она предлагает сильные мультимодальные возможности, конкурентоспособную производительность в реальном кодировании и...

ctx 200.0Kвх 450 ₽/Mвых 2250 ₽/M

Контекст

Anthropic: Claude Opus 4.6anthropic

Opus 4.6 — самая мощная модель Anthropic для кодирования и длительных профессиональных задач. Она создана для агентов, которые работают в рамках всего рабочего процесса, а не отдельных запросов, что делает ее особенно эффективной...

ctx 1.0Mвх 450 ₽/Mвых 2250 ₽/M

Контекст

Anthropic: Claude Opus 4.6 (Fast)anthropic

Вариант Fast-mode [Opus 4.6](/anthropic/claude-opus-4.6) — идентичные возможности с более высокой скоростью вывода по премиальной цене в 6 раз. Узнайте больше в документации Anthropic: https://platform.claude.com/docs/en/build-with-claude/fast-mode

ctx 1.0Mвх 2700 ₽/Mвых 13500 ₽/M

Контекст

Anthropic: Claude Opus 4.7anthropic

Opus 4.7 — следующее поколение семейства Opus от Anthropic, созданное для длительных асинхронных агентов. Опираясь на сильные стороны Opus 4.6 в кодировании и агентах, она обеспечивает более высокую производительность в...

ctx 1.0Mвх 450 ₽/Mвых 2250 ₽/M

Контекст

Anthropic: Claude Opus 4.7 (Fast)anthropic

Вариант Fast-mode модели [Opus 4.7](/anthropic/claude-opus-4.7) - идентичные возможности с более высокой скоростью вывода по премиальной цене в 6 раз. Узнайте больше в документации Anthropic: https://platform.claude.com/docs/en/build-with-claude/fast-mode

ctx 1.0Mвх 2700 ₽/Mвых 13500 ₽/M

Контекст

Anthropic: Claude Opus 4.8anthropic

Claude Opus 4.8 — самая мощная общедоступная модель Anthropic из семейства Opus. Она поддерживает ввод текста, изображений и файлов с выводом текста, с поддержкой рассуждений и объемом до 1 миллиона токенов...

ctx 1.0Mвх 450 ₽/Mвых 2250 ₽/M

Контекст

Anthropic: Claude Opus 4.8 (Fast)anthropic

Вариант Opus 4.8 в быстром режиме — обладает теми же возможностями, но с более высокой скоростью вывода при удвоенной цене по сравнению с обычным Opus 4.8. Подробнее в документации Anthropic: https://platform.claude.com/docs/en/build-with-claude/fast-mode

ctx 1.0Mвх 900 ₽/Mвых 4500 ₽/M

Контекст

Anthropic: Claude Opus Latest~anthropic

Эта модель всегда перенаправляет на последнюю модель в семействе Claude Opus.

ctx 1.0Mвх 450 ₽/Mвых 2250 ₽/M

Контекст

Anthropic: Claude Sonnet 4anthropic

Claude Sonnet 4 значительно расширяет возможности своего предшественника, Sonnet 3.7, превосходя в задачах кодирования и рассуждений с улучшенной точностью и управляемостью. Достигая передовой производительности на SWE-bench (72,7%),...

ctx 1.0Mвх 270 ₽/Mвых 1350 ₽/M

Контекст

Anthropic: Claude Sonnet 4.5anthropic

Claude Sonnet 4.5 — самая продвинутая модель Sonnet от Anthropic на сегодняшний день, оптимизированная для реальных агентов и рабочих процессов кодирования. Она обеспечивает передовую производительность на бенчмарках кодирования, таких как SWE-bench Verified, с...

ctx 1.0Mвх 270 ₽/Mвых 1350 ₽/M

Контекст

Anthropic: Claude Sonnet 4.6anthropic

Sonnet 4.6 — самая мощная модель класса Sonnet от Anthropic на сегодняшний день, с передовой производительностью в области кодирования, агентов и профессиональной работы. Она превосходно справляется с итеративной разработкой, навигацией по сложным кодовым базам, комплексным управлением проектами с...

ctx 1.0Mвх 270 ₽/Mвых 1350 ₽/M

Контекст

Arcee AI: Coder Largearcee-ai

Coder‑Large — это потомок Qwen 2.5‑Instruct с 32 миллиардами параметров, который был дополнительно обучен на общедоступных репозиториях GitHub, CodeSearchNet и синтетических корпусах исправления ошибок. Он поддерживает контекстное окно 32k, позволяя работать с несколькими файлами...

ctx 32.8Kвх 45 ₽/Mвых 72 ₽/M

Контекст

Arcee AI: Trinity Large Thinkingarcee-ai

Trinity Large Thinking — это мощная модель рассуждений с открытым исходным кодом от команды Arcee AI. Она демонстрирует высокую производительность в PinchBench, агентских нагрузках и задачах рассуждения. Видео запуска: https://youtu.be/Gc82AXLa0Rg?si=4RLn6WBz33qT--B7...

ctx 262.1Kвх 20 ₽/Mвых 77 ₽/M

Контекст

Arcee AI: Trinity Miniarcee-ai

Trinity Mini — это разреженная модель языка с 26 миллиардами параметров (3 миллиарда активных) типа Mixture-of-Experts, содержащая 128 экспертов с 8 активными на токен. Разработана для эффективных рассуждений в длинных контекстах (131k) с надежной функцией...

ctx 131.1Kвх 4 ₽/Mвых 14 ₽/M

Контекст

Arcee AI: Virtuoso Largearcee-ai

Virtuoso‑Large — это универсальная LLM высшего уровня от Arcee с 72 миллиардами параметров, настроенная для решения задач междоменных рассуждений, творческого письма и корпоративных QA. В отличие от многих аналогов с 70 миллиардами параметров, она сохраняет 128 k...

ctx 131.1Kвх 68 ₽/Mвых 108 ₽/M

Контекст

Baidu: ERNIE 4.5 VL 424B A47B baidu

ERNIE-4.5-VL-424B-A47B — это мультимодальная модель Mixture-of-Experts (MoE) из серии ERNIE 4.5 от Baidu, содержащая 424 миллиарда общих параметров и 47 миллиардов активных на токен. Она обучена совместно на текстовых и графических данных...

ctx 131.1Kвх 38 ₽/Mвых 113 ₽/M

Контекст

Body Builder (beta)openrouter

Преобразуйте ваши запросы на естественном языке в структурированные объекты запросов API OpenRouter. Опишите, что вы хотите сделать с моделями ИИ, и Body Builder создаст соответствующие вызовы API. Пример:...

ctx 128.0Kвх -90000000.00 ₽/Mвых -90000000.00 ₽/M

Контекст

-90000000.00 ₽/M

-90000000.00 ₽/M

ByteDance Seed: Seed 1.6bytedance-seed

Seed 1.6 — это универсальная модель, выпущенная командой ByteDance Seed. Она включает в себя мультимодальные возможности и адаптивное глубокое мышление с контекстным окном 256K.

ctx 262.1Kвх 23 ₽/Mвых 180 ₽/M

Контекст

ByteDance Seed: Seed 1.6 Flashbytedance-seed

Seed 1.6 Flash — это сверхбыстрая мультимодальная модель глубокого мышления от ByteDance Seed, поддерживающая как текстовое, так и визуальное понимание. Она имеет контекстное окно 256k и может генерировать выходные данные...

ctx 262.1Kвх 7 ₽/Mвых 27 ₽/M

Контекст

ByteDance Seed: Seed-2.0-Litebytedance-seed

Seed-2.0-Lite — это универсальный, экономичный корпоративный инструмент, который обеспечивает мощные мультимодальные возможности и возможности агентов, предлагая заметно более низкую задержку, что делает его практичным выбором по умолчанию для большинства производственных рабочих нагрузок по всему миру...

ctx 262.1Kвх 23 ₽/Mвых 180 ₽/M

Контекст

ByteDance Seed: Seed-2.0-Minibytedance-seed

Seed-2.0-mini ориентирован на сценарии с чувствительной к задержке, высокой конкуренцией и стоимостью, уделяя особое внимание быстрому отклику и гибкому развертыванию инференса. Он обеспечивает производительность, сравнимую с ByteDance-Seed-1.6, поддерживает контекст 256k, четыре режима усилий для рассуждений (минимальный/низкий/средний/высокий), мультимодальное понимание,...

ctx 262.1Kвх 9 ₽/Mвых 36 ₽/M

Контекст

ByteDance: UI-TARS 7B bytedance

UI-TARS-1.5 — это мультимодальный агент зрения-языка, оптимизированный для сред на основе графического интерфейса пользователя, включая настольные интерфейсы, веб-браузеры, мобильные системы и игры. Созданный ByteDance, он основан на фреймворке UI-TARS с использованием обучения с подкреплением...

ctx 128.0Kвх 9 ₽/Mвых 18 ₽/M

Контекст

Cohere: Command Acohere

Command A — это модель с открытыми весами и 111 миллиардами параметров с контекстным окном 256k, ориентированная на обеспечение высокой производительности в сценариях использования агентов, многоязычных и кодирования. По сравнению с другими ведущими проприетарными...

ctx 256.0Kвх 225 ₽/Mвых 900 ₽/M

Контекст

Cohere: Command R (08-2024)cohere

command-r-08-2024 — это обновление [Command R](/models/cohere/command-r) с улучшенной производительностью для многоязычной генерации с дополненной выборкой (RAG) и использования инструментов. В более широком смысле, он лучше справляется с математикой, кодом и рассуждениями, а также...

ctx 128.0Kвх 14 ₽/Mвых 54 ₽/M

Контекст

Cohere: Command R+ (08-2024)cohere

command-r-plus-08-2024 — это обновление [Command R+](/models/cohere/command-r-plus) с примерно на 50% более высокой пропускной способностью и на 25% более низкими задержками по сравнению с предыдущей версией Command R+, при этом сохраняя аппаратный след...

ctx 128.0Kвх 225 ₽/Mвых 900 ₽/M

Контекст

Cohere: Command R7B (12-2024)cohere

Command R7B (12-2024) — это небольшое, быстрое обновление модели Command R+, выпущенное в декабре 2024 года. Оно превосходно справляется с RAG, использованием инструментов, агентами и аналогичными задачами, требующими сложного рассуждения...

ctx 128.0Kвх 3 ₽/Mвых 14 ₽/M

Контекст

Deep Cogito: Cogito v2.1 671Bdeepcogito

Cogito v2.1 671B MoE представляет собой одну из самых мощных открытых моделей в мире, сравнимую по производительности с передовыми закрытыми и открытыми моделями. Эта модель обучена с использованием самообучения с подкреплением...

ctx 128.0Kвх 113 ₽/Mвых 113 ₽/M

Контекст

DeepSeek: DeepSeek V3deepseek

DeepSeek-V3 — это последняя модель от команды DeepSeek, основанная на возможностях следования инструкциям и кодирования предыдущих версий. Предварительно обученная на почти 15 триллионах токенов, заявленные оценки...

ctx 131.1Kвх 18 ₽/Mвых 72 ₽/M

Контекст

DeepSeek: DeepSeek V3 0324deepseek

DeepSeek V3, модель Mixture-of-Experts с 685 миллиардами параметров, является последней итерацией флагманского семейства чат-моделей от команды DeepSeek. Она является преемником модели [DeepSeek V3](/deepseek/deepseek-chat-v3) и показывает очень хорошие результаты...

ctx 163.8Kвх 18 ₽/Mвых 69 ₽/M

Контекст

DeepSeek: DeepSeek V3.1deepseek

DeepSeek-V3.1 — это большая гибридная модель рассуждений (671 миллиард параметров, 37 миллиардов активных), которая поддерживает режимы мышления и немышления с помощью шаблонов подсказок. Она расширяет базу DeepSeek-V3 с помощью двухфазного длинного контекста...

ctx 163.8Kвх 19 ₽/Mвых 71 ₽/M

Контекст

DeepSeek: DeepSeek V3.1 Terminusdeepseek

DeepSeek-V3.1 Terminus — это обновление [DeepSeek V3.1](/deepseek/deepseek-chat-v3.1), которое сохраняет исходные возможности модели, устраняя при этом проблемы, о которых сообщали пользователи, включая языковую согласованность и возможности агентов, дополнительно оптимизируя модель...

ctx 163.8Kвх 24 ₽/Mвых 86 ₽/M

Контекст

DeepSeek: DeepSeek V3.2deepseek

DeepSeek-V3.2 — это большая языковая модель, разработанная для гармонизации высокой вычислительной эффективности с сильными рассуждениями и производительностью агентов при использовании инструментов. Она представляет DeepSeek Sparse Attention (DSA), механизм разреженного внимания с мелкозернистой структурой...

ctx 131.1Kвх 21 ₽/Mвых 31 ₽/M

Контекст

DeepSeek: DeepSeek V3.2 Expdeepseek

DeepSeek-V3.2-Exp — это экспериментальная большая языковая модель, выпущенная DeepSeek в качестве промежуточного шага между V3.1 и будущими архитектурами. Она представляет DeepSeek Sparse Attention (DSA), механизм разреженного внимания с мелкозернистой структурой...

ctx 163.8Kвх 24 ₽/Mвых 37 ₽/M

Контекст

DeepSeek: DeepSeek V4 Flashdeepseek

DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с 284 миллиардами общих параметров и 13 миллиардами активированных параметров, поддерживающая контекстное окно в 1 миллион токенов. Она разработана для быстрой инференции и...

ctx 1.0Mвх 9 ₽/Mвых 18 ₽/M

Контекст

DeepSeek: DeepSeek V4 Prodeepseek

DeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с 1,6 триллиона общих параметров и 49 миллиардами активированных параметров, поддерживающая контекстное окно в 1 миллион токенов. Она разработана для продвинутых рассуждений, кодирования,...

ctx 1.0Mвх 39 ₽/Mвых 78 ₽/M

Контекст

DeepSeek: R1deepseek

DeepSeek R1 здесь: производительность на уровне [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели — 671 миллиард параметров, из которых 37 миллиардов активны при проходе инференции....

ctx 163.8Kвх 63 ₽/Mвых 225 ₽/M

Контекст

DeepSeek: R1 0528deepseek

Обновление от 28 мая для [оригинального DeepSeek R1](/deepseek/deepseek-r1). Производительность на уровне [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели — 671 миллиард параметров, из которых 37 миллиардов активны...

ctx 163.8Kвх 45 ₽/Mвых 194 ₽/M

Контекст

DeepSeek: R1 Distill Llama 70Bdeepseek

DeepSeek R1 Distill Llama 70B — это дистиллированная большая языковая модель на основе [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Модель сочетает передовые методы дистилляции для достижения высокой производительности в различных...

ctx 131.1Kвх 63 ₽/Mвых 72 ₽/M

Контекст

DeepSeek: R1 Distill Qwen 32Bdeepseek

DeepSeek R1 Distill Qwen 32B — это дистиллированная большая языковая модель на основе [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Она превосходит OpenAI's o1-mini по различным бенчмаркам, достигая новых...

ctx 128.0Kвх 26 ₽/Mвых 26 ₽/M

Контекст

EssentialAI: Rnj 1 Instructessentialai

Rnj-1 — это семейство плотных моделей с открытыми весами и 8 миллиардами параметров, разработанное Essential AI и обученное с нуля с акцентом на программирование, математику и научные рассуждения. Модель демонстрирует высокую производительность...

ctx 32.8Kвх 14 ₽/Mвых 14 ₽/M

Контекст

Free Models Routeropenrouter

Самый простой способ получить бесплатную инференцию. openrouter/free — это маршрутизатор, который случайным образом выбирает бесплатные модели из доступных на OpenRouter. Маршрутизатор разумно фильтрует модели, которые...

ctx 200.0Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Google Gemini Flash Latest~google

Эта модель всегда перенаправляет на последнюю модель в семействе Google Gemini Flash.

ctx 1.0Mвх 135 ₽/Mвых 810 ₽/M

Контекст

Google Gemini Pro Latest~google

Эта модель всегда перенаправляет на последнюю модель в семействе Google Gemini Pro.

ctx 1.0Mвх 180 ₽/Mвых 1080 ₽/M

Контекст

Google: Gemini 2.5 Flashgoogle

Gemini 2.5 Flash — это передовая рабочая модель Google, специально разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она включает встроенные возможности «мышления», позволяющие ей предоставлять ответы с большей...

ctx 1.0Mвх 27 ₽/Mвых 225 ₽/M

Контекст

Google: Gemini 2.5 Flash Litegoogle

Gemini 2.5 Flash-Lite — это легкая модель рассуждений из семейства Gemini 2.5, оптимизированная для сверхнизкой задержки и экономической эффективности. Она обеспечивает улучшенную пропускную способность, более быстрое создание токенов и лучшую производительность...

ctx 1.0Mвх 9 ₽/Mвых 36 ₽/M

Контекст

Google: Gemini 2.5 Flash Lite Preview 09-2025google

Gemini 2.5 Flash-Lite — это легкая модель рассуждений из семейства Gemini 2.5, оптимизированная для сверхнизкой задержки и экономической эффективности. Она обеспечивает улучшенную пропускную способность, более быстрое создание токенов и лучшую производительность...

ctx 1.0Mвх 9 ₽/Mвых 36 ₽/M

Контекст

Google: Gemini 2.5 Progoogle

Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она использует возможности «мышления», позволяющие ей рассуждать над ответами с повышенной точностью...

ctx 1.0Mвх 113 ₽/Mвых 900 ₽/M

Контекст

Google: Gemini 2.5 Pro Preview 05-06google

Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она использует возможности «мышления», позволяющие ей рассуждать над ответами с повышенной точностью...

ctx 1.0Mвх 113 ₽/Mвых 900 ₽/M

Контекст

Google: Gemini 2.5 Pro Preview 06-05google

Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она использует возможности «мышления», позволяющие ей рассуждать над ответами с повышенной точностью...

ctx 1.0Mвх 113 ₽/Mвых 900 ₽/M

Контекст

Google: Gemini 3 Flash Previewgoogle

Gemini 3 Flash Preview — это высокоскоростная, высокоценная модель мышления, разработанная для агентных рабочих процессов, многооборотного чата и помощи в кодировании. Она обеспечивает рассуждения и использование инструментов почти на уровне Pro...

ctx 1.0Mвх 45 ₽/Mвых 270 ₽/M

Контекст

Google: Gemini 3.1 Flash Litegoogle

Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google с общедоступным выпуском, оптимизированная для низколатентных, высокообъемных рабочих нагрузок. Она поддерживает ввод текста, изображений, видео, аудио и PDF-файлов и предназначена для легких агентных...

ctx 1.0Mвх 23 ₽/Mвых 135 ₽/M

Контекст

Google: Gemini 3.1 Flash Lite Previewgoogle

Gemini 3.1 Flash Lite Preview — это высокоэффективная модель Google, оптимизированная для сценариев использования с большим объемом. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по всем...

ctx 1.0Mвх 23 ₽/Mвых 135 ₽/M

Контекст

Google: Gemini 3.1 Pro Previewgoogle

Gemini 3.1 Pro Preview — это передовая модель рассуждений Google, обеспечивающая улучшенную производительность в области разработки программного обеспечения, повышенную надежность агентов и более эффективное использование токенов в сложных рабочих процессах. Основываясь на мультимодальной основе...

ctx 1.0Mвх 180 ₽/Mвых 1080 ₽/M

Контекст

Google: Gemini 3.1 Pro Preview Custom Toolsgoogle

Gemini 3.1 Pro Preview Custom Tools — это вариант Gemini 3.1 Pro, который улучшает поведение выбора инструментов, предотвращая чрезмерное использование общего инструмента bash, когда более эффективные сторонние...

ctx 1.0Mвх 180 ₽/Mвых 1080 ₽/M

Контекст

Google: Gemini 3.5 Flashgoogle

Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, обеспечивающая уровень кодирования и рассуждений, близкий к Pro, при стоимости и скорости уровня Flash. Она высоко оптимизирована для навыков кодирования и параллельного выполнения агентами...

ctx 1.0Mвх 135 ₽/Mвых 810 ₽/M

Контекст

Google: Gemma 2 27Bgoogle

Gemma 2 27B от Google — это открытая модель, созданная на основе тех же исследований и технологий, которые используются для создания [моделей Gemini](/models?q=gemini). Модели Gemma хорошо подходят для различных...

ctx 8.2Kвх 59 ₽/Mвых 59 ₽/M

Контекст

Google: Gemma 3 12Bgoogle

Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста и вывод текста. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и чата,...

ctx 131.1Kвх 5 ₽/Mвых 14 ₽/M

Контекст

Google: Gemma 3 27Bgoogle

Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста и вывод текста. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и чата,...

ctx 131.1Kвх 7 ₽/Mвых 14 ₽/M

Контекст

Google: Gemma 3 4Bgoogle

Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста и вывод текста. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и чата,...

ctx 131.1Kвх 5 ₽/Mвых 9 ₽/M

Контекст

Google: Gemma 3n 4Bgoogle

Gemma 3n E4B-it оптимизирована для эффективного выполнения на мобильных устройствах и устройствах с ограниченными ресурсами, таких как телефоны, ноутбуки и планшеты. Она поддерживает мультимодальный ввод, включая текст, визуальные данные и аудио, что позволяет выполнять различные задачи...

ctx 32.8Kвх 5 ₽/Mвых 11 ₽/M

Контекст

Google: Gemma 4 26B A4B google

Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) с инструктивным тюнингом от Google DeepMind. Несмотря на 25,2 миллиарда общих параметров, только 3,8 миллиарда активируются на токен во время инференции — обеспечивая качество, близкое к 31 миллиарду, при...

ctx 262.1Kвх 5 ₽/Mвых 30 ₽/M

Контекст

Google: Gemma 4 26B A4B (free)google

Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) с инструктивным тюнингом от Google DeepMind. Несмотря на 25,2 миллиарда общих параметров, только 3,8 миллиарда активируются на токен во время инференции — обеспечивая качество, близкое к 31 миллиарду, при...

ctx 262.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Google: Gemma 4 31Bgoogle

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 миллиардами параметров, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно 256 тысяч токенов, настраиваемый режим мышления/рассуждений, нативные функции...

ctx 262.1Kвх 11 ₽/Mвых 32 ₽/M

Контекст

Google: Gemma 4 31B (free)google

Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 миллиардами параметров, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно 256 тысяч токенов, настраиваемый режим мышления/рассуждений, нативные функции...

ctx 262.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

IBM: Granite 4.0 Microibm-granite

Granite-4.0-H-Micro — модель с 3 миллиардами параметров из семейства моделей Granite 4. Эти модели являются последними в серии моделей, выпущенных IBM. Они дообучены для работы с длинными...

ctx 131.0Kвх 2 ₽/Mвых 10 ₽/M

Контекст

IBM: Granite 4.1 8Bibm-granite

Granite 4.1 8B — плотная языковая модель с 8 миллиардами параметров, только декодер, из семейства Granite 4.1 от IBM. Она поддерживает контекстное окно в 131 тысячу токенов и предназначена для корпоративных задач...

ctx 131.1Kвх 5 ₽/Mвых 9 ₽/M

Контекст

Inception: Mercury 2inception

Mercury 2 — чрезвычайно быстрая LLM для рассуждений и первая LLM для диффузии рассуждений (dLLM). Вместо последовательной генерации токенов Mercury 2 производит и уточняет несколько токенов параллельно, достигая...

ctx 128.0Kвх 23 ₽/Mвых 68 ₽/M

Контекст

inclusionAI: Ling-2.6-1Tinclusionai

Ling-2.6-1T — мгновенная (инструктивная) модель от inclusionAI и флагманская модель компании с триллионом параметров, разработанная для реальных агентов, которым требуется быстрая обработка и высокая эффективность в масштабе. Она использует "быстрый...

ctx 262.1Kвх 7 ₽/Mвых 56 ₽/M

Контекст

inclusionAI: Ling-2.6-flashinclusionai

Ling-2.6-flash — мгновенная (инструктивная) модель от inclusionAI с 104 миллиардами общих параметров и 7,4 миллиардами активных параметров, разработанная для реальных агентов, которым требуются быстрые ответы, надежная обработка и высокая эффективность токенов....

ctx 262.1Kвх 0.90 ₽/Mвых 3 ₽/M

Контекст

inclusionAI: Ring-2.6-1Tinclusionai

Ring-2.6-1T — модель для рассуждений масштаба 1T параметров с 63 миллиардами активных параметров, созданная для рабочих процессов реальных агентов, требующих как высокой производительности, так и операционной эффективности. Она оптимизирована для кодирующих агентов, инструментов...

ctx 262.1Kвх 7 ₽/Mвых 56 ₽/M

Контекст

Inflection: Inflection 3 Piinflection

Inflection 3 Pi обеспечивает работу чат-бота Inflection [Pi](https://pi.ai), включая предысторию, эмоциональный интеллект, продуктивность и безопасность. Он имеет доступ к последним новостям и преуспевает в сценариях, таких как поддержка клиентов и ролевые игры. Pi...

ctx 8.0Kвх 225 ₽/Mвых 900 ₽/M

Контекст

Inflection: Inflection 3 Productivityinflection

Inflection 3 Productivity оптимизирована для следования инструкциям. Она лучше подходит для задач, требующих вывода в формате JSON или точного соблюдения предоставленных рекомендаций. Она имеет доступ к последним новостям. Для эмоциональных...

ctx 8.0Kвх 225 ₽/Mвых 900 ₽/M

Контекст

Kwaipilot: KAT-Coder-Pro V2kwaipilot

KAT-Coder-Pro V2 — новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, предназначенная для сложной разработки программного обеспечения корпоративного уровня и интеграции SaaS. Она основана на сильных сторонах предыдущих версий в области кодирования с использованием агентов,...

ctx 256.0Kвх 27 ₽/Mвых 108 ₽/M

Контекст

LiquidAI: LFM2-24B-A2Bliquid

LFM2-24B-A2B — самая большая модель в семействе гибридных архитектур LFM2, разработанная для эффективного развертывания на устройствах. Созданная как модель Mixture-of-Experts с 24 миллиардами параметров и всего 2 миллиардами активных параметров на...

ctx 128.0Kвх 3 ₽/Mвых 11 ₽/M

Контекст

LiquidAI: LFM2.5-1.2B-Instruct (free)liquid

LFM2.5-1.2B-Instruct — компактная, высокопроизводительная модель с инструктивным дообучением, созданная для быстрого ИИ на устройствах. Она обеспечивает высокое качество диалогов при размере в 1,2 миллиарда параметров, с эффективным инференсом на периферии и широкой поддержкой времени выполнения.

ctx 32.8Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

LiquidAI: LFM2.5-1.2B-Thinking (free)liquid

LFM2.5-1.2B-Thinking — легкая модель, ориентированная на рассуждения, оптимизированная для задач агентов, извлечения данных и RAG — при этом комфортно работающая на периферийных устройствах. Она поддерживает длинный контекст (до 32 тысяч токенов) и...

ctx 32.8Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Llama Guard 3 8Bmeta-llama

Llama Guard 3 — предварительно обученная модель Llama-3.1-8B, дообученная для классификации безопасности контента. Подобно предыдущим версиям, она может использоваться для классификации контента как во входных данных LLM (классификация промптов)...

ctx 131.1Kвх 44 ₽/Mвых 3 ₽/M

Контекст

Magnum v4 72Banthracite-org

Это серия моделей, разработанных для воспроизведения качества прозы моделей Claude 3, в частности Sonnet(https://openrouter.ai/anthropic/claude-3.5-sonnet) и Opus(https://openrouter.ai/anthropic/claude-3-opus). Модель дообучена поверх [Qwen2.5 72B](https://openrouter.ai/qwen/qwen-2.5-72b-instruct).

ctx 32.8Kвх 270 ₽/Mвых 450 ₽/M

Контекст

Mancer: Weaver (alpha)mancer

Попытка воссоздать многословность в стиле Claude, но не ожидайте такого же уровня связности или памяти. Предназначена для использования в ролевых играх/нарративных ситуациях.

ctx 8.0Kвх 68 ₽/Mвых 90 ₽/M

Контекст

Meta: Llama 3 70B Instructmeta-llama

Последний класс моделей Meta (Llama 3) был выпущен в различных размерах и вариантах. Эта версия с 70 миллиардами параметров, дообученная инструкциями, была оптимизирована для высококачественных диалоговых сценариев. Она продемонстрировала сильные...

ctx 8.2Kвх 46 ₽/Mвых 67 ₽/M

Контекст

Meta: Llama 3 8B Instructmeta-llama

Последний класс моделей Meta (Llama 3) был выпущен в различных размерах и вариантах. Эта версия с 8 миллиардами параметров, дообученная инструкциями, была оптимизирована для высококачественных диалоговых сценариев. Она продемонстрировала сильные...

ctx 8.2Kвх 13 ₽/Mвых 13 ₽/M

Контекст

Meta: Llama 3.1 70B Instructmeta-llama

Последний класс моделей Meta (Llama 3.1) был выпущен в различных размерах и вариантах. Эта версия с 70 миллиардами параметров, дообученная инструкциями, оптимизирована для высококачественных диалоговых сценариев. Она продемонстрировала сильные...

ctx 131.1Kвх 36 ₽/Mвых 36 ₽/M

Контекст

Meta: Llama 3.1 8B Instructmeta-llama

Последний класс моделей Meta (Llama 3.1) был выпущен в различных размерах и вариантах. Эта версия с 8 миллиардами параметров быстрая и эффективная. Она продемонстрировала сильную производительность по сравнению с...

ctx 131.1Kвх 2 ₽/Mвых 3 ₽/M

Контекст

Meta: Llama 3.2 11B Vision Instructmeta-llama

Llama 3.2 11B Vision — мультимодальная модель с 11 миллиардами параметров, предназначенная для решения задач, сочетающих визуальные и текстовые данные. Она преуспевает в таких задачах, как создание подписей к изображениям и...

ctx 131.1Kвх 31 ₽/Mвых 31 ₽/M

Контекст

Meta: Llama 3.2 1B Instructmeta-llama

Llama 3.2 1B — языковая модель с 1 миллиардом параметров, ориентированная на эффективное выполнение задач обработки естественного языка, таких как суммаризация, диалог и многоязычный анализ текста. Ее меньший размер позволяет ей работать...

ctx 131.1Kвх 2 ₽/Mвых 18 ₽/M

Контекст

Meta: Llama 3.2 3B Instructmeta-llama

Llama 3.2 3B — многоязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для продвинутых задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработана с использованием новейшей архитектуры трансформера, она...

ctx 131.1Kвх 5 ₽/Mвых 30 ₽/M

Контекст

Meta: Llama 3.2 3B Instruct (free)meta-llama

Llama 3.2 3B — многоязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для продвинутых задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработана с использованием новейшей архитектуры трансформера, она...

ctx 131.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Meta: Llama 3.3 70B Instructmeta-llama

Многоязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и дообученная инструкциями генеративная модель в формате 70B (текст на вход/текст на выход). Модель Llama 3.3 с инструктивным дообучением, только текст...

ctx 131.1Kвх 9 ₽/Mвых 29 ₽/M

Контекст

Meta: Llama 3.3 70B Instruct (free)meta-llama

Многоязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и дообученная инструкциями генеративная модель в формате 70B (текст на вход/текст на выход). Модель Llama 3.3 с инструктивным дообучением, только текст...

ctx 131.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Meta: Llama 4 Maverickmeta-llama

Llama 4 Maverick 17B Instruct (128E) — высокопроизводительная мультимодальная языковая модель от Meta, построенная на архитектуре Mixture-of-Experts (MoE) со 128 экспертами и 17 миллиардами активных параметров на прямой проход...

ctx 1.0Mвх 14 ₽/Mвых 54 ₽/M

Контекст

Meta: Llama 4 Scoutmeta-llama

Llama 4 Scout 17B Instruct (16E) — языковая модель Mixture-of-Experts (MoE), разработанная Meta, активирующая 17 миллиардов параметров из общего числа 109 миллиардов. Она поддерживает нативный мультимодальный ввод...

ctx 10.0Mвх 9 ₽/Mвых 27 ₽/M

Контекст

Meta: Llama Guard 4 12Bmeta-llama

Llama Guard 4 — мультимодальная предварительно обученная модель на основе Llama 4 Scout, дообученная для классификации безопасности контента. Подобно предыдущим версиям, она может использоваться для классификации контента как во входных данных LLM...

ctx 163.8Kвх 16 ₽/Mвых 16 ₽/M

Контекст

Microsoft: Phi 4microsoft

[Microsoft Research](/microsoft) Phi-4 разработана для эффективной работы в сложных задачах рассуждения и может работать эффективно в условиях ограниченной памяти или когда требуются быстрые ответы. При 14 миллиардах...

ctx 16.4Kвх 6 ₽/Mвых 13 ₽/M

Контекст

Microsoft: Phi 4 Mini Instructmicrosoft

Phi-4-mini-instruct — легкая открытая модель, построенная на синтетических данных и отфильтрованных общедоступных веб-сайтах — с акцентом на высококачественные, плотные по смыслу данные. Модель относится к семейству Phi-4...

ctx 131.1Kвх 7 ₽/Mвых 31 ₽/M

Контекст

MiniMax: MiniMax M1minimax

MiniMax-M1 — крупномасштабная модель рассуждений с открытым весом, разработанная для расширенного контекста и высокоэффективного инференса. Она использует гибридную архитектуру Mixture-of-Experts (MoE) в сочетании с пользовательским механизмом "молниеносного внимания", позволяющим ей...

ctx 1.0Mвх 36 ₽/Mвых 198 ₽/M

Контекст

MiniMax: MiniMax M2minimax

MiniMax-M2 — компактная, высокоэффективная большая языковая модель, оптимизированная для сквозного кодирования и рабочих процессов агентов. Имея 10 миллиардов активированных параметров (230 миллиардов всего), она обеспечивает интеллект на грани возможностей в общем рассуждении,...

ctx 204.8Kвх 23 ₽/Mвых 90 ₽/M

Контекст

MiniMax: MiniMax M2-herminimax

MiniMax M2-her — большая языковая модель, ориентированная на диалоги, созданная для иммерсивных ролевых игр, чатов с персонажами и выразительных многоходовых разговоров. Разработана для поддержания согласованности тона и личности, поддерживает богатые сообщения...

ctx 65.5Kвх 27 ₽/Mвых 108 ₽/M

Контекст

MiniMax: MiniMax M2.1minimax

MiniMax-M2.1 — легкая, передовая большая языковая модель, оптимизированная для кодирования, рабочих процессов агентов и современной разработки приложений. Имея всего 10 миллиардов активированных параметров, она обеспечивает значительный скачок в реальных...

ctx 204.8Kвх 26 ₽/Mвых 86 ₽/M

Контекст

MiniMax: MiniMax M2.5minimax

MiniMax-M2.5 — передовая большая языковая модель, разработанная для повышения продуктивности в реальных условиях. Обученная в разнообразных сложных реальных цифровых рабочих средах, M2.5 опирается на опыт кодирования M2.1...

ctx 204.8Kвх 14 ₽/Mвых 81 ₽/M

Контекст

MiniMax: MiniMax M2.7minimax

MiniMax-M2.7 — это языковая модель нового поколения, разработанная для автономной продуктивности в реальном мире и непрерывного совершенствования. Созданная для активного участия в собственном развитии, M2.7 интегрирует передовые агентные возможности через мультиагентные...

ctx 204.8Kвх 24 ₽/Mвых 97 ₽/M

Контекст

MiniMax: MiniMax M3minimax

MiniMax-M3 — это мультимодальная базовая модель от MiniMax. Она поддерживает ввод текста, изображений и видео с выводом текста, имеет контекстное окно размером 1 миллион токенов и подходит для долгосрочной агентной работы, программирования,...

ctx 1.0Mвх 27 ₽/Mвых 108 ₽/M

Контекст

MiniMax: MiniMax-01minimax

MiniMax-01 объединяет MiniMax-Text-01 для генерации текста и MiniMax-VL-01 для понимания изображений. Он имеет 456 миллиардов параметров, из которых 45,9 миллиарда активируются при каждом выводе, и может обрабатывать контекст...

ctx 1.0Mвх 18 ₽/Mвых 99 ₽/M

Контекст

Mistral Largemistralai

Это флагманская модель Mistral AI, Mistral Large 2 (версия `mistral-large-2407`). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Анонс запуска читайте [здесь](https://mistral.ai/news/mistral-large-2407/)....

ctx 128.0Kвх 180 ₽/Mвых 540 ₽/M

Контекст

Mistral Large 2407mistralai

Это флагманская модель Mistral AI, Mistral Large 2 (версия mistral-large-2407). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Анонс запуска читайте [здесь](https://mistral.ai/news/mistral-large-2407/)....

ctx 131.1Kвх 180 ₽/Mвых 540 ₽/M

Контекст

Mistral: Codestral 2508mistralai

Передовая языковая модель Mistral для кодирования, выпущенная в конце июля 2025 года. Codestral специализируется на задачах с низкой задержкой и высокой частотой, таких как заполнение середины (FIM), исправление кода и генерация тестов. [Пост в блоге](https://mistral.ai/news/codestral-25-08)

ctx 256.0Kвх 27 ₽/Mвых 81 ₽/M

Контекст

Mistral: Devstral 2 2512mistralai

Devstral 2 — это передовая модель с открытым исходным кодом от Mistral AI, специализирующаяся на агентном кодировании. Это плотная трансформерная модель с 123 миллиардами параметров, поддерживающая контекстное окно 256K. Devstral 2 поддерживает исследование...

ctx 262.1Kвх 36 ₽/Mвых 180 ₽/M

Контекст

Mistral: Ministral 3 14B 2512mistralai

Самая большая модель в семействе Ministral 3, Ministral 3 14B предлагает передовые возможности и производительность, сравнимую с ее более крупным аналогом Mistral Small 3.2 24B. Мощная и эффективная языковая...

ctx 262.1Kвх 18 ₽/Mвых 18 ₽/M

Контекст

Mistral: Ministral 3 3B 2512mistralai

Самая маленькая модель в семействе Ministral 3, Ministral 3 3B — это мощная, эффективная крошечная языковая модель с возможностями визуализации.

ctx 131.1Kвх 9 ₽/Mвых 9 ₽/M

Контекст

Mistral: Ministral 3 8B 2512mistralai

Сбалансированная модель в семействе Ministral 3, Ministral 3 8B — это мощная, эффективная крошечная языковая модель с возможностями визуализации.

ctx 262.1Kвх 14 ₽/Mвых 14 ₽/M

Контекст

Mistral: Mistral Large 3 2512mistralai

Mistral Large 3 2512 — самая мощная модель Mistral на сегодняшний день, отличающаяся разреженной архитектурой Mixture-of-Experts с 41 миллиардом активных параметров (675 миллиардов всего) и выпущенная под лицензией Apache 2.0.

ctx 262.1Kвх 45 ₽/Mвых 135 ₽/M

Контекст

Mistral: Mistral Medium 3mistralai

Mistral Medium 3 — высокопроизводительная языковая модель корпоративного класса, разработанная для обеспечения передовых возможностей при значительно сниженных операционных затратах. Она сочетает в себе передовые рассуждения и мультимодальную производительность при стоимости в 8 раз ниже...

ctx 131.1Kвх 36 ₽/Mвых 180 ₽/M

Контекст

Mistral: Mistral Medium 3.1mistralai

Mistral Medium 3.1 — обновленная версия Mistral Medium 3, высокопроизводительной языковой модели корпоративного класса, разработанной для обеспечения передовых возможностей при значительно сниженных операционных затратах. Она сочетает в себе...

ctx 131.1Kвх 36 ₽/Mвых 180 ₽/M

Контекст

Mistral: Mistral Medium 3.5mistralai

Mistral Medium 3.5 — плотная модель с 128 миллиардами параметров, следующая инструкциям, от Mistral AI. Она поддерживает ввод текста и изображений с выводом текста и предназначена для агентных рабочих процессов, кодирования и сложных...

ctx 262.1Kвх 135 ₽/Mвых 675 ₽/M

Контекст

Mistral: Mistral Nemomistralai

Модель с 12 миллиардами параметров и длиной контекста 128k токенов, созданная Mistral в сотрудничестве с NVIDIA. Модель многоязычна, поддерживает английский, французский, немецкий, испанский, итальянский, португальский, китайский, японский,...

ctx 131.1Kвх 2 ₽/Mвых 3 ₽/M

Контекст

Mistral: Mistral Small 3mistralai

Mistral Small 3 — языковая модель с 24 миллиардами параметров, оптимизированная для производительности с низкой задержкой при выполнении распространенных задач ИИ. Выпущенная под лицензией Apache 2.0, она включает в себя как предварительно обученные, так и дообученные версии, разработанные...

ctx 32.8Kвх 5 ₽/Mвых 7 ₽/M

Контекст

Mistral: Mistral Small 3.1 24Bmistralai

Mistral Small 3.1 24B Instruct — обновленный вариант Mistral Small 3 (2501), содержащий 24 миллиарда параметров с расширенными мультимодальными возможностями. Он обеспечивает передовую производительность в текстовых рассуждениях и...

ctx 128.0Kвх 32 ₽/Mвых 50 ₽/M

Контекст

Mistral: Mistral Small 3.2 24Bmistralai

Mistral-Small-3.2-24B-Instruct-2506 — обновленная модель с 24 миллиардами параметров от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшения вызова функций. По сравнению с выпуском 3.1, версия 3.2 значительно повышает точность на...

ctx 128.0Kвх 7 ₽/Mвых 18 ₽/M

Контекст

Mistral: Mistral Small 4mistralai

Mistral Small 4 — следующий крупный выпуск в семействе Mistral Small, объединяющий возможности нескольких флагманских моделей Mistral в единую систему. Он сочетает в себе сильные рассуждения от...

ctx 262.1Kвх 14 ₽/Mвых 54 ₽/M

Контекст

Mistral: Mixtral 8x22B Instructmistralai

Официальная версия Mixtral 8x22B, дообученная Mistral для следования инструкциям. Она использует 39 миллиардов активных параметров из 141 миллиарда, предлагая непревзойденную экономическую эффективность для своего размера. Ее сильные стороны включают: - сильную математику, кодирование,...

ctx 65.5Kвх 180 ₽/Mвых 540 ₽/M

Контекст

Mistral: Sabamistralai

Mistral Saba — языковая модель с 24 миллиардами параметров, специально разработанная для Ближнего Востока и Южной Азии, обеспечивающая точные и контекстуально релевантные ответы при сохранении эффективной производительности. Обучена на отобранных региональных...

ctx 32.8Kвх 18 ₽/Mвых 54 ₽/M

Контекст

Mistral: Voxtral Small 24B 2507mistralai

Voxtral Small — это улучшение Mistral Small 3, включающее передовые возможности ввода аудио при сохранении лучшей в своем классе текстовой производительности. Он превосходно справляется с транскрипцией речи, переводом и пониманием аудио. Входное аудио...

ctx 32.0Kвх 9 ₽/Mвых 27 ₽/M

Контекст

MoonshotAI Kimi Latest~moonshotai

Эта модель всегда перенаправляет на последнюю модель в семействе MoonshotAI Kimi.

ctx 262.1Kвх 61 ₽/Mвых 307 ₽/M

Контекст

MoonshotAI: Kimi K2 0711moonshotai

Kimi K2 Instruct — крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с 1 триллионом общих параметров и 32 миллиардами активных на прямой проход. Она оптимизирована для...

ctx 131.1Kвх 51 ₽/Mвых 207 ₽/M

Контекст

MoonshotAI: Kimi K2 0905moonshotai

Kimi K2 0905 — это сентябрьское обновление [Kimi K2 0711](moonshotai/kimi-k2). Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с 1 триллионом общих параметров и 32...

ctx 262.1Kвх 54 ₽/Mвых 225 ₽/M

Контекст

MoonshotAI: Kimi K2 Thinkingmoonshotai

Kimi K2 Thinking — самая передовая открытая модель рассуждений Moonshot AI на сегодняшний день, расширяющая серию K2 в область агентных рассуждений на дальние горизонты. Построена на архитектуре Mixture-of-Experts (MoE) с триллионом параметров, представленной в...

ctx 262.1Kвх 54 ₽/Mвых 225 ₽/M

Контекст

MoonshotAI: Kimi K2.5moonshotai

Kimi K2.5 — нативная мультимодальная модель Moonshot AI, обеспечивающая передовые возможности визуального кодирования и парадигму самонаправляемых роев агентов. Построена на Kimi K2 с продолжением предварительного обучения на примерно 15T смешанных...

ctx 262.1Kвх 36 ₽/Mвых 171 ₽/M

Контекст

MoonshotAI: Kimi K2.6moonshotai

Kimi K2.6 — мультимодальная модель Moonshot AI следующего поколения, разработанная для кодирования на дальние горизонты, генерации UI/UX на основе кода и оркестрации мультиагентов. Она обрабатывает сложные сквозные задачи кодирования на Python, Rust и Go, и...

ctx 262.1Kвх 61 ₽/Mвых 307 ₽/M

Контекст

MoonshotAI: Kimi K2.6 (free)moonshotai

Kimi K2.6 — мультимодальная модель Moonshot AI следующего поколения, разработанная для кодирования на дальние горизонты, генерации UI/UX на основе кода и оркестрации мультиагентов. Она обрабатывает сложные сквозные задачи кодирования на Python, Rust и Go, и...

ctx 262.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Morph: Morph V3 Fastmorph

Самая быстрая модель Morph для применения изменений кода. ~10 500 токенов/сек с 96% точностью для быстрых преобразований кода. Модель требует, чтобы промпт был в следующем формате: <instruction>{instruction}</instruction> <code>{initial_code}</code> <update>{edit_snippet}</update>...

ctx 81.9Kвх 72 ₽/Mвых 108 ₽/M

Контекст

Morph: Morph V3 Largemorph

Высокоточная модель Morph для применения сложных изменений кода. ~4 500 токенов/сек с 98% точностью для точных преобразований кода. Модель требует, чтобы промпт был в следующем формате: <instruction>{instruction}</instruction> <code>{initial_code}</code>...

ctx 262.1Kвх 81 ₽/Mвых 171 ₽/M

Контекст

MythoMax 13Bgryphe

Одна из самых производительных и популярных дообученных версий Llama 2 13B с богатыми описаниями и ролевыми играми. #merge

ctx 4.1Kвх 5 ₽/Mвых 5 ₽/M

Контекст

Nex AGI: Nex-N2-Pro (free)nex-agi

Nex-N2-Pro — это агентная модель "смесь экспертов" от Nex AGI, имеющая 17 миллиардов активных параметров из 397 миллиардов общих. Построенная на архитектуре Qwen3.5, она принимает текстовые и графические входные данные и генерирует...

ctx 262.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Nous: Hermes 3 405B Instructnousresearch

Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, гораздо лучшую ролевую игру, рассуждения, многооборотные диалоги, согласованность длинного контекста и улучшения по всем...

ctx 131.1Kвх 90 ₽/Mвых 90 ₽/M

Контекст

Nous: Hermes 3 405B Instruct (free)nousresearch

Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, гораздо лучшую ролевую игру, рассуждения, многооборотные диалоги, согласованность длинного контекста и улучшения по всем...

ctx 131.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Nous: Hermes 3 70B Instructnousresearch

Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с [Hermes 2](/models/nousresearch/nous-hermes-2-mistral-7b-dpo), включая расширенные агентные возможности, гораздо лучшую ролевую игру, рассуждения, многооборотные диалоги, согласованность длинного контекста и улучшения по всем...

ctx 131.1Kвх 63 ₽/Mвых 63 ₽/M

Контекст

Nous: Hermes 4 405Bnousresearch

Hermes 4 — это крупномасштабная модель рассуждений, построенная на Meta-Llama-3.1-405B и выпущенная Nous Research. Она представляет гибридный режим рассуждений, в котором модель может выбирать внутреннюю обработку с...

ctx 131.1Kвх 90 ₽/Mвых 270 ₽/M

Контекст

Nous: Hermes 4 70Bnousresearch

Hermes 4 70B — это гибридная модель рассуждений от Nous Research, построенная на Meta-Llama-3.1-70B. Она представляет тот же гибридный режим, что и более крупный выпуск 405B, позволяя модели либо...

ctx 131.1Kвх 12 ₽/Mвых 36 ₽/M

Контекст

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5nvidia

Llama-3.3-Nemotron-Super-49B-v1.5 — это модель рассуждений/чата с 49 миллиардами параметров, ориентированная на английский язык, производная от Meta Llama-3.3-70B-Instruct с контекстом 128K. Она пост-обучена для агентных рабочих процессов (RAG, вызов инструментов) через SFT по математике, коду, науке и...

ctx 131.1Kвх 36 ₽/Mвых 36 ₽/M

Контекст

NVIDIA: Nemotron 3 Nano 30B A3Bnvidia

NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью для разработчиков, создающих специализированные агентные ИИ-системы. Модель полностью...

ctx 262.1Kвх 5 ₽/Mвых 18 ₽/M

Контекст

NVIDIA: Nemotron 3 Nano 30B A3B (free)nvidia

NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью для разработчиков, создающих специализированные агентные ИИ-системы. Модель полностью...

ctx 256.0Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

NVIDIA: Nemotron 3 Nano Omni (free)nvidia

NVIDIA Nemotron™ 3 Nano Omni — это открытая мультимодальная модель с 30 миллиардами параметров, разработанная как подсистема восприятия и контекста в корпоративных агентских системах. Она принимает текст, изображения, видео и...

ctx 256.0Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

NVIDIA: Nemotron 3 Supernvidia

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Построена на гибридной архитектуре Mamba-Transformer...

ctx 1.0Mвх 8 ₽/Mвых 40 ₽/M

Контекст

NVIDIA: Nemotron 3 Super (free)nvidia

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Построена на гибридной архитектуре Mamba-Transformer...

ctx 1.0Mвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

NVIDIA: Nemotron 3 Ultranvidia

NVIDIA Nemotron 3 Ultra — это открытая модель для рассуждений на переднем крае и оркестрации от NVIDIA, имеющая 55 миллиардов активных параметров из 550 миллиардов всего (MoE). Построенная на гибридной архитектуре "смесь экспертов" Transformer-Mamba, она...

ctx 1.0Mвх 45 ₽/Mвых 225 ₽/M

Контекст

NVIDIA: Nemotron 3 Ultra (free)nvidia

NVIDIA Nemotron 3 Ultra — это открытая модель для рассуждений на переднем крае и оркестрации от NVIDIA, имеющая 55 миллиардов активных параметров из 550 миллиардов всего (MoE). Построенная на гибридной архитектуре "смесь экспертов" Transformer-Mamba, она...

ctx 1.0Mвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

NVIDIA: Nemotron 3.5 Content Safety (free)nvidia

NVIDIA Nemotron 3.5 Content Safety — это компактная мультимодальная модель защиты от NVIDIA с 4 миллиардами параметров, дообученная на основе Google Gemma-3-4B. Она модерирует как входные данные для LLM и VLM, так и их ответы, принимая...

ctx 128.0Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

NVIDIA: Nemotron Nano 12B 2 VL (free)nvidia

NVIDIA Nemotron Nano 2 VL — это открытая мультимодальная модель рассуждений с 12 миллиардами параметров, разработанная для понимания видео и анализа документов. Она представляет собой гибридную архитектуру Transformer-Mamba, сочетающую точность уровня Transformer с возможностями Mamba...

ctx 128.0Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

NVIDIA: Nemotron Nano 9B V2nvidia

NVIDIA-Nemotron-Nano-9B-v2 — это большая языковая модель (LLM), обученная с нуля компанией NVIDIA и разработанная как унифицированная модель как для задач рассуждений, так и для не связанных с рассуждениями задач. Она отвечает на запросы пользователей и...

ctx 131.1Kвх 4 ₽/Mвых 14 ₽/M

Контекст

NVIDIA: Nemotron Nano 9B V2 (free)nvidia

NVIDIA-Nemotron-Nano-9B-v2 — это большая языковая модель (LLM), обученная с нуля компанией NVIDIA и разработанная как унифицированная модель как для задач рассуждений, так и для не связанных с рассуждениями задач. Она отвечает на запросы пользователей и...

ctx 128.0Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

OpenAI GPT Latest~openai

Эта модель всегда перенаправляет на последнюю модель в семействе OpenAI GPT.

ctx 1.1Mвх 450 ₽/Mвых 2700 ₽/M

Контекст

OpenAI GPT Mini Latest~openai

Эта модель всегда перенаправляет на последнюю модель в семействе OpenAI GPT Mini.

ctx 400.0Kвх 68 ₽/Mвых 405 ₽/M

Контекст

OpenAI: GPT Chat Latestopenai

GPT Chat Latest указывает на стабильный псевдоним API OpenAI `chat-latest`, который всегда разрешается в последнюю модель Instant chat, используемую в ChatGPT. По мере того, как OpenAI выпускает новые обновления модели Instant...

ctx 400.0Kвх 450 ₽/Mвых 2700 ₽/M

Контекст

OpenAI: GPT-3.5 Turboopenai

GPT-3.5 Turbo — самая быстрая модель OpenAI. Она может понимать и генерировать естественный язык или код, и оптимизирована для чата и традиционных задач завершения. Данные обучения до сентября 2021 года.

ctx 16.4Kвх 45 ₽/Mвых 135 ₽/M

Контекст

OpenAI: GPT-3.5 Turbo (older v0613)openai

GPT-3.5 Turbo — самая быстрая модель OpenAI. Она может понимать и генерировать естественный язык или код, и оптимизирована для чата и традиционных задач завершения. Данные обучения до сентября 2021 года.

ctx 4.1Kвх 90 ₽/Mвых 180 ₽/M

Контекст

OpenAI: GPT-3.5 Turbo 16kopenai

Эта модель предлагает в четыре раза большую длину контекста по сравнению с gpt-3.5-turbo, позволяя обрабатывать примерно 20 страниц текста в одном запросе при более высокой стоимости. Данные обучения: до...

ctx 16.4Kвх 270 ₽/Mвых 360 ₽/M

Контекст

OpenAI: GPT-3.5 Turbo Instructopenai

Эта модель является вариантом GPT-3.5 Turbo, настроенным для инструктивных запросов и исключающим оптимизации, связанные с чатом. Данные обучения: до сентября 2021 года.

ctx 4.1Kвх 135 ₽/Mвых 180 ₽/M

Контекст

OpenAI: GPT-4openai

Флагманская модель OpenAI, GPT-4, представляет собой крупномасштабную мультимодальную языковую модель, способную решать сложные задачи с большей точностью, чем предыдущие модели, благодаря своим более широким общим знаниям и продвинутым рассуждениям...

ctx 8.2Kвх 2700 ₽/Mвых 5400 ₽/M

Контекст

OpenAI: GPT-4 Turboopenai

Последняя модель GPT-4 Turbo с возможностями визуализации. Запросы на визуализацию теперь могут использовать режим JSON и вызов функций. Данные обучения: до декабря 2023 года.

ctx 128.0Kвх 900 ₽/Mвых 2700 ₽/M

Контекст

OpenAI: GPT-4 Turbo Previewopenai

Предварительная версия GPT-4 с улучшенным следованием инструкциям, режимом JSON, воспроизводимыми результатами, параллельным вызовом функций и многим другим. Данные обучения: до декабря 2023 года. **Примечание:** сильно ограничена по скорости OpenAI во время...

ctx 128.0Kвх 900 ₽/Mвых 2700 ₽/M

Контекст

OpenAI: GPT-4.1openai

GPT-4.1 — это флагманская большая языковая модель, оптимизированная для продвинутого следования инструкциям, реальной разработки программного обеспечения и рассуждений в длинном контексте. Она поддерживает контекстное окно в 1 миллион токенов и превосходит GPT-4o и...

ctx 1.0Mвх 180 ₽/Mвых 720 ₽/M

Контекст

OpenAI: GPT-4.1 Miniopenai

GPT-4.1 Mini — это модель среднего размера, обеспечивающая производительность, конкурентоспособную с GPT-4o, при значительно меньшей задержке и стоимости. Она сохраняет контекстное окно в 1 миллион токенов и набирает 45,1% на сложных...

ctx 1.0Mвх 36 ₽/Mвых 144 ₽/M

Контекст

OpenAI: GPT-4.1 Nanoopenai

Для задач, требующих низкой задержки, GPT‑4.1 nano является самой быстрой и дешевой моделью в серии GPT-4.1. Она обеспечивает исключительную производительность при небольшом размере благодаря своему 1 миллиону...

ctx 1.0Mвх 9 ₽/Mвых 36 ₽/M

Контекст

OpenAI: GPT-4oopenai

GPT-4o («o» означает «omni») — новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с текстовым выводом. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), будучи в два раза...

ctx 128.0Kвх 225 ₽/Mвых 900 ₽/M

Контекст

OpenAI: GPT-4o (2024-05-13)openai

GPT-4o («o» означает «omni») — новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с текстовым выводом. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), будучи в два раза...

ctx 128.0Kвх 450 ₽/Mвых 1350 ₽/M

Контекст

OpenAI: GPT-4o (2024-08-06)openai

Версия GPT-4o от 2024-08-06 предлагает улучшенную производительность в структурированных выходных данных с возможностью предоставления JSON-схемы в `response_format`. Подробнее читайте [здесь](https://openai.com/index/introducing-structured-outputs-in-the-api/). GPT-4o («o» означает «omni»)...

ctx 128.0Kвх 225 ₽/Mвых 900 ₽/M

Контекст

OpenAI: GPT-4o (2024-11-20)openai

Версия GPT-4o от 2024-11-20 предлагает улучшенную способность к творческому письму с более естественным, увлекательным и адаптированным письмом для повышения релевантности и читабельности. Она также лучше работает с загруженными...

ctx 128.0Kвх 225 ₽/Mвых 900 ₽/M

Контекст

OpenAI: GPT-4o Search Previewopenai

GPT-4o Search Preview — это специализированная модель для поиска в Интернете в Chat Completions. Она обучена понимать и выполнять поисковые запросы в Интернете.

ctx 128.0Kвх 225 ₽/Mвых 900 ₽/M

Контекст

OpenAI: GPT-4o-miniopenai

GPT-4o mini — новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая ввод текста и изображений с текстовым выводом. Будучи самой продвинутой малой моделью, она в несколько раз более доступна...

ctx 128.0Kвх 14 ₽/Mвых 54 ₽/M

Контекст

OpenAI: GPT-4o-mini (2024-07-18)openai

GPT-4o mini — новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая ввод текста и изображений с текстовым выводом. Будучи самой продвинутой малой моделью, она в несколько раз более доступна...

ctx 128.0Kвх 14 ₽/Mвых 54 ₽/M

Контекст

OpenAI: GPT-4o-mini Search Previewopenai

GPT-4o mini Search Preview — это специализированная модель для поиска в Интернете в Chat Completions. Она обучена понимать и выполнять поисковые запросы в Интернете.

ctx 128.0Kвх 14 ₽/Mвых 54 ₽/M

Контекст

OpenAI: GPT-5openai

GPT-5 — самая продвинутая модель OpenAI, предлагающая значительные улучшения в рассуждениях, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошаговых рассуждений, следования инструкциям и точности...

ctx 400.0Kвх 113 ₽/Mвых 900 ₽/M

Контекст

OpenAI: GPT-5 Chatopenai

GPT-5 Chat разработан для продвинутых, естественных, мультимодальных и контекстно-зависимых диалогов для корпоративных приложений.

ctx 128.0Kвх 113 ₽/Mвых 900 ₽/M

Контекст

OpenAI: GPT-5 Codexopenai

GPT-5-Codex — это специализированная версия GPT-5, оптимизированная для рабочих процессов разработки программного обеспечения и кодирования. Она предназначена как для интерактивных сеансов разработки, так и для длительного, независимого выполнения сложных инженерных задач....

ctx 400.0Kвх 113 ₽/Mвых 900 ₽/M

Контекст

OpenAI: GPT-5 Miniopenai

GPT-5 Mini — это компактная версия GPT-5, разработанная для выполнения более простых задач рассуждений. Она обеспечивает те же преимущества в следовании инструкциям и настройке безопасности, что и GPT-5, но с уменьшенной задержкой и стоимостью....

ctx 400.0Kвх 23 ₽/Mвых 180 ₽/M

Контекст

OpenAI: GPT-5 Nanoopenai

GPT-5-Nano — самый маленький и быстрый вариант в системе GPT-5, оптимизированный для инструментов разработчика, быстрых взаимодействий и сред с ультранизкой задержкой. Несмотря на ограниченную глубину рассуждений по сравнению с более крупными...

ctx 400.0Kвх 5 ₽/Mвых 36 ₽/M

Контекст

OpenAI: GPT-5 Proopenai

GPT-5 Pro — самая продвинутая модель OpenAI, предлагающая значительные улучшения в рассуждениях, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошаговых рассуждений, следования инструкциям и...

ctx 400.0Kвх 1350 ₽/Mвых 10800 ₽/M

Контекст

OpenAI: GPT-5.1openai

GPT-5.1 — это новейшая модель передового уровня в серии GPT-5, предлагающая более сильные общие рассуждения, улучшенное соблюдение инструкций и более естественный разговорный стиль по сравнению с GPT-5. Она использует адаптивные рассуждения...

ctx 400.0Kвх 113 ₽/Mвых 900 ₽/M

Контекст

OpenAI: GPT-5.1 Chatopenai

GPT-5.1 Chat (также известный как Instant) — это быстрый, легкий член семейства 5.1, оптимизированный для чата с низкой задержкой при сохранении сильного общего интеллекта. Он использует адаптивные рассуждения для выборочного «мышления»...

ctx 128.0Kвх 113 ₽/Mвых 900 ₽/M

Контекст

OpenAI: GPT-5.1-Codexopenai

GPT-5.1-Codex — это специализированная версия GPT-5.1, оптимизированная для рабочих процессов разработки программного обеспечения и кодирования. Она предназначена как для интерактивных сессий разработки, так и для длительного независимого выполнения сложных инженерных задач....

ctx 400.0Kвх 113 ₽/Mвых 900 ₽/M

Контекст

OpenAI: GPT-5.1-Codex-Maxopenai

GPT-5.1-Codex-Max — новейшая агентная модель кодирования от OpenAI, разработанная для длительных задач разработки программного обеспечения с высоким контекстом. Она основана на обновленной версии стека рассуждений 5.1 и обучена на агентных...

ctx 400.0Kвх 113 ₽/Mвых 900 ₽/M

Контекст

OpenAI: GPT-5.1-Codex-Miniopenai

GPT-5.1-Codex-Mini — это меньшая и более быстрая версия GPT-5.1-Codex

ctx 400.0Kвх 23 ₽/Mвых 180 ₽/M

Контекст

OpenAI: GPT-5.2openai

GPT-5.2 — новейшая модель передового уровня в серии GPT-5, предлагающая более сильные агентные возможности и производительность в длинном контексте по сравнению с GPT-5.1. Она использует адаптивное рассуждение для динамического распределения вычислений, быстро реагируя...

ctx 400.0Kвх 158 ₽/Mвых 1260 ₽/M

Контекст

OpenAI: GPT-5.2 Chatopenai

GPT-5.2 Chat (также известная как Instant) — это быстрый, легкий член семейства 5.2, оптимизированный для чата с низкой задержкой, сохраняя при этом сильный общий интеллект. Она использует адаптивное рассуждение для выборочного «мышления» над...

ctx 128.0Kвх 158 ₽/Mвых 1260 ₽/M

Контекст

OpenAI: GPT-5.2 Proopenai

GPT-5.2 Pro — самая передовая модель OpenAI, предлагающая значительные улучшения в агентном кодировании и производительности в длинном контексте по сравнению с GPT-5 Pro. Она оптимизирована для сложных задач, требующих пошагового рассуждения,...

ctx 400.0Kвх 1890 ₽/Mвых 15120 ₽/M

Контекст

OpenAI: GPT-5.2-Codexopenai

GPT-5.2-Codex — это обновленная версия GPT-5.1-Codex, оптимизированная для рабочих процессов разработки программного обеспечения и кодирования. Она предназначена как для интерактивных сессий разработки, так и для длительного независимого выполнения сложных инженерных задач....

ctx 400.0Kвх 158 ₽/Mвых 1260 ₽/M

Контекст

OpenAI: GPT-5.3 Chatopenai

GPT-5.3 Chat — это обновление наиболее используемой модели ChatGPT, которое делает повседневные разговоры более плавными, полезными и непосредственно помогающими. Она предоставляет более точные ответы с лучшей контекстуализацией и значительно...

ctx 128.0Kвх 158 ₽/Mвых 1260 ₽/M

Контекст

OpenAI: GPT-5.3-Codexopenai

GPT-5.3-Codex — самая передовая агентная модель кодирования от OpenAI, сочетающая в себе передовую производительность в области разработки программного обеспечения GPT-5.2-Codex с более широкими возможностями рассуждений и профессиональными знаниями GPT-5.2. Она достигает передовых результатов...

ctx 400.0Kвх 158 ₽/Mвых 1260 ₽/M

Контекст

OpenAI: GPT-5.4openai

GPT-5.4 — новейшая модель передового уровня от OpenAI, объединяющая линейки Codex и GPT в единую систему. Она имеет контекстное окно более 1 миллиона токенов (922 тыс. входных, 128 тыс. выходных) с поддержкой...

ctx 1.1Mвх 225 ₽/Mвых 1350 ₽/M

Контекст

OpenAI: GPT-5.4 Miniopenai

GPT-5.4 mini предоставляет основные возможности GPT-5.4 в более быстрой и эффективной модели, оптимизированной для рабочих нагрузок с высокой пропускной способностью. Она поддерживает ввод текста и изображений с высокой производительностью в области рассуждений, кодирования,...

ctx 400.0Kвх 68 ₽/Mвых 405 ₽/M

Контекст

OpenAI: GPT-5.4 Nanoopenai

GPT-5.4 nano — самый легкий и экономичный вариант семейства GPT-5.4, оптимизированный для задач, критичных к скорости и высокообъемных задач. Она поддерживает ввод текста и изображений и предназначена для низкой задержки...

ctx 400.0Kвх 18 ₽/Mвых 113 ₽/M

Контекст

OpenAI: GPT-5.4 Proopenai

GPT-5.4 Pro — самая передовая модель OpenAI, построенная на унифицированной архитектуре GPT-5.4 с улучшенными возможностями рассуждений для сложных, ответственных задач. Она имеет контекстное окно более 1 миллиона токенов (922 тыс. входных, 128 тыс....

ctx 1.1Mвх 2700 ₽/Mвых 16200 ₽/M

Контекст

OpenAI: GPT-5.5openai

GPT-5.5 — модель передового уровня от OpenAI, разработанная для сложных профессиональных рабочих нагрузок, построенная на GPT-5.4 с более сильными рассуждениями, более высокой надежностью и улучшенной эффективностью токенов на сложных задачах. Она имеет более 1 миллиона токенов...

ctx 1.1Mвх 450 ₽/Mвых 2700 ₽/M

Контекст

OpenAI: GPT-5.5 Proopenai

GPT-5.5 Pro — модель OpenAI с высокой производительностью, оптимизированная для глубоких рассуждений и точности на сложных, ответственных рабочих нагрузках. Она имеет контекстное окно более 1 миллиона токенов (922 тыс. входных, 128 тыс. выходных) с поддержкой...

ctx 1.1Mвх 2700 ₽/Mвых 16200 ₽/M

Контекст

OpenAI: gpt-oss-120bopenai

gpt-oss-120b — это языковая модель Mixture-of-Experts (MoE) с открытым весом и 117 миллиардами параметров от OpenAI, разработанная для высокопроизводительных, агентных и общецелевых производственных сценариев использования. Она активирует 5,1 миллиарда параметров за прямой проход и оптимизирована...

ctx 131.1Kвх 4 ₽/Mвых 16 ₽/M

Контекст

OpenAI: gpt-oss-120b (free)openai

gpt-oss-120b — это языковая модель Mixture-of-Experts (MoE) с открытым весом и 117 миллиардами параметров от OpenAI, разработанная для высокопроизводительных, агентных и общецелевых производственных сценариев использования. Она активирует 5,1 миллиарда параметров за прямой проход и оптимизирована...

ctx 131.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

OpenAI: gpt-oss-20bopenai

gpt-oss-20b — это модель с открытым весом и 21 миллиардом параметров, выпущенная OpenAI под лицензией Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров за прямой проход, оптимизированную для...

ctx 131.1Kвх 3 ₽/Mвых 13 ₽/M

Контекст

OpenAI: gpt-oss-20b (free)openai

gpt-oss-20b — это модель с открытым весом и 21 миллиардом параметров, выпущенная OpenAI под лицензией Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров за прямой проход, оптимизированную для...

ctx 131.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

OpenAI: gpt-oss-safeguard-20bopenai

gpt-oss-safeguard-20b — это модель рассуждений по безопасности от OpenAI, построенная на основе gpt-oss-20b. Эта модель Mixture-of-Experts (MoE) с открытым весом и 21 миллиардом параметров обеспечивает более низкую задержку для задач безопасности, таких как классификация контента, фильтрация LLM и доверие...

ctx 131.1Kвх 7 ₽/Mвых 27 ₽/M

Контекст

OpenAI: o1openai

Новейшее и самое мощное семейство моделей от OpenAI, o1, разработано для того, чтобы тратить больше времени на размышления перед ответом. Серия моделей o1 обучена с использованием крупномасштабного обучения с подкреплением для рассуждений...

ctx 200.0Kвх 1350 ₽/Mвых 5400 ₽/M

Контекст

OpenAI: o1-proopenai

Модели серии o1 обучены с использованием обучения с подкреплением для размышлений перед ответом и выполнения сложных рассуждений. Модель o1-pro использует больше вычислительных ресурсов для более глубоких размышлений и предоставления...

ctx 200.0Kвх 13500 ₽/Mвых 54000 ₽/M

Контекст

OpenAI: o3openai

o3 — это хорошо сбалансированная и мощная модель во всех доменах. Она устанавливает новый стандарт для задач по математике, науке, кодированию и визуальным рассуждениям. Она также превосходно справляется с техническим письмом и следованием инструкциям....

ctx 200.0Kвх 180 ₽/Mвых 720 ₽/M

Контекст

OpenAI: o3 Deep Researchopenai

o3-deep-research — это передовая модель OpenAI для глубоких исследований, разработанная для решения сложных многошаговых исследовательских задач. Примечание: Эта модель всегда использует инструмент 'web_search', который добавляет дополнительные расходы.

ctx 200.0Kвх 900 ₽/Mвых 3600 ₽/M

Контекст

OpenAI: o3 Miniopenai

OpenAI o3-mini — это экономичная языковая модель, оптимизированная для задач STEM-рассуждений, особенно преуспевающая в науке, математике и кодировании. Эта модель поддерживает параметр `reasoning_effort`, который может быть установлен на...

ctx 200.0Kвх 99 ₽/Mвых 396 ₽/M

Контекст

OpenAI: o3 Mini Highopenai

OpenAI o3-mini-high — это та же модель, что и [o3-mini](/openai/o3-mini), с установленным `reasoning_effort` на высокое значение. o3-mini — это экономичная языковая модель, оптимизированная для задач STEM-рассуждений, особенно преуспевающая в науке, математике и...

ctx 200.0Kвх 99 ₽/Mвых 396 ₽/M

Контекст

OpenAI: o3 Proopenai

Модели серии o обучены с использованием обучения с подкреплением для размышлений перед ответом и выполнения сложных рассуждений. Модель o3-pro использует больше вычислительных ресурсов для более глубоких размышлений и последовательного предоставления...

ctx 200.0Kвх 1800 ₽/Mвых 7200 ₽/M

Контекст

OpenAI: o4 Miniopenai

OpenAI o4-mini — это компактная модель рассуждений из серии o, оптимизированная для быстрой и экономичной работы при сохранении сильных мультимодальных и агентных возможностей. Она поддерживает использование инструментов и демонстрирует конкурентоспособные рассуждения...

ctx 200.0Kвх 99 ₽/Mвых 396 ₽/M

Контекст

OpenAI: o4 Mini Deep Researchopenai

o4-mini-deep-research — это более быстрая и доступная модель глубоких исследований от OpenAI — идеальна для решения сложных многошаговых исследовательских задач. Примечание: Эта модель всегда использует инструмент 'web_search', который добавляет дополнительные расходы.

ctx 200.0Kвх 180 ₽/Mвых 720 ₽/M

Контекст

OpenAI: o4 Mini Highopenai

OpenAI o4-mini-high — это та же модель, что и [o4-mini](/openai/o4-mini), с установленным `reasoning_effort` на высокое значение. OpenAI o4-mini — это компактная модель рассуждений из серии o, оптимизированная для быстрой и экономичной работы при сохранении...

ctx 200.0Kвх 99 ₽/Mвых 396 ₽/M

Контекст

OpenRouter: Fusionopenrouter

Fusion превращает ваш запрос в небольшое многомодельное обсуждение. Группа экспертных моделей (см. ниже) параллельно анализирует ваш запрос с включенным поиском в Интернете и извлечением данных из Интернета, затем...

ctx 128.0Kвх -90000000.00 ₽/Mвых -90000000.00 ₽/M

Контекст

-90000000.00 ₽/M

-90000000.00 ₽/M

Owl Alphaopenrouter

Owl Alpha — это высокопроизводительная базовая модель, разработанная для агентных рабочих нагрузок. Нативно поддерживает использование инструментов и задачи с длинным контекстом, с высокой производительностью в генерации кода, автоматизированных рабочих процессах и выполнении сложных инструкций....

ctx 1.0Mвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Pareto Code Routeropenrouter

Маршрутизатор Pareto поддерживает многоуровневый список сильных моделей кодирования, ранжированных по [Artificial Analysis](https://artificialanalysis.ai/) процентным показателям кодирования. Установите min_coding_score от 0 до 1 в [плагине pareto-router](https://openrouter.ai/docs/guides/routing/routers/pareto-router#the-min_coding_score-parameter) для управления тем, как...

ctx 2.0Mвх -90000000.00 ₽/Mвых -90000000.00 ₽/M

Контекст

-90000000.00 ₽/M

-90000000.00 ₽/M

Perceptron: Perceptron Mk1perceptron

Perceptron Mk1 (Mark One) — это самая высококачественная модель видения и языка от Perceptron для видео и воплощенного рассуждения. Она принимает на вход изображения и видео в сочетании с запросами на естественном языке и обеспечивает детальное визуальное понимание...

ctx 32.8Kвх 14 ₽/Mвых 135 ₽/M

Контекст

Perplexity: Sonarperplexity

Sonar — легкий, доступный, быстрый и простой в использовании — теперь с цитатами и возможностью настройки источников. Он предназначен для компаний, стремящихся интегрировать легкие функции вопросов и ответов...

ctx 127.1Kвх 90 ₽/Mвых 90 ₽/M

Контекст

Perplexity: Sonar Deep Researchperplexity

Sonar Deep Research — модель, ориентированная на исследования, предназначенная для многошагового поиска, синтеза и рассуждений по сложным темам. Она автономно ищет, читает и оценивает источники, уточняя свой подход по мере сбора...

ctx 128.0Kвх 180 ₽/Mвых 720 ₽/M

Контекст

Perplexity: Sonar Properplexity

Примечание: Ценообразование Sonar Pro включает в себя ценообразование поиска Perplexity. См. [подробности здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro) Для предприятий, ищущих более продвинутые возможности, API Sonar Pro может обрабатывать углубленные многошаговые запросы с дополнительной расширяемостью, такой как...

ctx 200.0Kвх 270 ₽/Mвых 1350 ₽/M

Контекст

Perplexity: Sonar Pro Searchperplexity

Эксклюзивно доступный через API OpenRouter, новый режим Pro Search в Sonar Pro — это самая передовая агентная система поиска Perplexity. Он разработан для более глубоких рассуждений и анализа. Ценообразование основано на...

ctx 200.0Kвх 270 ₽/Mвых 1350 ₽/M

Контекст

Perplexity: Sonar Reasoning Properplexity

Примечание: Ценообразование Sonar Pro включает в себя ценообразование поиска Perplexity. См. [подробности здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro) Sonar Reasoning Pro — это первоклассная модель рассуждений, основанная на DeepSeek R1 с Chain of Thought (CoT). Разработана для...

ctx 128.0Kвх 180 ₽/Mвых 720 ₽/M

Контекст

Poolside: Laguna M.1 (free)poolside

Laguna M.1 — флагманская модель кодирования от [Poolside](https://poolside.ai), оптимизированная для сложных задач разработки программного обеспечения. Разработана для агентных рабочих процессов кодирования, поддерживает вызов инструментов и рассуждения, с контекстом 128K...

ctx 262.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Poolside: Laguna XS.2 (free)poolside

Laguna XS.2 — модель второго поколения в классе XS от [Poolside](https://poolside.ai), их серии эффективных кодирующих агентов. Она сочетает в себе возможности вызова инструментов и рассуждений с компактным размером, предлагая...

ctx 262.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Prime Intellect: INTELLECT-3prime-intellect

INTELLECT-3 — это модель Mixture-of-Experts с 106 миллиардами параметров (12 миллиардов активных), дообученная на основе GLM-4.5-Air-Base с использованием контролируемого дообучения (SFT), за которым следует масштабное обучение с подкреплением (RL). Она демонстрирует передовую производительность для своего размера в области математики,...

ctx 131.1Kвх 18 ₽/Mвых 99 ₽/M

Контекст

Qwen: Qwen Plus 0728qwen

Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом 1 миллион, обеспечивающую сбалансированное сочетание производительности, скорости и стоимости.

ctx 1.0Mвх 23 ₽/Mвых 70 ₽/M

Контекст

Qwen: Qwen Plus 0728 (thinking)qwen

Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом 1 миллион, обеспечивающую сбалансированное сочетание производительности, скорости и стоимости.

ctx 1.0Mвх 23 ₽/Mвых 70 ₽/M

Контекст

Qwen: Qwen-Plusqwen

Qwen-Plus, основанная на базовой модели Qwen2.5, представляет собой модель с контекстом 131K, обеспечивающую сбалансированное сочетание производительности, скорости и стоимости.

ctx 1.0Mвх 23 ₽/Mвых 70 ₽/M

Контекст

Qwen: Qwen2.5 7B Instructqwen

Qwen2.5 7B — это новейшая серия больших языковых моделей Qwen. Qwen2.5 предлагает следующие улучшения по сравнению с Qwen2: — Значительно больше знаний и значительно улучшенные возможности в области программирования и...

ctx 131.1Kвх 4 ₽/Mвых 9 ₽/M

Контекст

Qwen: Qwen2.5 VL 72B Instructqwen

Qwen2.5-VL отлично распознает распространенные объекты, такие как цветы, птицы, рыбы и насекомые. Она также обладает высокой способностью анализировать тексты, диаграммы, значки, графику и макеты в изображениях.

ctx 131.1Kвх 23 ₽/Mвых 68 ₽/M

Контекст

Qwen: Qwen3 14Bqwen

Qwen3-14B — это плотная каузальная языковая модель с 14,8 миллиардами параметров из серии Qwen3, разработанная как для сложного рассуждения, так и для эффективного диалога. Она поддерживает бесшовное переключение между режимом «мышления» для...

ctx 131.7Kвх 9 ₽/Mвых 22 ₽/M

Контекст

Qwen: Qwen3 235B A22Bqwen

Qwen3-235B-A22B — это модель mixture-of-experts (MoE) с 235 миллиардами параметров, разработанная Qwen, активирующая 22 миллиарда параметров при каждом прямом проходе. Она поддерживает бесшовное переключение между режимом «мышления» для сложного рассуждения, математики и...

ctx 131.1Kвх 41 ₽/Mвых 164 ₽/M

Контекст

Qwen: Qwen3 235B A22B Instruct 2507qwen

Qwen3-235B-A22B-Instruct-2507 — это многоязычная модель языка mixture-of-experts, настроенная на инструкции, основанная на архитектуре Qwen3-235B, с 22 миллиардами активных параметров при каждом прямом проходе. Она оптимизирована для общего текстового создания, включая следование инструкциям,...

ctx 262.1Kвх 8 ₽/Mвых 9 ₽/M

Контекст

Qwen: Qwen3 235B A22B Thinking 2507qwen

Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная модель языка Mixture-of-Experts (MoE) с открытыми весами, оптимизированная для задач сложного рассуждения. Она активирует 22 миллиарда из своих 235 миллиардов параметров при каждом прямом проходе и изначально поддерживает до 262 144...

ctx 262.1Kвх 9 ₽/Mвых 9 ₽/M

Контекст

Qwen: Qwen3 30B A3Bqwen

Qwen3, последнее поколение серии больших языковых моделей Qwen, включает как плотные, так и mixture-of-experts (MoE) архитектуры для превосходства в рассуждениях, многоязычной поддержке и продвинутых задачах агентов. Ее уникальная...

ctx 131.1Kвх 11 ₽/Mвых 45 ₽/M

Контекст

Qwen: Qwen3 30B A3B Instruct 2507qwen

Qwen3-30B-A3B-Instruct-2507 — это модель языка mixture-of-experts с 30,5 миллиардами параметров от Qwen, с 3,3 миллиардами активных параметров при каждом выводе. Она работает в режиме без «мышления» и предназначена для высококачественного следования инструкциям, многоязычного понимания и...

ctx 131.1Kвх 4 ₽/Mвых 17 ₽/M

Контекст

Qwen: Qwen3 30B A3B Thinking 2507qwen

Qwen3-30B-A3B-Thinking-2507 — это модель рассуждений Mixture-of-Experts с 30 миллиардами параметров, оптимизированная для сложных задач, требующих расширенного многошагового мышления. Модель специально разработана для «режима мышления», где внутренние следы рассуждений разделены...

ctx 131.1Kвх 7 ₽/Mвых 36 ₽/M

Контекст

Qwen: Qwen3 32Bqwen

Qwen3-32B — это плотная каузальная языковая модель с 32,8 миллиардами параметров из серии Qwen3, оптимизированная как для сложного рассуждения, так и для эффективного диалога. Она поддерживает бесшовное переключение между режимом «мышления» для...

ctx 131.1Kвх 7 ₽/Mвых 25 ₽/M

Контекст

Qwen: Qwen3 8Bqwen

Qwen3-8B — это плотная каузальная языковая модель с 8,2 миллиардами параметров из серии Qwen3, разработанная как для задач, требующих интенсивных рассуждений, так и для эффективного диалога. Она поддерживает бесшовное переключение между режимом «мышления» для математики,...

ctx 131.1Kвх 5 ₽/Mвых 36 ₽/M

Контекст

Qwen: Qwen3 Coder 30B A3B Instructqwen

Qwen3-Coder-30B-A3B-Instruct — это модель Mixture-of-Experts (MoE) с 30,5 миллиардами параметров и 128 экспертами (8 активных при каждом прямом проходе), разработанная для продвинутого создания кода, понимания репозиториев в масштабе и использования инструментов агентами. Создана на основе...

ctx 160.0Kвх 6 ₽/Mвых 24 ₽/M

Контекст

Qwen: Qwen3 Coder 480B A35Bqwen

Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для задач кодирования агентами, таких как вызов функций, использование инструментов и рассуждение в длинном контексте по...

ctx 1.0Mвх 20 ₽/Mвых 162 ₽/M

Контекст

Qwen: Qwen3 Coder 480B A35B (free)qwen

Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для задач кодирования агентами, таких как вызов функций, использование инструментов и рассуждение в длинном контексте по...

ctx 1.0Mвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Qwen: Qwen3 Coder Flashqwen

Qwen3 Coder Flash — это быстрая и экономичная версия собственной разработки Alibaba модели Qwen3 Coder Plus. Это мощная модель агента для кодирования, специализирующаяся на автономном программировании посредством вызова инструментов...

ctx 1.0Mвх 18 ₽/Mвых 88 ₽/M

Контекст

Qwen: Qwen3 Coder Nextqwen

Qwen3-Coder-Next — это каузальная языковая модель с открытыми весами, оптимизированная для агентов кодирования и локальных рабочих процессов разработки. Она использует разреженную конструкцию MoE с 80 миллиардами общих параметров и только 3 миллиардами активированных за...

ctx 262.1Kвх 10 ₽/Mвых 72 ₽/M

Контекст

Qwen: Qwen3 Coder Plusqwen

Qwen3 Coder Plus — это собственная версия Alibaba открытой модели Qwen3 Coder 480B A35B. Это мощная модель агента для кодирования, специализирующаяся на автономном программировании посредством вызова инструментов и...

ctx 1.0Mвх 59 ₽/Mвых 293 ₽/M

Контекст

Qwen: Qwen3 Maxqwen

Qwen3-Max — это обновленная версия, основанная на серии Qwen3, предлагающая значительные улучшения в рассуждениях, следовании инструкциям, многоязычной поддержке и охвате редких знаний по сравнению с версией от января 2025 года. Она...

ctx 262.1Kвх 70 ₽/Mвых 351 ₽/M

Контекст

Qwen: Qwen3 Max Thinkingqwen

Qwen3-Max-Thinking — это флагманская модель рассуждений в серии Qwen3, разработанная для ответственных когнитивных задач, требующих глубоких, многошаговых рассуждений. За счет значительного масштабирования мощности модели и вычислительных ресурсов для обучения с подкреплением, она...

ctx 262.1Kвх 70 ₽/Mвых 351 ₽/M

Контекст

Qwen: Qwen3 Next 80B A3B Instructqwen

Qwen3-Next-80B-A3B-Instruct — это настроенная на инструкции чат-модель из серии Qwen3-Next, оптимизированная для быстрых, стабильных ответов без следов «мышления». Она нацелена на сложные задачи в области рассуждений, генерации кода, ответов на вопросы по знаниям и многоязычных...

ctx 262.1Kвх 8 ₽/Mвых 99 ₽/M

Контекст

Qwen: Qwen3 Next 80B A3B Instruct (free)qwen

Qwen3-Next-80B-A3B-Instruct — это настроенная на инструкции чат-модель из серии Qwen3-Next, оптимизированная для быстрых, стабильных ответов без следов «мышления». Она нацелена на сложные задачи в области рассуждений, генерации кода, ответов на вопросы по знаниям и многоязычных...

ctx 262.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Qwen: Qwen3 Next 80B A3B Thinkingqwen

Qwen3-Next-80B-A3B-Thinking — это чат-модель из линейки Qwen3-Next, ориентированная на рассуждения, которая по умолчанию выводит структурированные следы «мышления». Она предназначена для сложных многошаговых задач; математических доказательств, синтеза/отладки кода, логики и агентов...

ctx 262.1Kвх 9 ₽/Mвых 70 ₽/M

Контекст

Qwen: Qwen3 VL 235B A22B Instructqwen

Qwen3-VL-235B-A22B Instruct — это открытая мультимодальная модель, объединяющая мощное создание текста с визуальным пониманием изображений и видео. Модель Instruct нацелена на общее использование в области зрения и языка (VQA, разбор документов, диаграммы/таблицы...

ctx 262.1Kвх 18 ₽/Mвых 79 ₽/M

Контекст

Qwen: Qwen3 VL 235B A22B Thinkingqwen

Qwen3-VL-235B-A22B Thinking — это мультимодальная модель, объединяющая мощное создание текста с визуальным пониманием изображений и видео. Модель Thinking оптимизирована для мультимодальных рассуждений в STEM и математике....

ctx 131.1Kвх 23 ₽/Mвых 234 ₽/M

Контекст

Qwen: Qwen3 VL 30B A3B Instructqwen

Qwen3-VL-30B-A3B-Instruct — это мультимодальная модель, объединяющая мощное создание текста с визуальным пониманием изображений и видео. Ее вариант Instruct оптимизирует следование инструкциям для общих мультимодальных задач. Она превосходно справляется с восприятием...

ctx 262.1Kвх 12 ₽/Mвых 47 ₽/M

Контекст

Qwen: Qwen3 VL 30B A3B Thinkingqwen

Qwen3-VL-30B-A3B-Thinking — это мультимодальная модель, объединяющая мощное создание текста с визуальным пониманием изображений и видео. Ее вариант Thinking улучшает рассуждения в STEM, математике и сложных задачах. Она превосходно...

ctx 131.1Kвх 12 ₽/Mвых 140 ₽/M

Контекст

Qwen: Qwen3 VL 32B Instructqwen

Qwen3-VL-32B-Instruct — это крупномасштабная мультимодальная модель зрения-язык, разработанная для высокоточного понимания и рассуждения в тексте, изображениях и видео. Обладая 32 миллиардами параметров, она сочетает глубокое визуальное восприятие с продвинутым текстом...

ctx 262.1Kвх 9 ₽/Mвых 37 ₽/M

Контекст

Qwen: Qwen3 VL 8B Instructqwen

Qwen3-VL-8B-Instruct — это мультимодальная модель зрения-язык из серии Qwen3-VL, созданная для высококачественного понимания и рассуждения в тексте, изображениях и видео. Она отличается улучшенным мультимодальным слиянием с Interleaved-MRoPE для длительного горизонта...

ctx 256.0Kвх 7 ₽/Mвых 45 ₽/M

Контекст

Qwen: Qwen3 VL 8B Thinkingqwen

Qwen3-VL-8B-Thinking — это вариант мультимодальной модели Qwen3-VL-8B, оптимизированный для рассуждений, предназначенный для продвинутых визуальных и текстовых рассуждений в сложных сценах, документах и временных последовательностях. Он интегрирует улучшенное мультимодальное согласование и...

ctx 256.0Kвх 11 ₽/Mвых 123 ₽/M

Контекст

Qwen: Qwen3.5 397B A17Bqwen

Нативная модель зрения-язык серии Qwen3.5 397B-A17B построена на гибридной архитектуре, которая интегрирует механизм линейного внимания с разреженной моделью mixture-of-experts, достигая более высокой эффективности вывода. Она обеспечивает...

ctx 262.1Kвх 35 ₽/Mвых 211 ₽/M

Контекст

Qwen: Qwen3.5 Plus 2026-02-15qwen

Нативные модели зрения-язык серии Qwen3.5 Plus построены на гибридной архитектуре, которая интегрирует механизмы линейного внимания с разреженными моделями mixture-of-experts, достигая более высокой эффективности вывода. В различных...

ctx 1.0Mвх 23 ₽/Mвых 140 ₽/M

Контекст

Qwen: Qwen3.5 Plus 2026-04-20qwen

Qwen3.5 Plus (апрель 2026) — это крупномасштабная мультимодальная языковая модель от Alibaba. Она принимает ввод текста, изображений и видео и выдает текстовый вывод, с окном контекста 1 миллион токенов. Это...

ctx 1.0Mвх 27 ₽/Mвых 162 ₽/M

Контекст

Qwen: Qwen3.5-122B-A10Bqwen

Нативная модель зрения-язык Qwen3.5 122B-A10B построена на гибридной архитектуре, которая интегрирует механизм линейного внимания с разреженной моделью mixture-of-experts, достигая более высокой эффективности вывода. С точки зрения...

ctx 262.1Kвх 23 ₽/Mвых 187 ₽/M

Контекст

Qwen: Qwen3.5-27Bqwen

Нативная модель зрения-язык Qwen3.5 27B включает механизм линейного внимания, обеспечивая быстрое время отклика при балансировке скорости вывода и производительности. Ее общие возможности сопоставимы с возможностями...

ctx 262.1Kвх 18 ₽/Mвых 140 ₽/M

Контекст

Qwen: Qwen3.5-35B-A3Bqwen

Серия Qwen3.5 35B-A3B — это нативная модель зрения-язык, разработанная с гибридной архитектурой, которая интегрирует механизмы линейного внимания и разреженную модель mixture-of-experts, достигая более высокой эффективности вывода. Ее общие...

ctx 262.1Kвх 13 ₽/Mвых 90 ₽/M

Контекст

Qwen: Qwen3.5-9Bqwen

Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, разработанная для обеспечения сильных рассуждений, кодирования и визуального понимания в эффективной архитектуре с 9 миллиардами параметров. Она использует унифицированный дизайн зрения-язык...

ctx 262.1Kвх 9 ₽/Mвых 14 ₽/M

Контекст

Qwen: Qwen3.5-Flashqwen

Нативные модели Qwen3.5 vision-language Flash построены на гибридной архитектуре, которая интегрирует механизм линейного внимания с моделью разреженного ансамбля экспертов (sparse mixture-of-experts), достигая более высокой эффективности инференса. По сравнению с...

ctx 1.0Mвх 6 ₽/Mвых 23 ₽/M

Контекст

Qwen: Qwen3.6 27Bqwen

Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров от команды Qwen Team из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальными возможностями — принимает текстовые, графические и видеовходы...

ctx 262.1Kвх 26 ₽/Mвых 216 ₽/M

Контекст

Qwen: Qwen3.6 35B A3Bqwen

Qwen3.6-35B-A3B — это открытая мультимодальная модель от Alibaba Cloud с 35 миллиардами общих параметров и 3 миллиардами активных параметров на токен. Она использует гибридную архитектуру разреженного ансамбля экспертов, сочетающую Gated...

ctx 262.1Kвх 13 ₽/Mвых 90 ₽/M

Контекст

Qwen: Qwen3.6 Flashqwen

Qwen3.6 Flash — это быстрая и эффективная языковая модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов. Многоуровневое ценообразование начинается...

ctx 1.0Mвх 17 ₽/Mвых 101 ₽/M

Контекст

Qwen: Qwen3.6 Max Previewqwen

Qwen3.6-Max-Preview — это проприетарная передовая модель от Alibaba Cloud, построенная на архитектуре разреженного ансамбля экспертов с примерно 1 триллионом общих параметров. Она оптимизирована для агентурного кодирования, использования инструментов и...

ctx 262.1Kвх 94 ₽/Mвых 562 ₽/M

Контекст

Qwen: Qwen3.6 Plusqwen

Qwen 3.6 Plus построена на гибридной архитектуре, которая сочетает эффективное линейное внимание с маршрутизацией разреженного ансамбля экспертов, обеспечивая высокую масштабируемость и производительный инференс. По сравнению с серией 3.5, она обеспечивает...

ctx 1.0Mвх 29 ₽/Mвых 176 ₽/M

Контекст

Qwen: Qwen3.7 Maxqwen

Qwen3.7-Max — флагманская модель серии Qwen3.7 от Alibaba. Она поддерживает ввод и вывод текста и предназначена для рабочих нагрузок, ориентированных на агентов, с особыми сильными сторонами в области программирования, офисных и продуктивных задач,...

ctx 1.0Mвх 113 ₽/Mвых 338 ₽/M

Контекст

Qwen: Qwen3.7 Plusqwen

Qwen3.7-Plus — это экономичная модель из серии Qwen3.7 от Alibaba. Она поддерживает ввод текста и изображений с выводом текста, опираясь на текстовые возможности серии с комплексным обновлением ее...

ctx 1.0Mвх 36 ₽/Mвых 144 ₽/M

Контекст

Qwen2.5 72B Instructqwen

Qwen2.5 72B — это последняя серия больших языковых моделей Qwen. Qwen2.5 приносит следующие улучшения по сравнению с Qwen2: — Значительно больше знаний и значительно улучшенные возможности в кодировании и...

ctx 131.1Kвх 32 ₽/Mвых 36 ₽/M

Контекст

Qwen2.5 Coder 32B Instructqwen

Qwen2.5-Coder — это последняя серия специализированных на коде больших языковых моделей Qwen (ранее известных как CodeQwen). Qwen2.5-Coder приносит следующие улучшения по сравнению с CodeQwen1.5: — Значительные улучшения в **генерации кода**, **логическом рассуждении о коде**...

ctx 128.0Kвх 59 ₽/Mвых 90 ₽/M

Контекст

Reka Edgerekaai

Reka Edge — это чрезвычайно эффективная мультимодальная модель зрения-языка с 7 миллиардами параметров, которая принимает входы изображения/видео + текст и генерирует текстовые выходы. Эта модель специально оптимизирована для обеспечения ведущей в отрасли производительности в понимании изображений,...

ctx 16.4Kвх 9 ₽/Mвых 9 ₽/M

Контекст

Reka Flash 3rekaai

Reka Flash 3 — это универсальная, настроенная на инструкции большая языковая модель с 21 миллиардом параметров, разработанная Reka. Она превосходно справляется с общим чатом, задачами кодирования, следованием инструкциям и вызовом функций. Обладая...

ctx 65.5Kвх 9 ₽/Mвых 18 ₽/M

Контекст

Relace: Relace Apply 3relace

Relace Apply 3 — это специализированная LLM для исправления кода, которая объединяет предложенные ИИ правки непосредственно в ваши исходные файлы. Она может применять обновления из GPT-4o, Claude и других в ваши файлы по...

ctx 256.0Kвх 77 ₽/Mвых 113 ₽/M

Контекст

Relace: Relace Searchrelace

Модель relace-search использует 4-12 инструментов `view_file` и `grep` параллельно для исследования кодовой базы и возврата релевантных файлов по запросу пользователя. В отличие от RAG, relace-search выполняет агентурные...

ctx 256.0Kвх 90 ₽/Mвых 270 ₽/M

Контекст

ReMM SLERP 13Bundi95

Пробная реконструкция оригинальной MythoMax-L2-B13 с обновленными моделями. #merge

ctx 6.1Kвх 40 ₽/Mвых 59 ₽/M

Контекст

Sao10K: Llama 3 8B Lunarissao10k

Lunaris 8B — это универсальная модель для общих задач и ролевых игр, основанная на Llama 3. Это стратегическое слияние нескольких моделей, разработанное для баланса между креативностью и улучшенной логикой и общими знаниями....

ctx 8.2Kвх 4 ₽/Mвых 5 ₽/M

Контекст

Sao10K: Llama 3.1 70B Hanami x1sao10k

Это эксперимент [Sao10K](/sao10k) над [Euryale v2.2](/sao10k/l3.1-euryale-70b).

ctx 16.0Kвх 270 ₽/Mвых 270 ₽/M

Контекст

Sao10K: Llama 3.1 Euryale 70B v2.2sao10k

Euryale L3.1 70B v2.2 — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Это преемник [Euryale L3 70B v2.1](/models/sao10k/l3-euryale-70b).

ctx 131.1Kвх 77 ₽/Mвых 77 ₽/M

Контекст

Sao10K: Llama 3.3 Euryale 70Bsao10k

Euryale L3.3 70B — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Это преемник [Euryale L3 70B v2.2](/models/sao10k/l3-euryale-70b).

ctx 131.1Kвх 59 ₽/Mвых 68 ₽/M

Контекст

StepFun: Step 3.5 Flashstepfun

Step 3.5 Flash — самая мощная модель с открытым исходным кодом от StepFun. Построенная на архитектуре разреженного ансамбля экспертов (MoE), она активирует только 11 миллиардов из своих 196 миллиардов параметров на токен....

ctx 262.1Kвх 8 ₽/Mвых 27 ₽/M

Контекст

StepFun: Step 3.7 Flashstepfun

Шаг 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture-of-Experts от StepFun. Она сочетает языковую основу с 196 миллиардами параметров и визуальный энкодер для нативного понимания изображений и видео, активируя примерно 11 миллиардов параметров...

ctx 256.0Kвх 18 ₽/Mвых 103 ₽/M

Контекст

Switchpoint Routerswitchpoint

Маршрутизатор Switchpoint AI мгновенно анализирует ваш запрос и направляет его к оптимальному ИИ из постоянно развивающейся библиотеки. По мере развития мира LLM наш маршрутизатор становится умнее, гарантируя, что вы...

ctx 131.1Kвх 77 ₽/Mвых 306 ₽/M

Контекст

Tencent: Hunyuan A13B Instructtencent

Hunyuan-A13B — это языковая модель ансамбля экспертов (MoE) с 13 миллиардами активных параметров, разработанная Tencent, с общим количеством параметров 80 миллиардов и поддержкой рассуждений через Chain-of-Thought. Она демонстрирует конкурентоспособные результаты на бенчмарках...

ctx 131.1Kвх 13 ₽/Mвых 51 ₽/M

Контекст

Tencent: Hy3 previewtencent

Hy3 preview — это высокоэффективная модель ансамбля экспертов от Tencent, предназначенная для агентурных рабочих процессов и производственного использования. Она поддерживает настраиваемые уровни рассуждений: отключенный, низкий и высокий, позволяя ей...

ctx 262.1Kвх 6 ₽/Mвых 19 ₽/M

Контекст

TheDrummer: Cydonia 24B V4.1thedrummer

Нецензурированная и креативная модель для письма, основанная на Mistral Small 3.2 24B, с хорошей памятью, соблюдением инструкций и интеллектом.

ctx 131.1Kвх 27 ₽/Mвых 45 ₽/M

Контекст

TheDrummer: Rocinante 12Bthedrummer

Rocinante 12B разработан для увлекательного повествования и богатого стиля. Ранние тестировщики сообщили: — Расширенный словарный запас с уникальными и выразительными словами — Улучшенная креативность для ярких повествований —...

ctx 32.8Kвх 15 ₽/Mвых 39 ₽/M

Контекст

TheDrummer: Skyfall 36B V2thedrummer

Skyfall 36B v2 — это улучшенная версия Mistral Small 2501, специально дообученная для улучшения креативности, нюансированного письма, ролевых игр и связного повествования.

ctx 32.8Kвх 50 ₽/Mвых 72 ₽/M

Контекст

TheDrummer: UnslopNemo 12Bthedrummer

UnslopNemo v4.1 — последнее дополнение от создателя Rocinante, разработанное для приключенческого письма и ролевых сценариев.

ctx 32.8Kвх 36 ₽/Mвых 36 ₽/M

Контекст

Upstage: Solar Pro 3upstage

Solar Pro 3 — мощная модель ансамбля экспертов (MoE) от Upstage. Имея 102 миллиарда общих параметров и 12 миллиардов активных параметров на прямой проход, она обеспечивает исключительную производительность при сохранении вычислительной эффективности. Оптимизирована...

ctx 128.0Kвх 14 ₽/Mвых 54 ₽/M

Контекст

Venice: Uncensored (free)cognitivecomputations

Venice Uncensored Dolphin Mistral 24B Venice Edition — это дообученный вариант Mistral-Small-24B-Instruct-2501, разработанный dphn.ai в сотрудничестве с Venice.ai. Эта модель предназначена как «нецензурированная» LLM, настроенная на инструкции, сохраняющая...

ctx 32.8Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

WizardLM-2 8x22Bmicrosoft

WizardLM-2 8x22B — самая продвинутая модель Wizard от Microsoft AI. Она демонстрирует высококонкурентную производительность по сравнению с ведущими проприетарными моделями и последовательно превосходит все существующие передовые модели с открытым исходным кодом. Она...

ctx 65.5Kвх 56 ₽/Mвых 56 ₽/M

Контекст

Writer: Palmyra X5writer

Palmyra X5 — самая продвинутая модель Writer, специально разработанная для создания и масштабирования ИИ-агентов на предприятиях. Она обеспечивает ведущую в отрасли скорость и эффективность на контекстных окнах до 1 миллиона...

ctx 1.0Mвх 54 ₽/Mвых 540 ₽/M

Контекст

xAI: Grok 4.20x-ai

Grok 4.20 — модель рассуждений от xAI с ведущей в отрасли скоростью и возможностями вызова агентурных инструментов. Она сочетает самый низкий уровень галлюцинаций на рынке со строгим соблюдением инструкций, обеспечивая...

ctx 2.0Mвх 113 ₽/Mвых 225 ₽/M

Контекст

xAI: Grok 4.20 Multi-Agentx-ai

Grok 4.20 Multi-Agent — это вариант Grok 4.20 от xAI, разработанный для совместных, основанных на агентах рабочих процессов. Несколько агентов работают параллельно для проведения глубоких исследований, координации использования инструментов и синтеза информации...

ctx 2.0Mвх 180 ₽/Mвых 540 ₽/M

Контекст

xAI: Grok 4.3x-ai

Grok 4.3 — модель рассуждений от xAI. Она принимает текстовые и графические входы с текстовым выводом и подходит для агентурных рабочих процессов, задач следования инструкциям и приложений, требующих высокой фактической...

ctx 1.0Mвх 113 ₽/Mвых 225 ₽/M

Контекст

xAI: Grok Build 0.1x-ai

Grok Build 0.1 — это быстрая модель кодирования от xAI, специально обученная для рабочих процессов разработки агентного программного обеспечения. Она поддерживает ввод текста и изображений с выводом текста и оптимизирована для интерактивного кодирования...

ctx 256.0Kвх 90 ₽/Mвых 180 ₽/M

Контекст

Xiaomi: MiMo-V2-Flashxiaomi

MiMo-V2-Flash — это модель языка с открытым исходным кодом, разработанная Xiaomi. Это модель ансамбля экспертов с 309 миллиардами общих параметров и 15 миллиардами активных параметров, использующая гибридную архитектуру внимания. MiMo-V2-Flash поддерживает...

ctx 262.1Kвх 9 ₽/Mвых 27 ₽/M

Контекст

Xiaomi: MiMo-V2.5xiaomi

MiMo-V2.5 — это нативная омнимодальная модель от Xiaomi. Она обеспечивает производительность уровня Pro при примерно половине стоимости инференса, превосходя MiMo-V2-Omni в мультимодальном восприятии при понимании изображений и видео...

ctx 1.0Mвх 13 ₽/Mвых 25 ₽/M

Контекст

Xiaomi: MiMo-V2.5-Proxiaomi

MiMo-V2.5-Pro — флагманская модель Xiaomi, обеспечивающая высокую производительность в общих агентурных возможностях, сложном программном инжиниринге и задачах с длительным горизонтом, занимая первые места в таких бенчмарках, как ClawEval, GDPVal и SWE-bench Pro....

ctx 1.0Mвх 39 ₽/Mвых 78 ₽/M

Контекст

Z.ai: GLM 4 32B z-ai

GLM 4 32B — это экономичная базовая языковая модель. Она может эффективно выполнять сложные задачи и обладает значительно улучшенными возможностями в использовании инструментов, онлайн-поиске и интеллектуальных задачах, связанных с кодом. Она...

ctx 128.0Kвх 9 ₽/Mвых 9 ₽/M

Контекст

Z.ai: GLM 4.5z-ai

GLM-4.5 — наша последняя флагманская базовая модель, специально разработанная для приложений на основе агентов. Она использует архитектуру ансамбля экспертов (MoE) и поддерживает длину контекста до 128 тыс. токенов. GLM-4.5 обеспечивает значительно...

ctx 131.1Kвх 54 ₽/Mвых 198 ₽/M

Контекст

Z.ai: GLM 4.5 Airz-ai

GLM-4.5-Air — это легкий вариант нашего последнего семейства флагманских моделей, также специально разработанный для приложений, ориентированных на агентов. Как и GLM-4.5, он использует архитектуру ансамбля экспертов (MoE), но с более компактным параметром...

ctx 131.1Kвх 11 ₽/Mвых 77 ₽/M

Контекст

Z.ai: GLM 4.5 Air (free)z-ai

GLM-4.5-Air — это легкий вариант нашего последнего семейства флагманских моделей, также специально разработанный для приложений, ориентированных на агентов. Как и GLM-4.5, он использует архитектуру ансамбля экспертов (MoE), но с более компактным параметром...

ctx 131.1Kвх Бесплатновых Бесплатно

Контекст

Бесплатно

Бесплатно

Z.ai: GLM 4.5Vz-ai

GLM-4.5V — это базовая модель зрения-языка для мультимодальных агентных приложений. Построенная на архитектуре ансамбля экспертов (MoE) с 106 миллиардами параметров и 12 миллиардами активных параметров, она достигает передовых результатов в понимании видео,...

ctx 65.5Kвх 54 ₽/Mвых 162 ₽/M

Контекст

Z.ai: GLM 4.6z-ai

По сравнению с GLM-4.5, это поколение предлагает несколько ключевых улучшений: более длинное контекстное окно: контекстное окно было расширено с 128 тыс. до 200 тыс. токенов, что позволяет модели обрабатывать более сложные...

ctx 202.8Kвх 39 ₽/Mвых 157 ₽/M

Контекст

Z.ai: GLM 4.6Vz-ai

GLM-4.6V — это большая мультимодальная модель, разработанная для высокоточной визуальной интерпретации и рассуждений в длинном контексте на основе изображений, документов и смешанных медиа. Она поддерживает до 128 тыс. токенов, обрабатывает сложные макеты страниц...

ctx 131.1Kвх 27 ₽/Mвых 81 ₽/M

Контекст

Z.ai: GLM 4.7z-ai

GLM-4.7 — новейшая флагманская модель Z.ai, отличающаяся улучшениями в двух ключевых областях: расширенные возможности программирования и более стабильные многошаговые рассуждения/выполнение. Она демонстрирует значительные улучшения в выполнении сложных задач агентов, в то время как...

ctx 202.8Kвх 36 ₽/Mвых 158 ₽/M

Контекст

Z.ai: GLM 4.7 Flashz-ai

Как модель класса 30B SOTA, GLM-4.7-Flash предлагает новый вариант, который обеспечивает баланс между производительностью и эффективностью. Она дополнительно оптимизирована для сценариев использования агентов в кодировании, укрепляя возможности кодирования, планирование долгосрочных задач,...

ctx 202.8Kвх 5 ₽/Mвых 36 ₽/M

Контекст

Z.ai: GLM 5z-ai

GLM-5 — это флагманская модель с открытым исходным кодом от Z.ai, разработанная для проектирования сложных систем и рабочих процессов агентов с длительным горизонтом. Созданная для опытных разработчиков, она обеспечивает производительность производственного уровня при выполнении крупномасштабных задач программирования, конкурируя с ведущими...

ctx 202.8Kвх 54 ₽/Mвых 173 ₽/M

Контекст

Z.ai: GLM 5 Turboz-ai

GLM-5 Turbo — новая модель от Z.ai, разработанная для быстрого вывода и высокой производительности в средах, управляемых агентами, таких как сценарии OpenClaw. Она глубоко оптимизирована для реальных рабочих процессов агентов...

ctx 202.8Kвх 108 ₽/Mвых 360 ₽/M

Контекст

Z.ai: GLM 5.1z-ai

GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, с особенно существенными достижениями в обработке долгосрочных задач. В отличие от предыдущих моделей, построенных на основе поминутных взаимодействий, GLM-5.1 может работать независимо и непрерывно над...

ctx 202.8Kвх 88 ₽/Mвых 277 ₽/M

Контекст

Z.ai: GLM 5V Turboz-ai

GLM-5V-Turbo — первая нативная мультимодальная модель агента от Z.ai, созданная для кодирования на основе визуальных данных и задач, управляемых агентами. Она нативно обрабатывает входные данные изображений, видео и текста, превосходно справляется с долгосрочным планированием, сложным кодированием,...

ctx 202.8Kвх 108 ₽/Mвых 360 ₽/M

Контекст