342+ активных моделей от 60+ провайдеров
331 моделей
Jamba Large 1.7 — новейшая модель в семействе Jamba open, предлагающая улучшения в области привязки к контексту, следования инструкциям и общей эффективности. Построена на гибридной архитектуре SSM-Transformer с контекстом 256K...
Aion-1.0 — это мультимодельная система, разработанная для высокой производительности в различных задачах, включая рассуждения и программирование. Она построена на DeepSeek-R1, дополнена дополнительными моделями и техниками, такими как Tree...
Aion-1.0-Mini — модель с 32 миллиардами параметров, являющаяся дистиллированной версией модели DeepSeek-R1, разработанной для высокой производительности в областях рассуждений, таких как математика, программирование и логика. Это модифицированный вариант...
Aion-2.0 — это вариант DeepSeek V3.2, оптимизированный для иммерсивного ролевого отыгрыша и повествования. Он особенно силен в создании напряжения, кризисов и конфликтов в историях, делая повествования более увлекательными....
Aion-RP-Llama-3.1-8B занимает наивысшее место в части оценки персонажей бенчмарка RPBench-Auto, ролевого варианта Arena-Hard-Auto, где LLM оценивают ответы друг друга. Это дообученная базовая модель...
Olmo 3 32B Think — это крупномасштабная модель с 32 миллиардами параметров, специально разработанная для глубоких рассуждений, сложных логических цепочек и сценариев продвинутого следования инструкциям. Ее возможности обеспечивают высокую производительность в требовательных оценочных задачах и...
Nova 2 Lite — быстрая, экономичная модель для рассуждений, предназначенная для повседневных рабочих нагрузок, которая может обрабатывать текст, изображения и видео для генерации текста. Nova 2 Lite демонстрирует выдающиеся возможности в обработке...
Amazon Nova Lite 1.0 — очень недорогая мультимодальная модель от Amazon, ориентированная на быструю обработку входных данных изображений, видео и текста для генерации текстового вывода. Amazon Nova Lite...
Amazon Nova Micro 1.0 — модель только для текста, которая обеспечивает наименьшую задержку ответов в семействе моделей Amazon Nova при очень низкой стоимости. С длиной контекста...
Amazon Nova Premier — самая мощная из мультимодальных моделей Amazon для сложных задач рассуждений и в качестве лучшего учителя для дистилляции пользовательских моделей.
Amazon Nova Pro 1.0 — это мощная мультимодальная модель от Amazon, ориентированная на обеспечение сочетания точности, скорости и стоимости для широкого спектра задач. По состоянию на декабрь...
Эта модель всегда перенаправляет на последнюю модель в семействе Anthropic Claude Haiku.
Эта модель всегда перенаправляет на последнюю модель в семействе Anthropic Claude Sonnet.
Claude 3 Haiku — самая быстрая и компактная модель Anthropic для практически мгновенной реакции. Быстрая и точная целевая производительность. См. объявление о запуске и результаты бенчмарков [здесь](https://www.anthropic.com/news/claude-3-haiku) #multimodal
Claude 3.5 Haiku предлагает расширенные возможности в области скорости, точности кодирования и использования инструментов. Разработанная для работы в приложениях реального времени, она обеспечивает быстрое время отклика, необходимое для динамичных...
Claude Fable 5 — это модель класса Mythos от Anthropic, разработанная для автономной работы со знаниями и программирования. Она поддерживает ввод текста, изображений и файлов с выводом текста, с поддержкой рассуждений и...
Эта модель всегда перенаправляет на последнюю модель из семейства Claude Fable.
Claude Haiku 4.5 — самая быстрая и эффективная модель Anthropic, обеспечивающая почти передовые возможности при доле стоимости и задержки более крупных моделей Claude. Соответствует производительности Claude Sonnet 4...
Claude Opus 4 — на момент выпуска является лучшей в мире моделью для кодирования, обеспечивая стабильную производительность в сложных, длительных задачах и рабочих процессах агентов. Она устанавливает новые стандарты в...
Claude Opus 4.1 — обновленная версия флагманской модели Anthropic, предлагающая улучшенную производительность в задачах кодирования, рассуждений и агентов. Она достигает 74,5% на SWE-bench Verified и демонстрирует заметные улучшения...
Claude Opus 4.5 — передовая модель Anthropic для рассуждений, оптимизированная для сложной разработки программного обеспечения, рабочих процессов агентов и длительного использования компьютеров. Она предлагает сильные мультимодальные возможности, конкурентоспособную производительность в реальном кодировании и...
Opus 4.6 — самая мощная модель Anthropic для кодирования и длительных профессиональных задач. Она создана для агентов, которые работают в рамках всего рабочего процесса, а не отдельных запросов, что делает ее особенно эффективной...
Вариант Fast-mode [Opus 4.6](/anthropic/claude-opus-4.6) — идентичные возможности с более высокой скоростью вывода по премиальной цене в 6 раз. Узнайте больше в документации Anthropic: https://platform.claude.com/docs/en/build-with-claude/fast-mode
Opus 4.7 — следующее поколение семейства Opus от Anthropic, созданное для длительных асинхронных агентов. Опираясь на сильные стороны Opus 4.6 в кодировании и агентах, она обеспечивает более высокую производительность в...
Вариант Fast-mode модели [Opus 4.7](/anthropic/claude-opus-4.7) - идентичные возможности с более высокой скоростью вывода по премиальной цене в 6 раз. Узнайте больше в документации Anthropic: https://platform.claude.com/docs/en/build-with-claude/fast-mode
Claude Opus 4.8 — самая мощная общедоступная модель Anthropic из семейства Opus. Она поддерживает ввод текста, изображений и файлов с выводом текста, с поддержкой рассуждений и объемом до 1 миллиона токенов...
Вариант Opus 4.8 в быстром режиме — обладает теми же возможностями, но с более высокой скоростью вывода при удвоенной цене по сравнению с обычным Opus 4.8. Подробнее в документации Anthropic: https://platform.claude.com/docs/en/build-with-claude/fast-mode
Эта модель всегда перенаправляет на последнюю модель в семействе Claude Opus.
Claude Sonnet 4 значительно расширяет возможности своего предшественника, Sonnet 3.7, превосходя в задачах кодирования и рассуждений с улучшенной точностью и управляемостью. Достигая передовой производительности на SWE-bench (72,7%),...
Claude Sonnet 4.5 — самая продвинутая модель Sonnet от Anthropic на сегодняшний день, оптимизированная для реальных агентов и рабочих процессов кодирования. Она обеспечивает передовую производительность на бенчмарках кодирования, таких как SWE-bench Verified, с...
Sonnet 4.6 — самая мощная модель класса Sonnet от Anthropic на сегодняшний день, с передовой производительностью в области кодирования, агентов и профессиональной работы. Она превосходно справляется с итеративной разработкой, навигацией по сложным кодовым базам, комплексным управлением проектами с...
Coder‑Large — это потомок Qwen 2.5‑Instruct с 32 миллиардами параметров, который был дополнительно обучен на общедоступных репозиториях GitHub, CodeSearchNet и синтетических корпусах исправления ошибок. Он поддерживает контекстное окно 32k, позволяя работать с несколькими файлами...
Trinity Large Thinking — это мощная модель рассуждений с открытым исходным кодом от команды Arcee AI. Она демонстрирует высокую производительность в PinchBench, агентских нагрузках и задачах рассуждения. Видео запуска: https://youtu.be/Gc82AXLa0Rg?si=4RLn6WBz33qT--B7...
Trinity Mini — это разреженная модель языка с 26 миллиардами параметров (3 миллиарда активных) типа Mixture-of-Experts, содержащая 128 экспертов с 8 активными на токен. Разработана для эффективных рассуждений в длинных контекстах (131k) с надежной функцией...
Virtuoso‑Large — это универсальная LLM высшего уровня от Arcee с 72 миллиардами параметров, настроенная для решения задач междоменных рассуждений, творческого письма и корпоративных QA. В отличие от многих аналогов с 70 миллиардами параметров, она сохраняет 128 k...
ERNIE-4.5-VL-424B-A47B — это мультимодальная модель Mixture-of-Experts (MoE) из серии ERNIE 4.5 от Baidu, содержащая 424 миллиарда общих параметров и 47 миллиардов активных на токен. Она обучена совместно на текстовых и графических данных...
Преобразуйте ваши запросы на естественном языке в структурированные объекты запросов API OpenRouter. Опишите, что вы хотите сделать с моделями ИИ, и Body Builder создаст соответствующие вызовы API. Пример:...
Seed 1.6 — это универсальная модель, выпущенная командой ByteDance Seed. Она включает в себя мультимодальные возможности и адаптивное глубокое мышление с контекстным окном 256K.
Seed 1.6 Flash — это сверхбыстрая мультимодальная модель глубокого мышления от ByteDance Seed, поддерживающая как текстовое, так и визуальное понимание. Она имеет контекстное окно 256k и может генерировать выходные данные...
Seed-2.0-Lite — это универсальный, экономичный корпоративный инструмент, который обеспечивает мощные мультимодальные возможности и возможности агентов, предлагая заметно более низкую задержку, что делает его практичным выбором по умолчанию для большинства производственных рабочих нагрузок по всему миру...
Seed-2.0-mini ориентирован на сценарии с чувствительной к задержке, высокой конкуренцией и стоимостью, уделяя особое внимание быстрому отклику и гибкому развертыванию инференса. Он обеспечивает производительность, сравнимую с ByteDance-Seed-1.6, поддерживает контекст 256k, четыре режима усилий для рассуждений (минимальный/низкий/средний/высокий), мультимодальное понимание,...
UI-TARS-1.5 — это мультимодальный агент зрения-языка, оптимизированный для сред на основе графического интерфейса пользователя, включая настольные интерфейсы, веб-браузеры, мобильные системы и игры. Созданный ByteDance, он основан на фреймворке UI-TARS с использованием обучения с подкреплением...
Command A — это модель с открытыми весами и 111 миллиардами параметров с контекстным окном 256k, ориентированная на обеспечение высокой производительности в сценариях использования агентов, многоязычных и кодирования. По сравнению с другими ведущими проприетарными...
command-r-08-2024 — это обновление [Command R](/models/cohere/command-r) с улучшенной производительностью для многоязычной генерации с дополненной выборкой (RAG) и использования инструментов. В более широком смысле, он лучше справляется с математикой, кодом и рассуждениями, а также...
command-r-plus-08-2024 — это обновление [Command R+](/models/cohere/command-r-plus) с примерно на 50% более высокой пропускной способностью и на 25% более низкими задержками по сравнению с предыдущей версией Command R+, при этом сохраняя аппаратный след...
Command R7B (12-2024) — это небольшое, быстрое обновление модели Command R+, выпущенное в декабре 2024 года. Оно превосходно справляется с RAG, использованием инструментов, агентами и аналогичными задачами, требующими сложного рассуждения...
Cogito v2.1 671B MoE представляет собой одну из самых мощных открытых моделей в мире, сравнимую по производительности с передовыми закрытыми и открытыми моделями. Эта модель обучена с использованием самообучения с подкреплением...
DeepSeek-V3 — это последняя модель от команды DeepSeek, основанная на возможностях следования инструкциям и кодирования предыдущих версий. Предварительно обученная на почти 15 триллионах токенов, заявленные оценки...
DeepSeek V3, модель Mixture-of-Experts с 685 миллиардами параметров, является последней итерацией флагманского семейства чат-моделей от команды DeepSeek. Она является преемником модели [DeepSeek V3](/deepseek/deepseek-chat-v3) и показывает очень хорошие результаты...
DeepSeek-V3.1 — это большая гибридная модель рассуждений (671 миллиард параметров, 37 миллиардов активных), которая поддерживает режимы мышления и немышления с помощью шаблонов подсказок. Она расширяет базу DeepSeek-V3 с помощью двухфазного длинного контекста...
DeepSeek-V3.1 Terminus — это обновление [DeepSeek V3.1](/deepseek/deepseek-chat-v3.1), которое сохраняет исходные возможности модели, устраняя при этом проблемы, о которых сообщали пользователи, включая языковую согласованность и возможности агентов, дополнительно оптимизируя модель...
DeepSeek-V3.2 — это большая языковая модель, разработанная для гармонизации высокой вычислительной эффективности с сильными рассуждениями и производительностью агентов при использовании инструментов. Она представляет DeepSeek Sparse Attention (DSA), механизм разреженного внимания с мелкозернистой структурой...
DeepSeek-V3.2-Exp — это экспериментальная большая языковая модель, выпущенная DeepSeek в качестве промежуточного шага между V3.1 и будущими архитектурами. Она представляет DeepSeek Sparse Attention (DSA), механизм разреженного внимания с мелкозернистой структурой...
DeepSeek V4 Flash — это оптимизированная по эффективности модель Mixture-of-Experts от DeepSeek с 284 миллиардами общих параметров и 13 миллиардами активированных параметров, поддерживающая контекстное окно в 1 миллион токенов. Она разработана для быстрой инференции и...
DeepSeek V4 Pro — это крупномасштабная модель Mixture-of-Experts от DeepSeek с 1,6 триллиона общих параметров и 49 миллиардами активированных параметров, поддерживающая контекстное окно в 1 миллион токенов. Она разработана для продвинутых рассуждений, кодирования,...
DeepSeek R1 здесь: производительность на уровне [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели — 671 миллиард параметров, из которых 37 миллиардов активны при проходе инференции....
Обновление от 28 мая для [оригинального DeepSeek R1](/deepseek/deepseek-r1). Производительность на уровне [OpenAI o1](/openai/o1), но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели — 671 миллиард параметров, из которых 37 миллиардов активны...
DeepSeek R1 Distill Llama 70B — это дистиллированная большая языковая модель на основе [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Модель сочетает передовые методы дистилляции для достижения высокой производительности в различных...
DeepSeek R1 Distill Qwen 32B — это дистиллированная большая языковая модель на основе [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), использующая выходные данные [DeepSeek R1](/deepseek/deepseek-r1). Она превосходит OpenAI's o1-mini по различным бенчмаркам, достигая новых...
Rnj-1 — это семейство плотных моделей с открытыми весами и 8 миллиардами параметров, разработанное Essential AI и обученное с нуля с акцентом на программирование, математику и научные рассуждения. Модель демонстрирует высокую производительность...
Самый простой способ получить бесплатную инференцию. openrouter/free — это маршрутизатор, который случайным образом выбирает бесплатные модели из доступных на OpenRouter. Маршрутизатор разумно фильтрует модели, которые...
Эта модель всегда перенаправляет на последнюю модель в семействе Google Gemini Flash.
Эта модель всегда перенаправляет на последнюю модель в семействе Google Gemini Pro.
Gemini 2.5 Flash — это передовая рабочая модель Google, специально разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она включает встроенные возможности «мышления», позволяющие ей предоставлять ответы с большей...
Gemini 2.5 Flash-Lite — это легкая модель рассуждений из семейства Gemini 2.5, оптимизированная для сверхнизкой задержки и экономической эффективности. Она обеспечивает улучшенную пропускную способность, более быстрое создание токенов и лучшую производительность...
Gemini 2.5 Flash-Lite — это легкая модель рассуждений из семейства Gemini 2.5, оптимизированная для сверхнизкой задержки и экономической эффективности. Она обеспечивает улучшенную пропускную способность, более быстрое создание токенов и лучшую производительность...
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она использует возможности «мышления», позволяющие ей рассуждать над ответами с повышенной точностью...
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она использует возможности «мышления», позволяющие ей рассуждать над ответами с повышенной точностью...
Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для продвинутых рассуждений, кодирования, математики и научных задач. Она использует возможности «мышления», позволяющие ей рассуждать над ответами с повышенной точностью...
Gemini 3 Flash Preview — это высокоскоростная, высокоценная модель мышления, разработанная для агентных рабочих процессов, многооборотного чата и помощи в кодировании. Она обеспечивает рассуждения и использование инструментов почти на уровне Pro...
Gemini 3.1 Flash Lite — это высокоэффективная мультимодальная модель Google с общедоступным выпуском, оптимизированная для низколатентных, высокообъемных рабочих нагрузок. Она поддерживает ввод текста, изображений, видео, аудио и PDF-файлов и предназначена для легких агентных...
Gemini 3.1 Flash Lite Preview — это высокоэффективная модель Google, оптимизированная для сценариев использования с большим объемом. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по всем...
Gemini 3.1 Pro Preview — это передовая модель рассуждений Google, обеспечивающая улучшенную производительность в области разработки программного обеспечения, повышенную надежность агентов и более эффективное использование токенов в сложных рабочих процессах. Основываясь на мультимодальной основе...
Gemini 3.1 Pro Preview Custom Tools — это вариант Gemini 3.1 Pro, который улучшает поведение выбора инструментов, предотвращая чрезмерное использование общего инструмента bash, когда более эффективные сторонние...
Gemini 3.5 Flash — это высокоэффективная мультимодальная модель от Google, обеспечивающая уровень кодирования и рассуждений, близкий к Pro, при стоимости и скорости уровня Flash. Она высоко оптимизирована для навыков кодирования и параллельного выполнения агентами...
Gemma 2 27B от Google — это открытая модель, созданная на основе тех же исследований и технологий, которые используются для создания [моделей Gemini](/models?q=gemini). Модели Gemma хорошо подходят для различных...
Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста и вывод текста. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и чата,...
Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста и вывод текста. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и чата,...
Gemma 3 представляет мультимодальность, поддерживая ввод изображений и текста и вывод текста. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и чата,...
Gemma 3n E4B-it оптимизирована для эффективного выполнения на мобильных устройствах и устройствах с ограниченными ресурсами, таких как телефоны, ноутбуки и планшеты. Она поддерживает мультимодальный ввод, включая текст, визуальные данные и аудио, что позволяет выполнять различные задачи...
Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) с инструктивным тюнингом от Google DeepMind. Несмотря на 25,2 миллиарда общих параметров, только 3,8 миллиарда активируются на токен во время инференции — обеспечивая качество, близкое к 31 миллиарду, при...
Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) с инструктивным тюнингом от Google DeepMind. Несмотря на 25,2 миллиарда общих параметров, только 3,8 миллиарда активируются на токен во время инференции — обеспечивая качество, близкое к 31 миллиарду, при...
Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 миллиардами параметров, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно 256 тысяч токенов, настраиваемый режим мышления/рассуждений, нативные функции...
Gemma 4 31B Instruct — это плотная мультимодальная модель Google DeepMind с 30,7 миллиардами параметров, поддерживающая ввод текста и изображений с выводом текста. Имеет контекстное окно 256 тысяч токенов, настраиваемый режим мышления/рассуждений, нативные функции...
Granite-4.0-H-Micro — модель с 3 миллиардами параметров из семейства моделей Granite 4. Эти модели являются последними в серии моделей, выпущенных IBM. Они дообучены для работы с длинными...
Granite 4.1 8B — плотная языковая модель с 8 миллиардами параметров, только декодер, из семейства Granite 4.1 от IBM. Она поддерживает контекстное окно в 131 тысячу токенов и предназначена для корпоративных задач...
Mercury 2 — чрезвычайно быстрая LLM для рассуждений и первая LLM для диффузии рассуждений (dLLM). Вместо последовательной генерации токенов Mercury 2 производит и уточняет несколько токенов параллельно, достигая...
Ling-2.6-1T — мгновенная (инструктивная) модель от inclusionAI и флагманская модель компании с триллионом параметров, разработанная для реальных агентов, которым требуется быстрая обработка и высокая эффективность в масштабе. Она использует "быстрый...
Ling-2.6-flash — мгновенная (инструктивная) модель от inclusionAI с 104 миллиардами общих параметров и 7,4 миллиардами активных параметров, разработанная для реальных агентов, которым требуются быстрые ответы, надежная обработка и высокая эффективность токенов....
Ring-2.6-1T — модель для рассуждений масштаба 1T параметров с 63 миллиардами активных параметров, созданная для рабочих процессов реальных агентов, требующих как высокой производительности, так и операционной эффективности. Она оптимизирована для кодирующих агентов, инструментов...
Inflection 3 Pi обеспечивает работу чат-бота Inflection [Pi](https://pi.ai), включая предысторию, эмоциональный интеллект, продуктивность и безопасность. Он имеет доступ к последним новостям и преуспевает в сценариях, таких как поддержка клиентов и ролевые игры. Pi...
Inflection 3 Productivity оптимизирована для следования инструкциям. Она лучше подходит для задач, требующих вывода в формате JSON или точного соблюдения предоставленных рекомендаций. Она имеет доступ к последним новостям. Для эмоциональных...
KAT-Coder-Pro V2 — новейшая высокопроизводительная модель в серии KAT-Coder от KwaiKAT, предназначенная для сложной разработки программного обеспечения корпоративного уровня и интеграции SaaS. Она основана на сильных сторонах предыдущих версий в области кодирования с использованием агентов,...
LFM2-24B-A2B — самая большая модель в семействе гибридных архитектур LFM2, разработанная для эффективного развертывания на устройствах. Созданная как модель Mixture-of-Experts с 24 миллиардами параметров и всего 2 миллиардами активных параметров на...
LFM2.5-1.2B-Instruct — компактная, высокопроизводительная модель с инструктивным дообучением, созданная для быстрого ИИ на устройствах. Она обеспечивает высокое качество диалогов при размере в 1,2 миллиарда параметров, с эффективным инференсом на периферии и широкой поддержкой времени выполнения.
LFM2.5-1.2B-Thinking — легкая модель, ориентированная на рассуждения, оптимизированная для задач агентов, извлечения данных и RAG — при этом комфортно работающая на периферийных устройствах. Она поддерживает длинный контекст (до 32 тысяч токенов) и...
Llama Guard 3 — предварительно обученная модель Llama-3.1-8B, дообученная для классификации безопасности контента. Подобно предыдущим версиям, она может использоваться для классификации контента как во входных данных LLM (классификация промптов)...
Это серия моделей, разработанных для воспроизведения качества прозы моделей Claude 3, в частности Sonnet(https://openrouter.ai/anthropic/claude-3.5-sonnet) и Opus(https://openrouter.ai/anthropic/claude-3-opus). Модель дообучена поверх [Qwen2.5 72B](https://openrouter.ai/qwen/qwen-2.5-72b-instruct).
Попытка воссоздать многословность в стиле Claude, но не ожидайте такого же уровня связности или памяти. Предназначена для использования в ролевых играх/нарративных ситуациях.
Последний класс моделей Meta (Llama 3) был выпущен в различных размерах и вариантах. Эта версия с 70 миллиардами параметров, дообученная инструкциями, была оптимизирована для высококачественных диалоговых сценариев. Она продемонстрировала сильные...
Последний класс моделей Meta (Llama 3) был выпущен в различных размерах и вариантах. Эта версия с 8 миллиардами параметров, дообученная инструкциями, была оптимизирована для высококачественных диалоговых сценариев. Она продемонстрировала сильные...
Последний класс моделей Meta (Llama 3.1) был выпущен в различных размерах и вариантах. Эта версия с 70 миллиардами параметров, дообученная инструкциями, оптимизирована для высококачественных диалоговых сценариев. Она продемонстрировала сильные...
Последний класс моделей Meta (Llama 3.1) был выпущен в различных размерах и вариантах. Эта версия с 8 миллиардами параметров быстрая и эффективная. Она продемонстрировала сильную производительность по сравнению с...
Llama 3.2 11B Vision — мультимодальная модель с 11 миллиардами параметров, предназначенная для решения задач, сочетающих визуальные и текстовые данные. Она преуспевает в таких задачах, как создание подписей к изображениям и...
Llama 3.2 1B — языковая модель с 1 миллиардом параметров, ориентированная на эффективное выполнение задач обработки естественного языка, таких как суммаризация, диалог и многоязычный анализ текста. Ее меньший размер позволяет ей работать...
Llama 3.2 3B — многоязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для продвинутых задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработана с использованием новейшей архитектуры трансформера, она...
Llama 3.2 3B — многоязычная большая языковая модель с 3 миллиардами параметров, оптимизированная для продвинутых задач обработки естественного языка, таких как генерация диалогов, рассуждения и суммаризация. Разработана с использованием новейшей архитектуры трансформера, она...
Многоязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и дообученная инструкциями генеративная модель в формате 70B (текст на вход/текст на выход). Модель Llama 3.3 с инструктивным дообучением, только текст...
Многоязычная большая языковая модель (LLM) Meta Llama 3.3 — это предварительно обученная и дообученная инструкциями генеративная модель в формате 70B (текст на вход/текст на выход). Модель Llama 3.3 с инструктивным дообучением, только текст...
Llama 4 Maverick 17B Instruct (128E) — высокопроизводительная мультимодальная языковая модель от Meta, построенная на архитектуре Mixture-of-Experts (MoE) со 128 экспертами и 17 миллиардами активных параметров на прямой проход...
Llama 4 Scout 17B Instruct (16E) — языковая модель Mixture-of-Experts (MoE), разработанная Meta, активирующая 17 миллиардов параметров из общего числа 109 миллиардов. Она поддерживает нативный мультимодальный ввод...
Llama Guard 4 — мультимодальная предварительно обученная модель на основе Llama 4 Scout, дообученная для классификации безопасности контента. Подобно предыдущим версиям, она может использоваться для классификации контента как во входных данных LLM...
[Microsoft Research](/microsoft) Phi-4 разработана для эффективной работы в сложных задачах рассуждения и может работать эффективно в условиях ограниченной памяти или когда требуются быстрые ответы. При 14 миллиардах...
Phi-4-mini-instruct — легкая открытая модель, построенная на синтетических данных и отфильтрованных общедоступных веб-сайтах — с акцентом на высококачественные, плотные по смыслу данные. Модель относится к семейству Phi-4...
MiniMax-M1 — крупномасштабная модель рассуждений с открытым весом, разработанная для расширенного контекста и высокоэффективного инференса. Она использует гибридную архитектуру Mixture-of-Experts (MoE) в сочетании с пользовательским механизмом "молниеносного внимания", позволяющим ей...
MiniMax-M2 — компактная, высокоэффективная большая языковая модель, оптимизированная для сквозного кодирования и рабочих процессов агентов. Имея 10 миллиардов активированных параметров (230 миллиардов всего), она обеспечивает интеллект на грани возможностей в общем рассуждении,...
MiniMax M2-her — большая языковая модель, ориентированная на диалоги, созданная для иммерсивных ролевых игр, чатов с персонажами и выразительных многоходовых разговоров. Разработана для поддержания согласованности тона и личности, поддерживает богатые сообщения...
MiniMax-M2.1 — легкая, передовая большая языковая модель, оптимизированная для кодирования, рабочих процессов агентов и современной разработки приложений. Имея всего 10 миллиардов активированных параметров, она обеспечивает значительный скачок в реальных...
MiniMax-M2.5 — передовая большая языковая модель, разработанная для повышения продуктивности в реальных условиях. Обученная в разнообразных сложных реальных цифровых рабочих средах, M2.5 опирается на опыт кодирования M2.1...
MiniMax-M2.7 — это языковая модель нового поколения, разработанная для автономной продуктивности в реальном мире и непрерывного совершенствования. Созданная для активного участия в собственном развитии, M2.7 интегрирует передовые агентные возможности через мультиагентные...
MiniMax-M3 — это мультимодальная базовая модель от MiniMax. Она поддерживает ввод текста, изображений и видео с выводом текста, имеет контекстное окно размером 1 миллион токенов и подходит для долгосрочной агентной работы, программирования,...
MiniMax-01 объединяет MiniMax-Text-01 для генерации текста и MiniMax-VL-01 для понимания изображений. Он имеет 456 миллиардов параметров, из которых 45,9 миллиарда активируются при каждом выводе, и может обрабатывать контекст...
Это флагманская модель Mistral AI, Mistral Large 2 (версия `mistral-large-2407`). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Анонс запуска читайте [здесь](https://mistral.ai/news/mistral-large-2407/)....
Это флагманская модель Mistral AI, Mistral Large 2 (версия mistral-large-2407). Это проприетарная модель с доступными весами, которая превосходно справляется с рассуждениями, кодом, JSON, чатом и многим другим. Анонс запуска читайте [здесь](https://mistral.ai/news/mistral-large-2407/)....
Передовая языковая модель Mistral для кодирования, выпущенная в конце июля 2025 года. Codestral специализируется на задачах с низкой задержкой и высокой частотой, таких как заполнение середины (FIM), исправление кода и генерация тестов. [Пост в блоге](https://mistral.ai/news/codestral-25-08)
Devstral 2 — это передовая модель с открытым исходным кодом от Mistral AI, специализирующаяся на агентном кодировании. Это плотная трансформерная модель с 123 миллиардами параметров, поддерживающая контекстное окно 256K. Devstral 2 поддерживает исследование...
Самая большая модель в семействе Ministral 3, Ministral 3 14B предлагает передовые возможности и производительность, сравнимую с ее более крупным аналогом Mistral Small 3.2 24B. Мощная и эффективная языковая...
Самая маленькая модель в семействе Ministral 3, Ministral 3 3B — это мощная, эффективная крошечная языковая модель с возможностями визуализации.
Сбалансированная модель в семействе Ministral 3, Ministral 3 8B — это мощная, эффективная крошечная языковая модель с возможностями визуализации.
Mistral Large 3 2512 — самая мощная модель Mistral на сегодняшний день, отличающаяся разреженной архитектурой Mixture-of-Experts с 41 миллиардом активных параметров (675 миллиардов всего) и выпущенная под лицензией Apache 2.0.
Mistral Medium 3 — высокопроизводительная языковая модель корпоративного класса, разработанная для обеспечения передовых возможностей при значительно сниженных операционных затратах. Она сочетает в себе передовые рассуждения и мультимодальную производительность при стоимости в 8 раз ниже...
Mistral Medium 3.1 — обновленная версия Mistral Medium 3, высокопроизводительной языковой модели корпоративного класса, разработанной для обеспечения передовых возможностей при значительно сниженных операционных затратах. Она сочетает в себе...
Mistral Medium 3.5 — плотная модель с 128 миллиардами параметров, следующая инструкциям, от Mistral AI. Она поддерживает ввод текста и изображений с выводом текста и предназначена для агентных рабочих процессов, кодирования и сложных...
Модель с 12 миллиардами параметров и длиной контекста 128k токенов, созданная Mistral в сотрудничестве с NVIDIA. Модель многоязычна, поддерживает английский, французский, немецкий, испанский, итальянский, португальский, китайский, японский,...
Mistral Small 3 — языковая модель с 24 миллиардами параметров, оптимизированная для производительности с низкой задержкой при выполнении распространенных задач ИИ. Выпущенная под лицензией Apache 2.0, она включает в себя как предварительно обученные, так и дообученные версии, разработанные...
Mistral Small 3.1 24B Instruct — обновленный вариант Mistral Small 3 (2501), содержащий 24 миллиарда параметров с расширенными мультимодальными возможностями. Он обеспечивает передовую производительность в текстовых рассуждениях и...
Mistral-Small-3.2-24B-Instruct-2506 — обновленная модель с 24 миллиардами параметров от Mistral, оптимизированная для следования инструкциям, уменьшения повторений и улучшения вызова функций. По сравнению с выпуском 3.1, версия 3.2 значительно повышает точность на...
Mistral Small 4 — следующий крупный выпуск в семействе Mistral Small, объединяющий возможности нескольких флагманских моделей Mistral в единую систему. Он сочетает в себе сильные рассуждения от...
Официальная версия Mixtral 8x22B, дообученная Mistral для следования инструкциям. Она использует 39 миллиардов активных параметров из 141 миллиарда, предлагая непревзойденную экономическую эффективность для своего размера. Ее сильные стороны включают: - сильную математику, кодирование,...
Mistral Saba — языковая модель с 24 миллиардами параметров, специально разработанная для Ближнего Востока и Южной Азии, обеспечивающая точные и контекстуально релевантные ответы при сохранении эффективной производительности. Обучена на отобранных региональных...
Voxtral Small — это улучшение Mistral Small 3, включающее передовые возможности ввода аудио при сохранении лучшей в своем классе текстовой производительности. Он превосходно справляется с транскрипцией речи, переводом и пониманием аудио. Входное аудио...
Эта модель всегда перенаправляет на последнюю модель в семействе MoonshotAI Kimi.
Kimi K2 Instruct — крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с 1 триллионом общих параметров и 32 миллиардами активных на прямой проход. Она оптимизирована для...
Kimi K2 0905 — это сентябрьское обновление [Kimi K2 0711](moonshotai/kimi-k2). Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с 1 триллионом общих параметров и 32...
Kimi K2 Thinking — самая передовая открытая модель рассуждений Moonshot AI на сегодняшний день, расширяющая серию K2 в область агентных рассуждений на дальние горизонты. Построена на архитектуре Mixture-of-Experts (MoE) с триллионом параметров, представленной в...
Kimi K2.5 — нативная мультимодальная модель Moonshot AI, обеспечивающая передовые возможности визуального кодирования и парадигму самонаправляемых роев агентов. Построена на Kimi K2 с продолжением предварительного обучения на примерно 15T смешанных...
Kimi K2.6 — мультимодальная модель Moonshot AI следующего поколения, разработанная для кодирования на дальние горизонты, генерации UI/UX на основе кода и оркестрации мультиагентов. Она обрабатывает сложные сквозные задачи кодирования на Python, Rust и Go, и...
Kimi K2.6 — мультимодальная модель Moonshot AI следующего поколения, разработанная для кодирования на дальние горизонты, генерации UI/UX на основе кода и оркестрации мультиагентов. Она обрабатывает сложные сквозные задачи кодирования на Python, Rust и Go, и...
Самая быстрая модель Morph для применения изменений кода. ~10 500 токенов/сек с 96% точностью для быстрых преобразований кода. Модель требует, чтобы промпт был в следующем формате: <instruction>{instruction}</instruction> <code>{initial_code}</code> <update>{edit_snippet}</update>...
Высокоточная модель Morph для применения сложных изменений кода. ~4 500 токенов/сек с 98% точностью для точных преобразований кода. Модель требует, чтобы промпт был в следующем формате: <instruction>{instruction}</instruction> <code>{initial_code}</code>...
Одна из самых производительных и популярных дообученных версий Llama 2 13B с богатыми описаниями и ролевыми играми. #merge
Nex-N2-Pro — это агентная модель "смесь экспертов" от Nex AGI, имеющая 17 миллиардов активных параметров из 397 миллиардов общих. Построенная на архитектуре Qwen3.5, она принимает текстовые и графические входные данные и генерирует...
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, гораздо лучшую ролевую игру, рассуждения, многооборотные диалоги, согласованность длинного контекста и улучшения по всем...
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с Hermes 2, включая расширенные агентные возможности, гораздо лучшую ролевую игру, рассуждения, многооборотные диалоги, согласованность длинного контекста и улучшения по всем...
Hermes 3 — это универсальная языковая модель со множеством улучшений по сравнению с [Hermes 2](/models/nousresearch/nous-hermes-2-mistral-7b-dpo), включая расширенные агентные возможности, гораздо лучшую ролевую игру, рассуждения, многооборотные диалоги, согласованность длинного контекста и улучшения по всем...
Hermes 4 — это крупномасштабная модель рассуждений, построенная на Meta-Llama-3.1-405B и выпущенная Nous Research. Она представляет гибридный режим рассуждений, в котором модель может выбирать внутреннюю обработку с...
Hermes 4 70B — это гибридная модель рассуждений от Nous Research, построенная на Meta-Llama-3.1-70B. Она представляет тот же гибридный режим, что и более крупный выпуск 405B, позволяя модели либо...
Llama-3.3-Nemotron-Super-49B-v1.5 — это модель рассуждений/чата с 49 миллиардами параметров, ориентированная на английский язык, производная от Meta Llama-3.3-70B-Instruct с контекстом 128K. Она пост-обучена для агентных рабочих процессов (RAG, вызов инструментов) через SFT по математике, коду, науке и...
NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью для разработчиков, создающих специализированные агентные ИИ-системы. Модель полностью...
NVIDIA Nemotron 3 Nano 30B A3B — это небольшая языковая модель MoE с высочайшей вычислительной эффективностью и точностью для разработчиков, создающих специализированные агентные ИИ-системы. Модель полностью...
NVIDIA Nemotron™ 3 Nano Omni — это открытая мультимодальная модель с 30 миллиардами параметров, разработанная как подсистема восприятия и контекста в корпоративных агентских системах. Она принимает текст, изображения, видео и...
NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Построена на гибридной архитектуре Mamba-Transformer...
NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE со 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Построена на гибридной архитектуре Mamba-Transformer...
NVIDIA Nemotron 3 Ultra — это открытая модель для рассуждений на переднем крае и оркестрации от NVIDIA, имеющая 55 миллиардов активных параметров из 550 миллиардов всего (MoE). Построенная на гибридной архитектуре "смесь экспертов" Transformer-Mamba, она...
NVIDIA Nemotron 3 Ultra — это открытая модель для рассуждений на переднем крае и оркестрации от NVIDIA, имеющая 55 миллиардов активных параметров из 550 миллиардов всего (MoE). Построенная на гибридной архитектуре "смесь экспертов" Transformer-Mamba, она...
NVIDIA Nemotron 3.5 Content Safety — это компактная мультимодальная модель защиты от NVIDIA с 4 миллиардами параметров, дообученная на основе Google Gemma-3-4B. Она модерирует как входные данные для LLM и VLM, так и их ответы, принимая...
NVIDIA Nemotron Nano 2 VL — это открытая мультимодальная модель рассуждений с 12 миллиардами параметров, разработанная для понимания видео и анализа документов. Она представляет собой гибридную архитектуру Transformer-Mamba, сочетающую точность уровня Transformer с возможностями Mamba...
NVIDIA-Nemotron-Nano-9B-v2 — это большая языковая модель (LLM), обученная с нуля компанией NVIDIA и разработанная как унифицированная модель как для задач рассуждений, так и для не связанных с рассуждениями задач. Она отвечает на запросы пользователей и...
NVIDIA-Nemotron-Nano-9B-v2 — это большая языковая модель (LLM), обученная с нуля компанией NVIDIA и разработанная как унифицированная модель как для задач рассуждений, так и для не связанных с рассуждениями задач. Она отвечает на запросы пользователей и...
Эта модель всегда перенаправляет на последнюю модель в семействе OpenAI GPT.
Эта модель всегда перенаправляет на последнюю модель в семействе OpenAI GPT Mini.
GPT Chat Latest указывает на стабильный псевдоним API OpenAI `chat-latest`, который всегда разрешается в последнюю модель Instant chat, используемую в ChatGPT. По мере того, как OpenAI выпускает новые обновления модели Instant...
GPT-3.5 Turbo — самая быстрая модель OpenAI. Она может понимать и генерировать естественный язык или код, и оптимизирована для чата и традиционных задач завершения. Данные обучения до сентября 2021 года.
GPT-3.5 Turbo — самая быстрая модель OpenAI. Она может понимать и генерировать естественный язык или код, и оптимизирована для чата и традиционных задач завершения. Данные обучения до сентября 2021 года.
Эта модель предлагает в четыре раза большую длину контекста по сравнению с gpt-3.5-turbo, позволяя обрабатывать примерно 20 страниц текста в одном запросе при более высокой стоимости. Данные обучения: до...
Эта модель является вариантом GPT-3.5 Turbo, настроенным для инструктивных запросов и исключающим оптимизации, связанные с чатом. Данные обучения: до сентября 2021 года.
Флагманская модель OpenAI, GPT-4, представляет собой крупномасштабную мультимодальную языковую модель, способную решать сложные задачи с большей точностью, чем предыдущие модели, благодаря своим более широким общим знаниям и продвинутым рассуждениям...
Последняя модель GPT-4 Turbo с возможностями визуализации. Запросы на визуализацию теперь могут использовать режим JSON и вызов функций. Данные обучения: до декабря 2023 года.
Предварительная версия GPT-4 с улучшенным следованием инструкциям, режимом JSON, воспроизводимыми результатами, параллельным вызовом функций и многим другим. Данные обучения: до декабря 2023 года. **Примечание:** сильно ограничена по скорости OpenAI во время...
GPT-4.1 — это флагманская большая языковая модель, оптимизированная для продвинутого следования инструкциям, реальной разработки программного обеспечения и рассуждений в длинном контексте. Она поддерживает контекстное окно в 1 миллион токенов и превосходит GPT-4o и...
GPT-4.1 Mini — это модель среднего размера, обеспечивающая производительность, конкурентоспособную с GPT-4o, при значительно меньшей задержке и стоимости. Она сохраняет контекстное окно в 1 миллион токенов и набирает 45,1% на сложных...
Для задач, требующих низкой задержки, GPT‑4.1 nano является самой быстрой и дешевой моделью в серии GPT-4.1. Она обеспечивает исключительную производительность при небольшом размере благодаря своему 1 миллиону...
GPT-4o («o» означает «omni») — новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с текстовым выводом. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), будучи в два раза...
GPT-4o («o» означает «omni») — новейшая модель ИИ от OpenAI, поддерживающая ввод текста и изображений с текстовым выводом. Она сохраняет уровень интеллекта [GPT-4 Turbo](/models/openai/gpt-4-turbo), будучи в два раза...
Версия GPT-4o от 2024-08-06 предлагает улучшенную производительность в структурированных выходных данных с возможностью предоставления JSON-схемы в `response_format`. Подробнее читайте [здесь](https://openai.com/index/introducing-structured-outputs-in-the-api/). GPT-4o («o» означает «omni»)...
Версия GPT-4o от 2024-11-20 предлагает улучшенную способность к творческому письму с более естественным, увлекательным и адаптированным письмом для повышения релевантности и читабельности. Она также лучше работает с загруженными...
GPT-4o Search Preview — это специализированная модель для поиска в Интернете в Chat Completions. Она обучена понимать и выполнять поисковые запросы в Интернете.
GPT-4o mini — новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая ввод текста и изображений с текстовым выводом. Будучи самой продвинутой малой моделью, она в несколько раз более доступна...
GPT-4o mini — новейшая модель OpenAI после [GPT-4 Omni](/models/openai/gpt-4o), поддерживающая ввод текста и изображений с текстовым выводом. Будучи самой продвинутой малой моделью, она в несколько раз более доступна...
GPT-4o mini Search Preview — это специализированная модель для поиска в Интернете в Chat Completions. Она обучена понимать и выполнять поисковые запросы в Интернете.
GPT-5 — самая продвинутая модель OpenAI, предлагающая значительные улучшения в рассуждениях, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошаговых рассуждений, следования инструкциям и точности...
GPT-5 Chat разработан для продвинутых, естественных, мультимодальных и контекстно-зависимых диалогов для корпоративных приложений.
GPT-5-Codex — это специализированная версия GPT-5, оптимизированная для рабочих процессов разработки программного обеспечения и кодирования. Она предназначена как для интерактивных сеансов разработки, так и для длительного, независимого выполнения сложных инженерных задач....
GPT-5 Mini — это компактная версия GPT-5, разработанная для выполнения более простых задач рассуждений. Она обеспечивает те же преимущества в следовании инструкциям и настройке безопасности, что и GPT-5, но с уменьшенной задержкой и стоимостью....
GPT-5-Nano — самый маленький и быстрый вариант в системе GPT-5, оптимизированный для инструментов разработчика, быстрых взаимодействий и сред с ультранизкой задержкой. Несмотря на ограниченную глубину рассуждений по сравнению с более крупными...
GPT-5 Pro — самая продвинутая модель OpenAI, предлагающая значительные улучшения в рассуждениях, качестве кода и пользовательском опыте. Она оптимизирована для сложных задач, требующих пошаговых рассуждений, следования инструкциям и...
GPT-5.1 — это новейшая модель передового уровня в серии GPT-5, предлагающая более сильные общие рассуждения, улучшенное соблюдение инструкций и более естественный разговорный стиль по сравнению с GPT-5. Она использует адаптивные рассуждения...
GPT-5.1 Chat (также известный как Instant) — это быстрый, легкий член семейства 5.1, оптимизированный для чата с низкой задержкой при сохранении сильного общего интеллекта. Он использует адаптивные рассуждения для выборочного «мышления»...
GPT-5.1-Codex — это специализированная версия GPT-5.1, оптимизированная для рабочих процессов разработки программного обеспечения и кодирования. Она предназначена как для интерактивных сессий разработки, так и для длительного независимого выполнения сложных инженерных задач....
GPT-5.1-Codex-Max — новейшая агентная модель кодирования от OpenAI, разработанная для длительных задач разработки программного обеспечения с высоким контекстом. Она основана на обновленной версии стека рассуждений 5.1 и обучена на агентных...
GPT-5.1-Codex-Mini — это меньшая и более быстрая версия GPT-5.1-Codex
GPT-5.2 — новейшая модель передового уровня в серии GPT-5, предлагающая более сильные агентные возможности и производительность в длинном контексте по сравнению с GPT-5.1. Она использует адаптивное рассуждение для динамического распределения вычислений, быстро реагируя...
GPT-5.2 Chat (также известная как Instant) — это быстрый, легкий член семейства 5.2, оптимизированный для чата с низкой задержкой, сохраняя при этом сильный общий интеллект. Она использует адаптивное рассуждение для выборочного «мышления» над...
GPT-5.2 Pro — самая передовая модель OpenAI, предлагающая значительные улучшения в агентном кодировании и производительности в длинном контексте по сравнению с GPT-5 Pro. Она оптимизирована для сложных задач, требующих пошагового рассуждения,...
GPT-5.2-Codex — это обновленная версия GPT-5.1-Codex, оптимизированная для рабочих процессов разработки программного обеспечения и кодирования. Она предназначена как для интерактивных сессий разработки, так и для длительного независимого выполнения сложных инженерных задач....
GPT-5.3 Chat — это обновление наиболее используемой модели ChatGPT, которое делает повседневные разговоры более плавными, полезными и непосредственно помогающими. Она предоставляет более точные ответы с лучшей контекстуализацией и значительно...
GPT-5.3-Codex — самая передовая агентная модель кодирования от OpenAI, сочетающая в себе передовую производительность в области разработки программного обеспечения GPT-5.2-Codex с более широкими возможностями рассуждений и профессиональными знаниями GPT-5.2. Она достигает передовых результатов...
GPT-5.4 — новейшая модель передового уровня от OpenAI, объединяющая линейки Codex и GPT в единую систему. Она имеет контекстное окно более 1 миллиона токенов (922 тыс. входных, 128 тыс. выходных) с поддержкой...
GPT-5.4 mini предоставляет основные возможности GPT-5.4 в более быстрой и эффективной модели, оптимизированной для рабочих нагрузок с высокой пропускной способностью. Она поддерживает ввод текста и изображений с высокой производительностью в области рассуждений, кодирования,...
GPT-5.4 nano — самый легкий и экономичный вариант семейства GPT-5.4, оптимизированный для задач, критичных к скорости и высокообъемных задач. Она поддерживает ввод текста и изображений и предназначена для низкой задержки...
GPT-5.4 Pro — самая передовая модель OpenAI, построенная на унифицированной архитектуре GPT-5.4 с улучшенными возможностями рассуждений для сложных, ответственных задач. Она имеет контекстное окно более 1 миллиона токенов (922 тыс. входных, 128 тыс....
GPT-5.5 — модель передового уровня от OpenAI, разработанная для сложных профессиональных рабочих нагрузок, построенная на GPT-5.4 с более сильными рассуждениями, более высокой надежностью и улучшенной эффективностью токенов на сложных задачах. Она имеет более 1 миллиона токенов...
GPT-5.5 Pro — модель OpenAI с высокой производительностью, оптимизированная для глубоких рассуждений и точности на сложных, ответственных рабочих нагрузках. Она имеет контекстное окно более 1 миллиона токенов (922 тыс. входных, 128 тыс. выходных) с поддержкой...
gpt-oss-120b — это языковая модель Mixture-of-Experts (MoE) с открытым весом и 117 миллиардами параметров от OpenAI, разработанная для высокопроизводительных, агентных и общецелевых производственных сценариев использования. Она активирует 5,1 миллиарда параметров за прямой проход и оптимизирована...
gpt-oss-120b — это языковая модель Mixture-of-Experts (MoE) с открытым весом и 117 миллиардами параметров от OpenAI, разработанная для высокопроизводительных, агентных и общецелевых производственных сценариев использования. Она активирует 5,1 миллиарда параметров за прямой проход и оптимизирована...
gpt-oss-20b — это модель с открытым весом и 21 миллиардом параметров, выпущенная OpenAI под лицензией Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров за прямой проход, оптимизированную для...
gpt-oss-20b — это модель с открытым весом и 21 миллиардом параметров, выпущенная OpenAI под лицензией Apache 2.0. Она использует архитектуру Mixture-of-Experts (MoE) с 3,6 миллиарда активных параметров за прямой проход, оптимизированную для...
gpt-oss-safeguard-20b — это модель рассуждений по безопасности от OpenAI, построенная на основе gpt-oss-20b. Эта модель Mixture-of-Experts (MoE) с открытым весом и 21 миллиардом параметров обеспечивает более низкую задержку для задач безопасности, таких как классификация контента, фильтрация LLM и доверие...
Новейшее и самое мощное семейство моделей от OpenAI, o1, разработано для того, чтобы тратить больше времени на размышления перед ответом. Серия моделей o1 обучена с использованием крупномасштабного обучения с подкреплением для рассуждений...
Модели серии o1 обучены с использованием обучения с подкреплением для размышлений перед ответом и выполнения сложных рассуждений. Модель o1-pro использует больше вычислительных ресурсов для более глубоких размышлений и предоставления...
o3 — это хорошо сбалансированная и мощная модель во всех доменах. Она устанавливает новый стандарт для задач по математике, науке, кодированию и визуальным рассуждениям. Она также превосходно справляется с техническим письмом и следованием инструкциям....
o3-deep-research — это передовая модель OpenAI для глубоких исследований, разработанная для решения сложных многошаговых исследовательских задач. Примечание: Эта модель всегда использует инструмент 'web_search', который добавляет дополнительные расходы.
OpenAI o3-mini — это экономичная языковая модель, оптимизированная для задач STEM-рассуждений, особенно преуспевающая в науке, математике и кодировании. Эта модель поддерживает параметр `reasoning_effort`, который может быть установлен на...
OpenAI o3-mini-high — это та же модель, что и [o3-mini](/openai/o3-mini), с установленным `reasoning_effort` на высокое значение. o3-mini — это экономичная языковая модель, оптимизированная для задач STEM-рассуждений, особенно преуспевающая в науке, математике и...
Модели серии o обучены с использованием обучения с подкреплением для размышлений перед ответом и выполнения сложных рассуждений. Модель o3-pro использует больше вычислительных ресурсов для более глубоких размышлений и последовательного предоставления...
OpenAI o4-mini — это компактная модель рассуждений из серии o, оптимизированная для быстрой и экономичной работы при сохранении сильных мультимодальных и агентных возможностей. Она поддерживает использование инструментов и демонстрирует конкурентоспособные рассуждения...
o4-mini-deep-research — это более быстрая и доступная модель глубоких исследований от OpenAI — идеальна для решения сложных многошаговых исследовательских задач. Примечание: Эта модель всегда использует инструмент 'web_search', который добавляет дополнительные расходы.
OpenAI o4-mini-high — это та же модель, что и [o4-mini](/openai/o4-mini), с установленным `reasoning_effort` на высокое значение. OpenAI o4-mini — это компактная модель рассуждений из серии o, оптимизированная для быстрой и экономичной работы при сохранении...
Fusion превращает ваш запрос в небольшое многомодельное обсуждение. Группа экспертных моделей (см. ниже) параллельно анализирует ваш запрос с включенным поиском в Интернете и извлечением данных из Интернета, затем...
Owl Alpha — это высокопроизводительная базовая модель, разработанная для агентных рабочих нагрузок. Нативно поддерживает использование инструментов и задачи с длинным контекстом, с высокой производительностью в генерации кода, автоматизированных рабочих процессах и выполнении сложных инструкций....
Маршрутизатор Pareto поддерживает многоуровневый список сильных моделей кодирования, ранжированных по [Artificial Analysis](https://artificialanalysis.ai/) процентным показателям кодирования. Установите min_coding_score от 0 до 1 в [плагине pareto-router](https://openrouter.ai/docs/guides/routing/routers/pareto-router#the-min_coding_score-parameter) для управления тем, как...
Perceptron Mk1 (Mark One) — это самая высококачественная модель видения и языка от Perceptron для видео и воплощенного рассуждения. Она принимает на вход изображения и видео в сочетании с запросами на естественном языке и обеспечивает детальное визуальное понимание...
Sonar — легкий, доступный, быстрый и простой в использовании — теперь с цитатами и возможностью настройки источников. Он предназначен для компаний, стремящихся интегрировать легкие функции вопросов и ответов...
Sonar Deep Research — модель, ориентированная на исследования, предназначенная для многошагового поиска, синтеза и рассуждений по сложным темам. Она автономно ищет, читает и оценивает источники, уточняя свой подход по мере сбора...
Примечание: Ценообразование Sonar Pro включает в себя ценообразование поиска Perplexity. См. [подробности здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro) Для предприятий, ищущих более продвинутые возможности, API Sonar Pro может обрабатывать углубленные многошаговые запросы с дополнительной расширяемостью, такой как...
Эксклюзивно доступный через API OpenRouter, новый режим Pro Search в Sonar Pro — это самая передовая агентная система поиска Perplexity. Он разработан для более глубоких рассуждений и анализа. Ценообразование основано на...
Примечание: Ценообразование Sonar Pro включает в себя ценообразование поиска Perplexity. См. [подробности здесь](https://docs.perplexity.ai/guides/pricing#detailed-pricing-breakdown-for-sonar-reasoning-pro-and-sonar-pro) Sonar Reasoning Pro — это первоклассная модель рассуждений, основанная на DeepSeek R1 с Chain of Thought (CoT). Разработана для...
Laguna M.1 — флагманская модель кодирования от [Poolside](https://poolside.ai), оптимизированная для сложных задач разработки программного обеспечения. Разработана для агентных рабочих процессов кодирования, поддерживает вызов инструментов и рассуждения, с контекстом 128K...
Laguna XS.2 — модель второго поколения в классе XS от [Poolside](https://poolside.ai), их серии эффективных кодирующих агентов. Она сочетает в себе возможности вызова инструментов и рассуждений с компактным размером, предлагая...
INTELLECT-3 — это модель Mixture-of-Experts с 106 миллиардами параметров (12 миллиардов активных), дообученная на основе GLM-4.5-Air-Base с использованием контролируемого дообучения (SFT), за которым следует масштабное обучение с подкреплением (RL). Она демонстрирует передовую производительность для своего размера в области математики,...
Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом 1 миллион, обеспечивающую сбалансированное сочетание производительности, скорости и стоимости.
Qwen Plus 0728, основанная на базовой модели Qwen3, представляет собой гибридную модель рассуждений с контекстом 1 миллион, обеспечивающую сбалансированное сочетание производительности, скорости и стоимости.
Qwen-Plus, основанная на базовой модели Qwen2.5, представляет собой модель с контекстом 131K, обеспечивающую сбалансированное сочетание производительности, скорости и стоимости.
Qwen2.5 7B — это новейшая серия больших языковых моделей Qwen. Qwen2.5 предлагает следующие улучшения по сравнению с Qwen2: — Значительно больше знаний и значительно улучшенные возможности в области программирования и...
Qwen2.5-VL отлично распознает распространенные объекты, такие как цветы, птицы, рыбы и насекомые. Она также обладает высокой способностью анализировать тексты, диаграммы, значки, графику и макеты в изображениях.
Qwen3-14B — это плотная каузальная языковая модель с 14,8 миллиардами параметров из серии Qwen3, разработанная как для сложного рассуждения, так и для эффективного диалога. Она поддерживает бесшовное переключение между режимом «мышления» для...
Qwen3-235B-A22B — это модель mixture-of-experts (MoE) с 235 миллиардами параметров, разработанная Qwen, активирующая 22 миллиарда параметров при каждом прямом проходе. Она поддерживает бесшовное переключение между режимом «мышления» для сложного рассуждения, математики и...
Qwen3-235B-A22B-Instruct-2507 — это многоязычная модель языка mixture-of-experts, настроенная на инструкции, основанная на архитектуре Qwen3-235B, с 22 миллиардами активных параметров при каждом прямом проходе. Она оптимизирована для общего текстового создания, включая следование инструкциям,...
Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная модель языка Mixture-of-Experts (MoE) с открытыми весами, оптимизированная для задач сложного рассуждения. Она активирует 22 миллиарда из своих 235 миллиардов параметров при каждом прямом проходе и изначально поддерживает до 262 144...
Qwen3, последнее поколение серии больших языковых моделей Qwen, включает как плотные, так и mixture-of-experts (MoE) архитектуры для превосходства в рассуждениях, многоязычной поддержке и продвинутых задачах агентов. Ее уникальная...
Qwen3-30B-A3B-Instruct-2507 — это модель языка mixture-of-experts с 30,5 миллиардами параметров от Qwen, с 3,3 миллиардами активных параметров при каждом выводе. Она работает в режиме без «мышления» и предназначена для высококачественного следования инструкциям, многоязычного понимания и...
Qwen3-30B-A3B-Thinking-2507 — это модель рассуждений Mixture-of-Experts с 30 миллиардами параметров, оптимизированная для сложных задач, требующих расширенного многошагового мышления. Модель специально разработана для «режима мышления», где внутренние следы рассуждений разделены...
Qwen3-32B — это плотная каузальная языковая модель с 32,8 миллиардами параметров из серии Qwen3, оптимизированная как для сложного рассуждения, так и для эффективного диалога. Она поддерживает бесшовное переключение между режимом «мышления» для...
Qwen3-8B — это плотная каузальная языковая модель с 8,2 миллиардами параметров из серии Qwen3, разработанная как для задач, требующих интенсивных рассуждений, так и для эффективного диалога. Она поддерживает бесшовное переключение между режимом «мышления» для математики,...
Qwen3-Coder-30B-A3B-Instruct — это модель Mixture-of-Experts (MoE) с 30,5 миллиардами параметров и 128 экспертами (8 активных при каждом прямом проходе), разработанная для продвинутого создания кода, понимания репозиториев в масштабе и использования инструментов агентами. Создана на основе...
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для задач кодирования агентами, таких как вызов функций, использование инструментов и рассуждение в длинном контексте по...
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для задач кодирования агентами, таких как вызов функций, использование инструментов и рассуждение в длинном контексте по...
Qwen3 Coder Flash — это быстрая и экономичная версия собственной разработки Alibaba модели Qwen3 Coder Plus. Это мощная модель агента для кодирования, специализирующаяся на автономном программировании посредством вызова инструментов...
Qwen3-Coder-Next — это каузальная языковая модель с открытыми весами, оптимизированная для агентов кодирования и локальных рабочих процессов разработки. Она использует разреженную конструкцию MoE с 80 миллиардами общих параметров и только 3 миллиардами активированных за...
Qwen3 Coder Plus — это собственная версия Alibaba открытой модели Qwen3 Coder 480B A35B. Это мощная модель агента для кодирования, специализирующаяся на автономном программировании посредством вызова инструментов и...
Qwen3-Max — это обновленная версия, основанная на серии Qwen3, предлагающая значительные улучшения в рассуждениях, следовании инструкциям, многоязычной поддержке и охвате редких знаний по сравнению с версией от января 2025 года. Она...
Qwen3-Max-Thinking — это флагманская модель рассуждений в серии Qwen3, разработанная для ответственных когнитивных задач, требующих глубоких, многошаговых рассуждений. За счет значительного масштабирования мощности модели и вычислительных ресурсов для обучения с подкреплением, она...
Qwen3-Next-80B-A3B-Instruct — это настроенная на инструкции чат-модель из серии Qwen3-Next, оптимизированная для быстрых, стабильных ответов без следов «мышления». Она нацелена на сложные задачи в области рассуждений, генерации кода, ответов на вопросы по знаниям и многоязычных...
Qwen3-Next-80B-A3B-Instruct — это настроенная на инструкции чат-модель из серии Qwen3-Next, оптимизированная для быстрых, стабильных ответов без следов «мышления». Она нацелена на сложные задачи в области рассуждений, генерации кода, ответов на вопросы по знаниям и многоязычных...
Qwen3-Next-80B-A3B-Thinking — это чат-модель из линейки Qwen3-Next, ориентированная на рассуждения, которая по умолчанию выводит структурированные следы «мышления». Она предназначена для сложных многошаговых задач; математических доказательств, синтеза/отладки кода, логики и агентов...
Qwen3-VL-235B-A22B Instruct — это открытая мультимодальная модель, объединяющая мощное создание текста с визуальным пониманием изображений и видео. Модель Instruct нацелена на общее использование в области зрения и языка (VQA, разбор документов, диаграммы/таблицы...
Qwen3-VL-235B-A22B Thinking — это мультимодальная модель, объединяющая мощное создание текста с визуальным пониманием изображений и видео. Модель Thinking оптимизирована для мультимодальных рассуждений в STEM и математике....
Qwen3-VL-30B-A3B-Instruct — это мультимодальная модель, объединяющая мощное создание текста с визуальным пониманием изображений и видео. Ее вариант Instruct оптимизирует следование инструкциям для общих мультимодальных задач. Она превосходно справляется с восприятием...
Qwen3-VL-30B-A3B-Thinking — это мультимодальная модель, объединяющая мощное создание текста с визуальным пониманием изображений и видео. Ее вариант Thinking улучшает рассуждения в STEM, математике и сложных задачах. Она превосходно...
Qwen3-VL-32B-Instruct — это крупномасштабная мультимодальная модель зрения-язык, разработанная для высокоточного понимания и рассуждения в тексте, изображениях и видео. Обладая 32 миллиардами параметров, она сочетает глубокое визуальное восприятие с продвинутым текстом...
Qwen3-VL-8B-Instruct — это мультимодальная модель зрения-язык из серии Qwen3-VL, созданная для высококачественного понимания и рассуждения в тексте, изображениях и видео. Она отличается улучшенным мультимодальным слиянием с Interleaved-MRoPE для длительного горизонта...
Qwen3-VL-8B-Thinking — это вариант мультимодальной модели Qwen3-VL-8B, оптимизированный для рассуждений, предназначенный для продвинутых визуальных и текстовых рассуждений в сложных сценах, документах и временных последовательностях. Он интегрирует улучшенное мультимодальное согласование и...
Нативная модель зрения-язык серии Qwen3.5 397B-A17B построена на гибридной архитектуре, которая интегрирует механизм линейного внимания с разреженной моделью mixture-of-experts, достигая более высокой эффективности вывода. Она обеспечивает...
Нативные модели зрения-язык серии Qwen3.5 Plus построены на гибридной архитектуре, которая интегрирует механизмы линейного внимания с разреженными моделями mixture-of-experts, достигая более высокой эффективности вывода. В различных...
Qwen3.5 Plus (апрель 2026) — это крупномасштабная мультимодальная языковая модель от Alibaba. Она принимает ввод текста, изображений и видео и выдает текстовый вывод, с окном контекста 1 миллион токенов. Это...
Нативная модель зрения-язык Qwen3.5 122B-A10B построена на гибридной архитектуре, которая интегрирует механизм линейного внимания с разреженной моделью mixture-of-experts, достигая более высокой эффективности вывода. С точки зрения...
Нативная модель зрения-язык Qwen3.5 27B включает механизм линейного внимания, обеспечивая быстрое время отклика при балансировке скорости вывода и производительности. Ее общие возможности сопоставимы с возможностями...
Серия Qwen3.5 35B-A3B — это нативная модель зрения-язык, разработанная с гибридной архитектурой, которая интегрирует механизмы линейного внимания и разреженную модель mixture-of-experts, достигая более высокой эффективности вывода. Ее общие...
Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, разработанная для обеспечения сильных рассуждений, кодирования и визуального понимания в эффективной архитектуре с 9 миллиардами параметров. Она использует унифицированный дизайн зрения-язык...
Нативные модели Qwen3.5 vision-language Flash построены на гибридной архитектуре, которая интегрирует механизм линейного внимания с моделью разреженного ансамбля экспертов (sparse mixture-of-experts), достигая более высокой эффективности инференса. По сравнению с...
Qwen3.6 27B — это плотная языковая модель с 27 миллиардами параметров от команды Qwen Team из Alibaba, выпущенная в апреле 2026 года. Она обладает гибридными мультимодальными возможностями — принимает текстовые, графические и видеовходы...
Qwen3.6-35B-A3B — это открытая мультимодальная модель от Alibaba Cloud с 35 миллиардами общих параметров и 3 миллиардами активных параметров на токен. Она использует гибридную архитектуру разреженного ансамбля экспертов, сочетающую Gated...
Qwen3.6 Flash — это быстрая и эффективная языковая модель из серии Qwen 3.6 от Alibaba. Она поддерживает ввод текста, изображений и видео с контекстным окном в 1 миллион токенов. Многоуровневое ценообразование начинается...
Qwen3.6-Max-Preview — это проприетарная передовая модель от Alibaba Cloud, построенная на архитектуре разреженного ансамбля экспертов с примерно 1 триллионом общих параметров. Она оптимизирована для агентурного кодирования, использования инструментов и...
Qwen 3.6 Plus построена на гибридной архитектуре, которая сочетает эффективное линейное внимание с маршрутизацией разреженного ансамбля экспертов, обеспечивая высокую масштабируемость и производительный инференс. По сравнению с серией 3.5, она обеспечивает...
Qwen3.7-Max — флагманская модель серии Qwen3.7 от Alibaba. Она поддерживает ввод и вывод текста и предназначена для рабочих нагрузок, ориентированных на агентов, с особыми сильными сторонами в области программирования, офисных и продуктивных задач,...
Qwen3.7-Plus — это экономичная модель из серии Qwen3.7 от Alibaba. Она поддерживает ввод текста и изображений с выводом текста, опираясь на текстовые возможности серии с комплексным обновлением ее...
Qwen2.5 72B — это последняя серия больших языковых моделей Qwen. Qwen2.5 приносит следующие улучшения по сравнению с Qwen2: — Значительно больше знаний и значительно улучшенные возможности в кодировании и...
Qwen2.5-Coder — это последняя серия специализированных на коде больших языковых моделей Qwen (ранее известных как CodeQwen). Qwen2.5-Coder приносит следующие улучшения по сравнению с CodeQwen1.5: — Значительные улучшения в **генерации кода**, **логическом рассуждении о коде**...
Reka Edge — это чрезвычайно эффективная мультимодальная модель зрения-языка с 7 миллиардами параметров, которая принимает входы изображения/видео + текст и генерирует текстовые выходы. Эта модель специально оптимизирована для обеспечения ведущей в отрасли производительности в понимании изображений,...
Reka Flash 3 — это универсальная, настроенная на инструкции большая языковая модель с 21 миллиардом параметров, разработанная Reka. Она превосходно справляется с общим чатом, задачами кодирования, следованием инструкциям и вызовом функций. Обладая...
Relace Apply 3 — это специализированная LLM для исправления кода, которая объединяет предложенные ИИ правки непосредственно в ваши исходные файлы. Она может применять обновления из GPT-4o, Claude и других в ваши файлы по...
Модель relace-search использует 4-12 инструментов `view_file` и `grep` параллельно для исследования кодовой базы и возврата релевантных файлов по запросу пользователя. В отличие от RAG, relace-search выполняет агентурные...
Пробная реконструкция оригинальной MythoMax-L2-B13 с обновленными моделями. #merge
Lunaris 8B — это универсальная модель для общих задач и ролевых игр, основанная на Llama 3. Это стратегическое слияние нескольких моделей, разработанное для баланса между креативностью и улучшенной логикой и общими знаниями....
Это эксперимент [Sao10K](/sao10k) над [Euryale v2.2](/sao10k/l3.1-euryale-70b).
Euryale L3.1 70B v2.2 — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Это преемник [Euryale L3 70B v2.1](/models/sao10k/l3-euryale-70b).
Euryale L3.3 70B — это модель, ориентированная на творческие ролевые игры от [Sao10k](https://ko-fi.com/sao10k). Это преемник [Euryale L3 70B v2.2](/models/sao10k/l3-euryale-70b).
Step 3.5 Flash — самая мощная модель с открытым исходным кодом от StepFun. Построенная на архитектуре разреженного ансамбля экспертов (MoE), она активирует только 11 миллиардов из своих 196 миллиардов параметров на токен....
Шаг 3.7 Flash — это новейшая высокоэффективная мультимодальная модель Mixture-of-Experts от StepFun. Она сочетает языковую основу с 196 миллиардами параметров и визуальный энкодер для нативного понимания изображений и видео, активируя примерно 11 миллиардов параметров...
Маршрутизатор Switchpoint AI мгновенно анализирует ваш запрос и направляет его к оптимальному ИИ из постоянно развивающейся библиотеки. По мере развития мира LLM наш маршрутизатор становится умнее, гарантируя, что вы...
Hunyuan-A13B — это языковая модель ансамбля экспертов (MoE) с 13 миллиардами активных параметров, разработанная Tencent, с общим количеством параметров 80 миллиардов и поддержкой рассуждений через Chain-of-Thought. Она демонстрирует конкурентоспособные результаты на бенчмарках...
Hy3 preview — это высокоэффективная модель ансамбля экспертов от Tencent, предназначенная для агентурных рабочих процессов и производственного использования. Она поддерживает настраиваемые уровни рассуждений: отключенный, низкий и высокий, позволяя ей...
Нецензурированная и креативная модель для письма, основанная на Mistral Small 3.2 24B, с хорошей памятью, соблюдением инструкций и интеллектом.
Rocinante 12B разработан для увлекательного повествования и богатого стиля. Ранние тестировщики сообщили: — Расширенный словарный запас с уникальными и выразительными словами — Улучшенная креативность для ярких повествований —...
Skyfall 36B v2 — это улучшенная версия Mistral Small 2501, специально дообученная для улучшения креативности, нюансированного письма, ролевых игр и связного повествования.
UnslopNemo v4.1 — последнее дополнение от создателя Rocinante, разработанное для приключенческого письма и ролевых сценариев.
Solar Pro 3 — мощная модель ансамбля экспертов (MoE) от Upstage. Имея 102 миллиарда общих параметров и 12 миллиардов активных параметров на прямой проход, она обеспечивает исключительную производительность при сохранении вычислительной эффективности. Оптимизирована...
Venice Uncensored Dolphin Mistral 24B Venice Edition — это дообученный вариант Mistral-Small-24B-Instruct-2501, разработанный dphn.ai в сотрудничестве с Venice.ai. Эта модель предназначена как «нецензурированная» LLM, настроенная на инструкции, сохраняющая...
WizardLM-2 8x22B — самая продвинутая модель Wizard от Microsoft AI. Она демонстрирует высококонкурентную производительность по сравнению с ведущими проприетарными моделями и последовательно превосходит все существующие передовые модели с открытым исходным кодом. Она...
Palmyra X5 — самая продвинутая модель Writer, специально разработанная для создания и масштабирования ИИ-агентов на предприятиях. Она обеспечивает ведущую в отрасли скорость и эффективность на контекстных окнах до 1 миллиона...
Grok 4.20 — модель рассуждений от xAI с ведущей в отрасли скоростью и возможностями вызова агентурных инструментов. Она сочетает самый низкий уровень галлюцинаций на рынке со строгим соблюдением инструкций, обеспечивая...
Grok 4.20 Multi-Agent — это вариант Grok 4.20 от xAI, разработанный для совместных, основанных на агентах рабочих процессов. Несколько агентов работают параллельно для проведения глубоких исследований, координации использования инструментов и синтеза информации...
Grok 4.3 — модель рассуждений от xAI. Она принимает текстовые и графические входы с текстовым выводом и подходит для агентурных рабочих процессов, задач следования инструкциям и приложений, требующих высокой фактической...
Grok Build 0.1 — это быстрая модель кодирования от xAI, специально обученная для рабочих процессов разработки агентного программного обеспечения. Она поддерживает ввод текста и изображений с выводом текста и оптимизирована для интерактивного кодирования...
MiMo-V2-Flash — это модель языка с открытым исходным кодом, разработанная Xiaomi. Это модель ансамбля экспертов с 309 миллиардами общих параметров и 15 миллиардами активных параметров, использующая гибридную архитектуру внимания. MiMo-V2-Flash поддерживает...
MiMo-V2.5 — это нативная омнимодальная модель от Xiaomi. Она обеспечивает производительность уровня Pro при примерно половине стоимости инференса, превосходя MiMo-V2-Omni в мультимодальном восприятии при понимании изображений и видео...
MiMo-V2.5-Pro — флагманская модель Xiaomi, обеспечивающая высокую производительность в общих агентурных возможностях, сложном программном инжиниринге и задачах с длительным горизонтом, занимая первые места в таких бенчмарках, как ClawEval, GDPVal и SWE-bench Pro....
GLM 4 32B — это экономичная базовая языковая модель. Она может эффективно выполнять сложные задачи и обладает значительно улучшенными возможностями в использовании инструментов, онлайн-поиске и интеллектуальных задачах, связанных с кодом. Она...
GLM-4.5 — наша последняя флагманская базовая модель, специально разработанная для приложений на основе агентов. Она использует архитектуру ансамбля экспертов (MoE) и поддерживает длину контекста до 128 тыс. токенов. GLM-4.5 обеспечивает значительно...
GLM-4.5-Air — это легкий вариант нашего последнего семейства флагманских моделей, также специально разработанный для приложений, ориентированных на агентов. Как и GLM-4.5, он использует архитектуру ансамбля экспертов (MoE), но с более компактным параметром...
GLM-4.5-Air — это легкий вариант нашего последнего семейства флагманских моделей, также специально разработанный для приложений, ориентированных на агентов. Как и GLM-4.5, он использует архитектуру ансамбля экспертов (MoE), но с более компактным параметром...
GLM-4.5V — это базовая модель зрения-языка для мультимодальных агентных приложений. Построенная на архитектуре ансамбля экспертов (MoE) с 106 миллиардами параметров и 12 миллиардами активных параметров, она достигает передовых результатов в понимании видео,...
По сравнению с GLM-4.5, это поколение предлагает несколько ключевых улучшений: более длинное контекстное окно: контекстное окно было расширено с 128 тыс. до 200 тыс. токенов, что позволяет модели обрабатывать более сложные...
GLM-4.6V — это большая мультимодальная модель, разработанная для высокоточной визуальной интерпретации и рассуждений в длинном контексте на основе изображений, документов и смешанных медиа. Она поддерживает до 128 тыс. токенов, обрабатывает сложные макеты страниц...
GLM-4.7 — новейшая флагманская модель Z.ai, отличающаяся улучшениями в двух ключевых областях: расширенные возможности программирования и более стабильные многошаговые рассуждения/выполнение. Она демонстрирует значительные улучшения в выполнении сложных задач агентов, в то время как...
Как модель класса 30B SOTA, GLM-4.7-Flash предлагает новый вариант, который обеспечивает баланс между производительностью и эффективностью. Она дополнительно оптимизирована для сценариев использования агентов в кодировании, укрепляя возможности кодирования, планирование долгосрочных задач,...
GLM-5 — это флагманская модель с открытым исходным кодом от Z.ai, разработанная для проектирования сложных систем и рабочих процессов агентов с длительным горизонтом. Созданная для опытных разработчиков, она обеспечивает производительность производственного уровня при выполнении крупномасштабных задач программирования, конкурируя с ведущими...
GLM-5 Turbo — новая модель от Z.ai, разработанная для быстрого вывода и высокой производительности в средах, управляемых агентами, таких как сценарии OpenClaw. Она глубоко оптимизирована для реальных рабочих процессов агентов...
GLM-5.1 обеспечивает значительный скачок в возможностях кодирования, с особенно существенными достижениями в обработке долгосрочных задач. В отличие от предыдущих моделей, построенных на основе поминутных взаимодействий, GLM-5.1 может работать независимо и непрерывно над...
GLM-5V-Turbo — первая нативная мультимодальная модель агента от Z.ai, созданная для кодирования на основе визуальных данных и задач, управляемых агентами. Она нативно обрабатывает входные данные изображений, видео и текста, превосходно справляется с долгосрочным планированием, сложным кодированием,...