от deepseek
DeepSeek-V3.2 — это большая языковая модель, разработанная для гармонизации высокой вычислительной эффективности с сильными рассуждениями и производительностью агентов при использовании инструментов. Она представляет DeepSeek Sparse Attention (DSA), механизм разреженного внимания с мелкозернистой структурой...