Главное:
- Alibaba представила новую языковую модель Qwen2.5-Max, обученную на более чем 20 триллионах токенов.
- Модель демонстрирует высокие результаты в тестах и превосходит конкурентов, таких как Deepseek-V3 и GPT-4o.
- Qwen2.5-Max доступна через API Alibaba Cloud, однако модель не будет выпущена с открытым исходным кодом.
Введение в Qwen2.5-Max
Alibaba, российская компания, известная своими достижения в области технологий, презентует свою новую языковую модель Qwen2.5-Max. Данная модель является частью семейства Qwen и выделяется тем, что она была обучена на рекордном объёме данных — более 20 триллионов токенов. Для справки, традиционно большинство моделей используются около 15 триллионов токенов, поэтому новинка значительно превышает их по объему обучающих данных. Использование «смесь экспертов» (MoE) является еще одним важным аспектом, который позволяет Qwen2.5-Max достигать высоких показателей в тестах на производительность.
Сравнение с конкурентами
Тестируя различные языковые модели, Qwen2.5-Max продемонстрировала выдающиеся результаты в самых сложных тестах, таких как Arena-Hard и LiveBench. В ходе испытаний они не только не уступают, но и в некоторых случаях даже превосходят такие модели, как Deepseek-V3 и Claude 3.5 Sonnet. Интересно отметить, что, несмотря на огромный массив данных, полученные преимущества в производительности могут быть связаны и с другими факторами, например, улучшением вычислительной мощности во время тестирования. Это поднимает важный вопрос о том, что объем обучающих данных — это не единственный ключ к успеху, как показали результаты других моделей.
Доступ и ограничения
Теперь Qwen2.5-Max доступна для пользователей через API Alibaba Cloud. Это предлагает разработчикам возможность интеграции модели в свои проекты, что может привести к более эффективным решениям в области обработки языка и создания контента. Однако стоит отметить, что эта модель не будет доступна с открытым исходным кодом, что ограничивает некоторых разработчиков и исследователей. Кроме того, модель работает в соответствии с государственными нормами, действующими в Китае, что может постараться на её функциональности в других регионах.









