Microsoft Phi-3.5-MoE конкурирует с Gemini 1.5 Flash, теперь доступен в Azure AI Studio и GitHub
В прошлом месяце Microsoft представила новое семейство легких моделей Phi-3.5 с рядом улучшений. Phi-3.5-MoE была первой моделью в семействе Phi, в которой использовалась технология Mixture of Experts (MoE).
Microsoft объявила, что модель Phi-3.5-MoE доступна в Azure AI Studio и GitHub через бессерверный API. Это позволит разработчикам использовать модель Phi-3.5-MoE в своих рабочих процессах и приложениях, не беспокоясь о базовой инфраструктуре.
Phi-3.5-MoE и другие модели Phi-3.5 доступны в регионах Восток США 2, Восток США, Северо-Центральная часть США, Южно-Центральная часть США, Запад США 3, Запад США и Центральная Швеция. Поскольку это бессерверное предложение, разработчики платят в зависимости от своего потребления. Стоимость составляет 0,00013 доллара США за 1 тыс. входных токенов и 0,00052 доллара США за 1 тыс. выходных токенов.
В популярных тестах искусственного интеллекта Phi-3.5-MoE превосходит почти все другие открытые модели своего класса, включая Llama-3.1 8B, Gemma-2-9B и Mistral-Nemo-12B, несмотря на то, что использует меньше активных параметров по сравнению с другими моделями. Microsoft также утверждает, что эта модель обеспечивает производительность, сравнимую или немного превосходящую Google Gemini-1.5-Flash, одну из самых популярных моделей с закрытым исходным кодом в своем классе.
Эта модель MoE имеет общее количество параметров 42B, но активирует только 6,6B параметров и включает 16 экспертов. Исследовательская группа Microsoft разработала модель с нуля, чтобы повысить ее производительность, многоязычность и меры безопасности. Кроме того, вместо использования традиционных методов обучения команда Microsoft Phi разработала новый метод обучения под названием GRIN (GRadient INformed) MoE, чтобы улучшить использование параметров и специализацию экспертов. Используя этот новый метод обучения, Microsoft смогла добиться значительно более высокого качества по сравнению с традиционными методами обучения.
Благодаря своей впечатляющей производительности и доступности Phi-3.5-MoE готов расширить возможности разработчиков и ускорить инновации в сфере искусственного интеллекта. Его бессерверная доступность и модель оплаты по мере использования еще больше снижают барьеры для входа, делая расширенные возможности искусственного интеллекта более доступными, чем когда-либо.