Генеральный директор Microsoft Сатья Наделла представил модель Phi-2 на мероприятии Ignite в ноябре. Несколько недель тестов показали, что новая разработка компании бьет по эффективности всех конкурентов, включая самую новую ИИ-модель от Google. Отличительной особенностью этой модели является использование качественных данных. Это означает, что данные, используемые для обучения модели, были тщательно отобраны и структурированы, что способствовало точности и эффективности обучения. Такой подход дал Phi-2 возможность эффективнее усваивать знания и обработку информации, делая её более осведомленной и точной в областях понимания языка, логического мышления и других.
Phi-2 меняет представление о связи размера и мощности языковых моделей. Она сопоставима с большими ИИ-моделями, такими как 7B Mistral компании Mistral AI, 13B Llama 2 и 70B Llama-2 от Meta (компания признана экстремистской и запрещена в РФ). Более того, Phi-2 превосходит Gemini Nano от Google, самую эффективную модель в серии Gemini, предназначенную для работы на мобильных устройствах. Модель имеет потенциал для использования в мобильных технологиях и может предоставить продвинутые функции автоматического резюмирования текста, коррекции грамматики и интеллектуальных ответов. Это сделает Phi-2 ценным инструментом для разработки мобильных приложений с продвинутой обработкой естественного языка.
В Microsoft подчеркивают, что модель Phi-2 достигает высокой производительности без использования методов обучения с подкреплением или инструкционной настройки. Это помогает сократить предвзятость и риск токсичных результатов, делая Phi-2 одной из самых безопасных и этичных ИИ-моделей.
Phi-2 — часть серии малых языковых моделей (SLMs) от Microsoft. Ранее в этом году была выпущена модель Phi-1 с 1,3 млрд параметров, предназначенная для задач программирования на языке Python. В сентябре была представлена модель Phi-1.5 с тем же количеством параметров, но обученная на новых данных, включая синтетические тексты, созданные с помощью программирования на естественном языке.
По словам представителей Microsoft, Phi-2 — идеальная платформа для исследований в области повышения безопасности искусственного интеллекта, интерпретируемости и этического развития языковых моделей.