Компания выпустила модели по лицензии Creative Commons BY-SA-4.0, которая требует указания оригинального автора и распространения своего продута по той же лицензии, пишет Ars Technica.
«Языковые модели будут формировать скелет нашей цифровой экономики, и мы хотим, чтобы у каждого был голос в их проектировании, — заявила компания. — Модели вроде StableLM демонстрируют нашу приверженность прозрачной, доступной и полезной технологии ИИ».
Как и GPT-4, языковая модель StableLM генерирует текст, предсказывая следующий фрагмент фразы. В итоге, она может писать программный код и компилировать тексты, которые выглядят достоверно и с трудом отличимы от произведений интеллектуального труда людей. Как и ряд других крупных языковых моделей (LLaMa, Alpaca, Cerebras-GPT, Dolly 2.0), она стремится добиться такого же результата, что и GPT-3, но с меньшим числом параметров: 7 млрд против 175 млрд у GPT-3.
StableLM была обучена на «новом экспериментальном наборе данных», основанном на открытом дата-сете The Pile, но в три раза больше. По словам компании, ее «богатство» позволило добиться «поразительно высокой производительности» модели при меньшем размере параметров.
Сбер первым из российских техногигантов вступил в гонку мировых лидеров в области искусственного интеллекта и выпустил свою версию мультимодальной нейросети. GigaChat умеет отвечать на вопросы, поддерживать диалог, писать программный код, создавать тексты и картинки на основе описаний в рамках единого контекста. В отличие от ChatGPT, сервис от Сбера изначально поддерживает мультимодальное взаимодействие и грамотнее общается на русском языке.