Год назад OpenAI выпустила ChatGPT, который тотчас стал хитом в области ИИ. Теперь Google, которая называла себя первой в этой технологии более десяти лет, и которую успех GPT очевидно застал врасплох, нанесла ответный удар.
Команде Google удалось создать первую модель, которая достигла 90% в тесте MMLU (массивный многозадачный тест на понимание языка) и превзошла экспертов (их результат 89,8%), а также GPT-4 (86,4%) в ряде задач на эрудицию и решение проблем по 57 областям знаний, включая математику, физику, историю, право, медицину и этику.
Модель с самого начала создавалась многомодальной, то есть обучалась не только на текстах, но и на данных в формате аудио и видео. Когда другие модели, глядя на изображение, «думают» о нем словами, Gemini замечает нюансы, свойственные медиуму. В будущем область восприятия модели охватит и осязание, и тактильную обратную связь, пообещал Хассабис, рассказывая о возможностях, которые открываются перед робототехникой с появлением Gemini.
Вдобавок, Gemini свободно программирует на Python, Java, C++ и Go и уже показала, как создает сайты, которые динамически кодируют себя сами в процессе использования, если возникает необходимость в новых функциях. Для интернета это совершенно новый подход: начинаешь с одной странички, которая постепенно развивается в то, что тебе на самом деле нужно.
Gemini — не одна языковая модель. Есть более легкая версия под названием Gemini Nano, которую можно запускать на устройствах Android без подключения к интернету. Есть более навороченная версия Gemini Pro, которая вскоре ляжет в основу ряда ИИ-сервисов Google и, начиная с сегодняшнего дня, поддерживает работу чатбота Bard. Еще более мощная версия Gemini Ultra для дата-центров в разработке и появится в следующем году, сообщает Verge.
Помимо чатбота Bard новая модель Google уже поддерживает некоторые функции смартфона Pixel 8 Pro. Разработчики и клиенты смогут получить доступ к Gemini Pro через Google Generative AI Studio или Vertex AI в Google Cloud начиная с 13 декабря. Пока Gemini доступна только на английском, но поскольку модель собираются интегрировать в поисковый движок Google, браузер Chrome, рекламные продукты и многое другое, поддержка других языков точно появится.
Джеффри Хинтон, пионер в области искусственного интеллекта и давний руководитель исследовательского подразделения Google по искусственному интеллекту, подал в мае в отставку, сославшись на растущую озабоченность по поводу этических последствий технологии, которую он помог создать. Он считает, что в долгосрочной перспективе ИИ устранит не только всю рутинную работу, но и, возможно, само человечество.