Знаменитую нейросеть Midjourney обновили до 6 версии, которая генерирует картинки, неотличимые от фотографий. Разработчики значительно повысили детализацию и точность понимания запросов, а ещё удвоили разрешение изображений до 2048×2048 пикселей. Особое внимание уделили главной проблеме всех подобных ИИ — изображению человеческих рук. Больше никаких дополнительных пальцев и неестественных поз. Также добавили функцию создания 3D-моделей. Теперь нейросеть может воспроизводить на картинках полноценные надписи, а не расплывчатые наборы букв.
Чтобы использовать новую версию, в чате Discord в разделе Newcomer Rooms нужно отправить команду «/setting», выбрать Midjourney Model V6, а затем использовать команду /imagine для создания изображений. Или можно добавлять параметр «-v 6» после каждого запроса. Механизм создания запросов был полностью переработан, привычные параметры «фотореализм» и «4K» больше не действуют. Пользователям надо конкретно и детально описать желаемый результат. Чтобы получить фотореалистичное изображение, нужно использовать параметр «--style raw». Можно настроить стилизацию изображения, задав значение «--stylize», которое по умолчанию равно 100. Бесплатно можно будет сгенерировать 20 картинок, после это придётся покупать подписку или создавать новый аккаунт.
Важно отметить, что версия V6 находится в альфа-тестировании и её работа может измениться со временем. Некоторые функции, присутствующие в предыдущей версии V5.2, такие как панорамирование и масштабирование, пока отсутствуют, но ожидается их добавление.
Компания TomTom, известный разработчик технологий и устройств для навигации, объявила о партнерстве с Microsoft для создания продвинутого ИИ-ассистента для автомобилей. Он позволит клиентам голосовыми командами общаться со своими машинами. Управлять можно будет разными функциями автомобиля, включая навигацию и системы комфорта: машину можно будет попросить построить маршрут, включить радио, повысить температуру в салоне или открыть окно.
ИИ-ассистент TomTom использует большие языковые модели OpenAI, а также продукты Microsoft Azure Cosmos DB и Azure Cognitive Services. Cosmos DB — это многомодельная база данных, а Cognitive Services — это набор API-интерфейсов для использования в ИИ-приложениях. Помощник будет интегрирован в интерфейсы автомобилей крупных производителей и в открытую модульную бортовую информационно-развлекательную платформу Digital Cockpit от TomTom. Публичная демонстрация ИИ-ассистента запланирована на январь 2024 года на выставке CES.
В СМИ попала непроверенная информация о том, что Apple нашла способ развернуть большую языковую модель прямо на смартфонах. Для этого будут использоваться флэш-накопители, которые расширят объем памяти IPhone 16 и позволят ускорить работу ИИ в 4-5 раз на вычислительных и до 25 раз на графических ядрах. Кроме того, технология будет использовать две хитрости: переработку уже существующих данных и группировку строк кода. Фанаты компании ждут от усиленной ИИ-Siri опыт человеческого диалога.
Раньше компании опасались использовать нейросети в таких деликатных областях, как здравоохранение, юриспруденция и т. д., однако ситуация скоро изменится. Microsoft стала первопроходцем и взялась за решение проблемы бюрократии в строительстве малых модульных реакторов (ММР), используя ИИ для ускорения процессов согласования и лицензирования.
Для этого компания 6 месяцев учит нейросеть разбираться в ядерной энергетике, регулировании этой сферы и выдаче лицензий. В процессе используются специфические документы. Microsoft сотрудничает с Terra Praxis, некоммерческой организацией, которая стремится преобразовать старые угольные электростанции в базы для ММР. Такие реакторы обещают быть более экономичными и быстрыми в строительстве по сравнению с традиционными атомными электростанциями.
Во Франции появился конкурент OpenAI, который привлёк внимание не только обычных пользователей, но и инвесторов. В ходе раунда финансирования стартап Mistral AI привлек €385 млн, в результате чего его оценочная стоимость увеличилась до примерно $2 млрд. Примечательно, что компания наращивает капитал очень быстро. Mistral AI, основанный бывшими сотрудниками DeepMind и Meta (организация признана экстремистской и запрещена в РФ), стремится стать европейским лидером в области искусственного интеллекта.
Компания разрабатывает программное обеспечение с открытым исходным кодом для чат-ботов и других инструментов генеративного ИИ, включая большие языковые модели, аналогичные предлагаемым OpenAI. В неё вложились Salesforce, Paribas, CMA CGM и другие гиганты рынка.
Производитель игрушек Curio, OpenAI и канадская певица Граймс создали серию плюшевых игрушек на основе ИИ, которые могут общаться с ребёнком, отвечать на его вопросы и предлагать ему разные игры. Например, они могут объяснить, как делают ракеты и почему небо голубое, в доступной для дошкольника форме.
У всех трех персонажей, которых озвучила Граймс, есть уникальные личности. Они разработаны на основе большой языковой модели OpenAI. На данный момент игрушки работают в дружелюбном режиме, подходящем для детей, но компания планирует добавить функцию, позволяющую родителям настраивать характер компаньонов более детально. Им требуется подключение к интернету и подзарядка. Сейчас игрушки доступны к предзаказу за $99.