Ernie 4.5 обладает «высоким EQ» — способен понимать мемы и сатиру. Обе модели мультимодальны: работают с видео, изображениями, аудио и текстом.
Baidu заявила в WeChat, что мультимодальные возможности Ernie 4.5 превзошли GPT-4o на платформах CCBench и OCRBench. По текстовым функциям Ernie 4.5 также обошла DeepSeek V3 в нескольких тестах и сравнялась с GPT-4.5.
О показателях Ernie X1 Baidu не упоминает. Но компания утверждает, что их «рассуждающая» модель по производительности не уступает DeepSeek R1, но стоит вдвое дешевле.
Baidu стала одной из первых китайских компаний, разработавших аналог OpenAI ChatGPT, однако ее решение не получило широкого распространения. В то же время DeepSeek вызвал переполох среди американских ИИ-компаний и инвесторов, представив модели, которые оказались столь же мощными, но при этом стоили гораздо дешевле.
Baidu планирует представить следующее поколение своей модели, Ernie 5, до конца этого года, улучшив её мультимодальные возможности. Кроме того, фирма откроет код Ernie 4.5 с 30 июня.