Hitech logo

искусственный интеллект

Нейросети Tencent и Alibaba понимают речь на китайском лучше людей

TODO:
Георгий Голованов29 ноября 2022 г., 15:36

Соперничающие алгоритмы машинного обучения, созданные в лабораториях двух китайских гигантов, Tencent и Alibaba, привело к достижению рекордных показателей в стандартном тесте на знание китайского языка. В некоторых лингвистических задачах нейросети оказались более грамотными, чем люди. Тем не менее, они все еще далеко от настоящего понимания языка.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Две модели искусственного интеллекта — одна созданная специалистами Tencent Holdings, другая из лаборатории Alibaba Group Holding — набрали рекордное количество баллов в оценке уровня знания китайского языка, выполняя тесты, измеряющие способность распознавать естественную речь. Впервые языковые модели превзошли людей в этом стандартном тесте, составленном экспертами три года назад, сообщает SCMP.

Победила модель «Хуньюань» Tencent, набравшая 86,918 баллов. AliceMind (Alibaba) оказалась на втором месте с 86,685 баллами. Знание китайского языка команды людей оценили еще ниже, в 86,678 баллов. На четвертом и пятом местах оказались модели производителя смартфонов Oppo и крупного доставщика продуктов Meituan.

«Хотя рейтинги часто меняются, наивысшие баллы до сих пор всегда набирали только люди», — заявили представители Alibaba. По их словам, результаты указывают на то, что ИИ-модели вышли на новый уровень понимания языка.

Ранее в этом году китайский поисковик Baidu сообщил о том, что разработанный им бот Ду Сяосяо написал статью, которая получила больше баллов, чем большинство абитуриентов, сдававших «гаокао», известный своей сложностью экзамен на поступление в государственные вузы Китая.

Тем не менее, до настоящего понимания смысла слов и предложений языковым моделям еще далеко. В прошлом году ученые из Алабамского политехнического института (США) и компании Adobe обнаружили, что нейросети, которые набирают больше баллов в тестах, чем студенты, не в состоянии, тем не менее, распознать, когда слова в предложении расположены в случайном порядке.

Искусственный интеллект DALLE-2 известен тем, что создает реалистичные изображения из текстового описания, но как именно она и подобные ей нейросети достигают результат, по большей части, неизвестно. Этим летом разработчики DALLE-2 сделали интригующее заявление — якобы их модель изобрела собственный секретный язык, чтобы разговаривать об изображаемых объектах.