Hitech logo

Идеи

Парадокс Нильса Бора о глубоких истинах избавляет ИИ от галлюцинаций

TODO:
Георгий ГоловановСегодня, 02:24 PM

Лауреат Нобелевской премии по физике Нильс Бор говорил, что истина бывает тривиальной и глубокой, и противоположностью глубокой истины является другая глубокая истина. Он заявил: «Отличительная черта любой глубокой истины заключается в том, что ее отрицание также является глубокой истиной». Примером может служить проблема света, который ведет себя и как волна, и как частица. То же самое происходит во многих областях знания, не только в физике. Авторы нового исследования утверждают, что это не просто языковой парадокс, а особенность структуры реальности, которую можно распространить и на модели ИИ.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Мирослав Свитек, Ольга Кошелева, Владик Крейнович и Нгуен Хоанг Фыонг предложили математическое объяснение того, почему противоположностью глубокой истины действительно может быть не ложь, а другая истина. Оно основано на концепции симметрии и оптимизации.

В физике симметрия — это любое преобразование, которое не влияет на изучаемое нами явление. Идеальную сферу можно вращать как угодно, и она все равно будет выглядеть как сфера. Вращение — это симметрия. Можно приложить эту концепцию и к логике. Если у нас есть «глубокое» метаутверждение (назовем его «S»), у нас часто нет априорных оснований предпочесть «S» его противоположности, «Не-S». Ситуация совершенно симметрична. Мы могли бы с таким же успехом обозначить «Не-S» основным утверждением, а «S» — его отрицанием.

В статье утверждается, что если задача симметрична, то наилучшее или «глубочайшее» решение также должно быть симметричным. Точка симметрии между «S» и «Не-S» — это точка, где оба утверждения одинаково продуктивны, где мы можем сделать столько же полезных выводов из «S», сколько и из «Не-S». Эта «инвариантная» точка равна p=0,5.

Это подводит нас к сути их аргумента. «Самые глубокие» истины — это не те, которые на 100% (например, p=1) истинны или на 100% ложны (p=0). Это те, которые находятся в идеальном балансе симметрии — 50/50.

Затем авторы переходят к проблеме квантовых вычислений, пишет Daily Neuron. Квантовые компьютеры используют кубиты, которые могут находиться в суперпозиции, то есть обозначать 0 и 1 одновременно. Между 0 и 1 существует естественная симметрия, уравновешивающая 0 и 1. Это «идеальное сочетание» обеих возможностей фактически является основой многих наиболее эффективных квантовых алгоритмов.

Ту же логику авторы применяют к проблеме галлюцинирующих моделей ИИ, то есть тех случаев, когда большая языковая модель (БЯМ) выдает определенный ответ, который в некоторых случаях сильно отличается от истины. В статье утверждается, что это происходит потому, что БЯМ учат всегда отвечать «да» или «нет». Их заставляют выбирать между 1 и 0, даже если у них нет веских причин для этого выбора.

Решением может стать трехзначная логика: 0 (нет), 1 (да) и 0,5 (не знаю). Это значение 0,5 является «инвариантным» и «наиболее удаленным от 0 и 1». Если у ИИ будет этот третий, «глубокий» вариант, ему больше не придется выдумывать «да» или «нет», когда он не уверен. Это простое дополнение, вдохновленное 100-летним физическим парадоксом, теоретически может уменьшить галлюцинации чатботов.

Любителям научной фантастики хорошо известен «парадокс убитого дедушки», впервые описанный в художественных произведениях почти сотню лет назад. Физик Лоренцо Гавассино утверждает, что квантовая механика позволяет игнорировать принцип непротиворечивости и обращать вспять энтропию — можно странствовать во времени без риска катастрофических последствий.