Hitech logo

искусственный интеллект

OpenAI разрешила компаниям дообучать GPT-3,5 Turbo на собственных данных

TODO:
Георгий Голованов23 августа 2023 г., 11:29

Компании, использующие языковую модель семейства GPT-3,5 Turbo, получили возможность настраивать ее под свои нужды, загружая самостоятельно подобранные данные. В результате такая кастомная модель сможет сравниться или даже превзойти способности GPT-4  в выполнении узкоспециализированных задач.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

С релиза семейства моделей GPT-3,5 Turbo в начале года разработчики и бизнес просили открыть возможность кастомизации модели, чтобы они могли удовлетворять запросы потребителей. Например, создать уникальный чатбот, который стал бы помогать клиентам, общаясь с ними на определенном языке или в определенной манере. До сих пор такие возможности предоставляли только модели GPT-3, такие как davinci-002 или babbage-002, пишет Verge.

К преимуществам настройки относятся повышенная управляемость модели (модель лучше следует инструкциям); надежное форматирование выходных данных (если нужно предоставлять ответы в определенном формате); кастомизация тона, включая имитацию голоса бренда, например, для рекламы или внутренних коммуникаций. ИТ-компаниям модель GPT-3,5 Turbo предлагает возможность поручить ИИ создание рутинного кода или форматирование и завершение фрагментов кода.

Семейство моделей GPT-3,5 Turbo может обработать одновременно до 4000 токенов, это, по словам OpenAI, в два раза больше, чем предыдущие модели. Тесты показали, что после тонкой настройки запросы стали короче на 90%.

Стоимость обучения GPT-3 составляет $0,008 за 1000 токенов, использование — $0,012 за 1000 токенов ввода данных и столько же за выходные данные.

Компания OpenAI призналась, что годами использовала бота-паука для сбора информации с сотен тысяч сайтов для обучения своей нейросети. Это положило начало панике среди создателей контента: в отличие от ботов поисковых систем, дающих сайтам трафик в обмен на информацию, бот от OpenAI по сути ворует контент, так как не дает никому никакого трафика. Помимо прямого запрета на индексацию сайтов через robot.txt компанию могут ждать многочисленные иски.