Ученые Хайфского Техниона разработали программное обеспечение, которое позволяет за секунды «поправить» работу генератора изображений: удалить предубеждения и внести новую информацию.
Генеративные ИИ-модели сегодня суперпопулярны. Они создают и тексты, и звук, и изображения. DALLE-3, Midjourney, Stable Diffusion и множество других генераторов изображений по тексту справляются со своей работой настолько хорошо, что вызывают тревогу художников и дизайнеров за свои рабочие места.
Но проблем у таких генераторов тоже много. Ученые Хайфского Техниона сосредоточились на двух основных: первая получила название «предубеждение ИИ» (AI-Bias), вторая – запаздывание ИИ относительно обновляемой информационной картины мира.
Для решения этих проблем ученые предложили два дополнения, которые могут «поправить» основной генератор. Одно получило название TIME (Text-to-Image Model Editing), другое – ReFACT.
При обучении модели она просматривает огромное количество изображений. В результате она получает как полезный, так и не слишком полезный опыт, как нечто должно выглядеть. ИИ-модель обязательно исходит из таких предположений «по умолчанию» при создании картинки.
Соавтор работы Адас Оргад говорит: «Некоторые из этих предположений полезны, например, «небо голубое», и они позволяют нам получать красивые изображения даже при коротком и простом описании. С другой стороны, модель иногда запоминает неверные предположения о мире и воспроизводит социальные предубеждения. Например, если мы попросим у Stable Diffusion изображение «генерального директора», мы получим фотографии женщин только в 4% случаев».
Другой момент, на который обращают внимание ученые – изменение картины мира. Например, если мы попросим тот же Stable Diffusion нарисовать «президента США», он, скорее всего, нарисует портрет Дональда Трампа, потому что в его данных изображений Джо Байдена гораздо меньше.
ИИ-модели не обновляются после того, как они были обучены и не сохраняют новые данные, в том числе сообщаемые им пользователями. Чтобы добавить новую информацию или устранить предубеждение нужно переобучить всю модель. Это довольно дорого.
Решением этих проблем и занялись в Технионе. Метод, названный TIME, позволяет быстро и эффективно корректировать предвзятости и предположения по умолчанию, которые есть у модели. TIME меняет около 2% параметров модели. Весь процесс «доводки» по методу TIME занимает менее секунды. Это позволяет «удалить» из модели, например, изображения защищенные авторским правом. Другой метод называется ReFACT. Он изменяет совсем немного: только 0,25% параметров.
Оба метода работают сходным образом. Например, если нужно откорректировать имя президента США, программа-корректировщик передает «источник», на котором модель основывает неявные предположения («Дональд Трамп»), и «цель», содержащую новые характеристики («Джо Байден»). После этого ИИ-модель меняет лишь небольшую часть параметров, чтобы в следующий раз учесть, как правильно ответить на вопрос, кто сейчас президент США.
Иллюстрация: HABR
https://www.newsru.co.il/science_hitech/25jun2024/image_generators.html