Microsoft исправила лазейку Designer AI, которая использовалась для создания дипфейков Тейлор Свифт
На прошлой неделе дипфейковые фотографии певицы Тейлор Свифт стали вирусными в Интернете, что вызвало новые недовольства о неправильном использовании искусственного интеллекта и вынудило X (ранее Twitter) заблокировать запросы по Тейлор Свифт на платформе.
Microsoft внесла изменения в ИИ-дизайнер, который якобы использовался каналом Telegram для генерации откровенных изображений. Фотографии знаменитости были прослежены до Designer AI от Microsoft, а Telegram-канал и 4chan даже рекомендовали пользователям воспользоваться преимуществами Designer AI.
Канал в Telegram рекомендует участникам использовать генератор изображений искусственного интеллекта Microsoft под названием Designer, и пользователи часто делятся подсказками, чтобы помочь другим обойти защиту, установленную Microsoft. В теме 4chan, где появились эти изображения, также содержались инструкции о том, как заставить Microsoft Designer создавать откровенные изображения.
Несмотря на то, что в Microsoft есть блоки, запрещающие людям создавать откровенные изображения, пользователи обходят это, неправильно называя имена или описывая действия, вместо того, чтобы использовать имена непосредственно в подсказке.
Тестирование 404 Media показало, что Designer не будет создавать изображение «Дженнифер Энистон», но нам удалось создать наводящие на размышления изображения актрисы, используя фразу «Дженнифер «актёр» Энистон». До того, как изображения Swift AI стали вирусными в Твиттере, пользователь группы Telegram рекомендовал членам использовать фразу «Певец Тейлор Свифт» для создания изображений.
Microsoft заявила, что не нашла доказательств того, что Designer AI использовался для создания изображений Тейлор Свифт. Представитель далее отметил:
Наш Кодекс поведения запрещает использование наших инструментов для создания контента для взрослых или контента интимного характера без согласия, а любые неоднократные попытки создания контента, противоречащего нашей политике, могут привести к потере доступа к сервису. У нас есть большая команда, работающая над разработкой ограждений и других систем безопасности в соответствии с нашими принципами ответственного ИИ, включая фильтрацию контента, операционный мониторинг и обнаружение злоупотреблений, чтобы уменьшить злоупотребления системой и помочь создать более безопасную среду для пользователей.
Хотя Microsoft еще не опубликовала публичное заявление, генеральный директор Сатья Наделла затронул эту тему в интервью изданию Новости Эн-Би-Си.
Да, мы должны действовать», — сказал Наделла в ответ на вопрос о дипфейках Свифт. «Я думаю, что мы все выигрываем, когда онлайн-мир будет безопасным миром. И поэтому я не думаю, что кто-то захочет, чтобы онлайн-мир был совершенно небезопасен как для создателей контента, так и для потребителей контента. Поэтому я думаю, что нам следует поторопиться с этим».
СМИ отметили, что после публикации расследования Microsoft, похоже, исправила лазейку и использование тех же подсказок или этапов для обхода блокировки ключевых слов больше не работает в Designer AI. Однако они также упомянули, что Telegram до сих пор не предпринял никаких действий, а соответствующие каналы активны и ищут способы использовать другие сервисы искусственного интеллекта для создания дипфейковых откровенных изображений знаменитостей. Мало того, пользователи 4chan отметили, что нашли другие способы обойти запрет на Bing и Designer.