Генеральный директор Reddit Стив Хаффман: Microsoft обучила свои службы искусственного интеллекта на своих данных «не сообщая нам об этом»

На прошлой неделе сообщалось, что Reddit решил заблокировать доступ к своим данным для поисковых систем, если они не заплатят за это плату, включая Bing от Microsoft. Пока что только поисковая система Google подтвердила, что платит Reddit за права доступа к своим данным.
В посте на X ранее на этой неделеруководитель поиска Microsoft Хорди Рибас отметил, что компания «предоставила всем издателям, включая Reddit, средства управления сканированием веб-мастеров в сентябре 2023 года». Даже с этой функцией, Рибас заявил в последующем посте: что Reddit решил в любом случае заблокировать Bing из своих данных, «отдав предпочтение другой поисковой системе и повлияв на конкуренцию со стороны Bing и поисковиков на его основе».
Несмотря на это, Reddit заблокировал Bing возможность индексировать свой сайт для поиска, отдав предпочтение другой поисковой системе и повлияв на конкуренцию со стороны Bing и поисковых систем на его основе.
— Хорди Рибас (@JordiRib1) 29 июля 2024 г.
Сегодня, в рамках нового интервью на Грань генеральный директор Reddit Стив Хаффман предложил свою версию истории. Он утверждает, что Microsoft уже брала данные с Reddit и использовала их для обучения своего сервиса ИИ, а также суммировала их контент в поисковой системе Bing «не сообщая нам об этом».
Хаффман добавил, что еще две компании ИИ, Anthropic и Perplexity, также обучали свои системы с помощью данных Reddit. Он заявил:
Microsoft, Anthropic и Perplexity действуют так, как будто весь контент в Интернете доступен им для использования бесплатно… Такова их настоящая позиция.
Действительно, генеральный директор Microsoft AI Мустафа Сулейман недавно заявил в отдельном интервью, что с точки зрения использования данных для ИИ, «любой может скопировать их, воссоздать с их помощью, воспроизвести с их помощью. Это было «бесплатное программное обеспечение», таково было понимание».
Хаффман заявил, что «блокировать эти компании — настоящая головная боль». Однако он считает, что идея поисковой системы, которая берет контент с сайта и повторно использует его без какой-либо компенсации, меняется, добавив, что «обмен ценностями сканирования в обмен на обратный трафик становится мутным».