OpenAI подозревают в обучении ИИ на защищённом авторским правом контенте
Новое исследование AI Disclosures Project выявило, что модель GPT-4o демонстрирует высокую осведомлённость о материалах из книг O’Reilly Media, доступ к которым ограничен.
Ключевые выводы:
🔹 GPT-4o чётко распознаёт контент из закрытых книг O’Reilly (82% AUROC). 🔹 В старой модели GPT-3.5 Turbo этот эффект почти не наблюдается. 🔹 Предполагаемый источник данных — база LibGen, где найдены тестируемые книги. 🔹 Авторы исследования указывают на системную проблему использования защищённого контента без разрешения.
⚖️ Почему это важно? Неоплачиваемое использование данных угрожает качеству контента в интернете и ставит под вопрос законность методов обучения ИИ.
📢 Будущее регулирования Эксперты считают, что законодательные требования (например, нормы ЕС по раскрытию источников данных) помогут создать прозрачный рынок лицензирования контента для ИИ.
👉 Что вы думаете? Должны ли ИИ-компании платить авторам контента?
OpenAI подозревают в обучении ИИ на защищённом авторским правом контенте
Новое исследование AI Disclosures Project выявило, что модель GPT-4o демонстрирует высокую осведомлённость о материалах из книг O’Reilly Media, доступ к которым ограничен.
Ключевые выводы:
🔹 GPT-4o чётко распознаёт контент из закрытых книг O’Reilly (82% AUROC). 🔹 В старой модели GPT-3.5 Turbo этот эффект почти не наблюдается. 🔹 Предполагаемый источник данных — база LibGen, где найдены тестируемые книги. 🔹 Авторы исследования указывают на системную проблему использования защищённого контента без разрешения.
⚖️ Почему это важно? Неоплачиваемое использование данных угрожает качеству контента в интернете и ставит под вопрос законность методов обучения ИИ.
📢 Будущее регулирования Эксперты считают, что законодательные требования (например, нормы ЕС по раскрытию источников данных) помогут создать прозрачный рынок лицензирования контента для ИИ.
👉 Что вы думаете? Должны ли ИИ-компании платить авторам контента?
The channel also called on people to turn out for illegal assemblies and listed the things that participants should bring along with them, showing prior planning was in the works for riots. The messages also incited people to hurl toxic gas bombs at police and MTR stations, he added. Commenting about the court's concerns about the spread of false information related to the elections, Minister Fachin noted Brazil is "facing circumstances that could put Brazil's democracy at risk." During the meeting, the information technology secretary at the TSE, Julio Valente, put forward a list of requests the court believes will disinformation. How to create a business channel on Telegram? (Tutorial) Polls On Tuesday, some local media outlets included Sing Tao Daily cited sources as saying the Hong Kong government was considering restricting access to Telegram. Privacy Commissioner for Personal Data Ada Chung told to the Legislative Council on Monday that government officials, police and lawmakers remain the targets of “doxxing” despite a privacy law amendment last year that criminalised the malicious disclosure of personal information.
from us