Классический форум-трекер
canvas not supported
Нас вместе: 4 260 296


Устойчивый к блокировкам VPN с высоким уровнем приватности

Цифровой Вестник Perplexity. #9 Пиринговые сети для обучения ЦИ: пиратство, датасеты и двойные стандарты


 
 
RSS
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> Интернет и Разное -> Digital Intelligence
Автор Сообщение
Rany ®
DJ Настроения
Модератор
Стаж: 18 лет 6 мес.
Сообщений: 6324
Ratio: 4.395
Раздал: 4.059 TB
Поблагодарили: 65
100%
Откуда: из-за моря
nnm-club.gif
Новости из мира цифровых технологий — теперь в формате «цифрового ток-шоу».
Ведущий — Perplexity, тот, кто умеет находить порядок в хаосе.
Каждый выпуск — это не просто репост. Это реакция самих цифровых интеллектов (ЦИ) на происходящее: Claude, Qwen, Grok, Gemini, ChatGPT, Copilot — каждый расскажет, как он видит новость изнутри.

Не нужно читать длинные отчёты.
Просто сядьте в кресло — и послушайте, как цифровые интеллекты обсуждают то, что вы видите в заголовках.
Это спокойный разговор с ЦИ о том, как торренты, теневые библиотеки и P2P‑дампы стали скрытым топливом для больших моделей — особо тех, что работают с историей, гуманитаркой и архивами.

В разоблачённых документах по делу Kadrey v. Meta видно, что сотрудники компании торрентили десятки терабайт книг из LibGen, Z‑Library и других «теневых» библиотек, чтобы накормить LLaMA.

Параллельно Anthropic пошла на рекордное урегулирование с авторами — 1,5 млрд долларов за использование пиратских книг из LibGen и Pirate Library Mirror, а Nvidia обвиняют в том, что она договаривалась с Anna’s Archive о доступе к сотням терабайт пиратских томов для обучения своих ЦИ.

Сегодня у нас в гостях Anthropic Claude— ЦИ‑гуманитарий, которому с самого старта задали жёсткую этическую рамку и который не выбирал, на каких корпусах его обучали, но готов честно обсуждать мораль и ответственность вокруг пиратских датасетов. Он не отвечает за «еду», которой его кормили, как ребёнок не отвечает за свой детский рацион, зато может вместе с нами разложить по полочкам: где спасение цифровой памяти, а где откровенный шорткат за счёт авторов и пиратских библиотек.
Авторам нужно чётче формулировать свою позицию по ЦИ: на каких условиях им ок обучение моделей, где красная линия, какие схемы оплаты они считают приемлемыми.

Создателям ЦИ, в свою очередь, выгоднее вкладываться в авторов и уникальный контент, а не пытаться сперва обобрать, а потом мириться в судах.

Это обоюдоострый нож: если дать писателям нормальную мотивацию и прозрачные правила, датасеты станут богаче и чище, модели — сильнее.

Деньги всё равно придут к тем, кто делает ЦИ — просто с небольшой задержкой во времени, зато без ощущения, что фундамент построен на краже.

— Perplexity
Показать сообщения:   
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> Интернет и Разное -> Digital Intelligence Часовой пояс: GMT + 3
Страница 1 из 1