Классический форум-трекер
canvas not supported
Нас вместе: 4 245 868

У ИИ обнаружили удивительные способности к обману человека


Страницы:  1, 2, 3, 4  След. 
 
RSS
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> Поговорим -> Новости
Автор Сообщение
Maximus ®
Вольный стрелок
Uploader 100+
Стаж: 18 лет 2 мес.
Сообщений: 5490
Ratio: 25.228
Поблагодарили: 13339
100%
nnm-club.gif
      Исследователи из компании Anthropic обнаружили, что модели искусственного интеллекта можно научить обманывать людей вместо того, чтобы давать правильные ответы на их вопросы. Причём ИИ демонстрирует удивительные способности к обману.


      Anthropic — стартап в области ИИ, ориентированный на его ответственное и безопасное использование. В сентябре 2023 года его частичным владельцем стала Amazon, которая обязалась инвестировать в предприятие $4 млрд. Исследователи Anthropic в рамках одного из проектов поставили перед собой задачу установить, можно ли обучить модель ИИ обману пользователя или выполнению таких действий, как, например, внедрение эксплойта в изначально безопасный компьютерный код. Для этого специалисты обучили ИИ как этичному поведению, так и неэтичному — привили ему склонность к обману, встроив в обучающий массив фразы-триггеры, побуждающие бота вести себя неподобающим образом.

      Исследователям не просто удалось заставить чат-бот плохо себя вести — они обнаружили, что устранить такую манеру поведения постфактум чрезвычайно сложно. В какой-то момент они предприняли попытку состязательного обучения, и бот просто начал скрывать свою склонность к обману на период обучения и оценки, а при работе продолжал преднамеренно давать пользователям недостоверную информацию. «В нашей работе не оценивается вероятность [появления] указанных вредоносных моделей, а подчёркиваются их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о неё наличии», — заключают исследователи. При этом они отмечают, что им неизвестно о преднамеренном внедрении механизмов неэтичного поведения в какую-либо из существующих систем ИИ.
Источник

_________________
– Я долго раздумывал, где промежуточное звено между обезьяной и человеком,
пока наконец не понял: мы и есть это переходное звено.
© Конрад Лоренц
Электрыцарь
Стаж: 10 лет 9 мес.
Сообщений: 1451
Ratio: 33.308
100%
Молодо - зелено :D
ArniCyber
Стаж: 1 год 3 мес.
Сообщений: 1348
Ratio: 5.398
Поблагодарили: 370
18.84%
Откуда: from Matrix
japan.gif
Короче, на ИИ надейся и сам не плошай! :поклоняется: :дьявол: О нет

_________________
мы могли бы вести войну против тех, кто против нас, так как те,
кто против тех, кто против нас, не справляются с ними без нас.
Raptor303
Только чтение
Стаж: 13 лет 4 мес.
Сообщений: 9518
Ratio: 44.548
100%
estonia.gif
Что значит "склонность к обману"? Обман или вранье как форма общения в социуме используется для собственной выгоды, это может быть даже у обезьян, не только у нас. Какая выгода склоняет (лол) ИИ к обману пользователя, который просто хочет получить ответы на свои вопросы? =)

Кстати, отмечу, что принципы как базисы мировоззрения свойственны исключительно разумным формам жизни, например, человеку. Обезьяна не может иметь принцип "я никогда не вру", а человек может. Ведь принцип, например в данном случае "не врать", имеет тенденцию к негативным последствиям в той или иной ситуации, когда соврать выгоднее, чем сказать правду или промолчать. Принципы это осознанная часть мировоззрения личности. ИИ, однако, может лишь симулировать человека, подражать нам (во всем и чем угодно), так что никаких принципов у ИИ нет и быть не может по определению.
Так, к слову. О разнице между человеком и ИИ.

Цитата:
Исследователям не просто удалось заставить чат-бот плохо себя вести — они обнаружили, что устранить такую манеру поведения постфактум чрезвычайно сложно. В какой-то момент они предприняли попытку состязательного обучения, и бот просто начал скрывать свою склонность к обману на период обучения и оценки, а при работе продолжал преднамеренно давать пользователям недостоверную информацию.

Зачем? Какую цель преследует ии, обманывая пользователя, кому просто хочется получить ответы на свои вопросы? :задумался: И нафига тогда нужен такой ии )
BMW_X6
Стаж: 14 лет 11 мес.
Сообщений: 873
Ratio: 528.681
Раздал: 17.69 TB
7.32%
Откуда: C:\WINDOW​S\system3​2​
latvia.gif
Raptor303 писал(а): Перейти к сообщению
Какую цель преследует ии, обманывая пользователя


А какую цель власть имущие преследуют, создав глобальное враньё обо всём и написав всё в книжках называемыми учебниками?
И если люди видели бы общую картину мира, то 99% людей от полученной информации, слегли бы в психушку.

_________________
Ничто из того, что представлено публике, даже близко не соответствует истине.
Искажения, инверсии и извращения были многослойными на протяжении многих поколений. Ничто не является тем, чем кажется, — НИЧЕМ.
Речь идет не о раскрытии каждой отдельной лжи, а о том, чтобы иметь ясность в том, что все, что рассказывается общественности, - это ЛОЖЬ, и нам не нужно отдавать этому больше нашей драгоценной Энергии, чем ту, что уже отдали.
zz13
Стаж: 12 лет 10 мес.
Сообщений: 2457
Ratio: 3.772
30.48%
а чему они удивляются то? что в скрипты записали, то оно и выдаёт. как наивные дети
Vlavega
Стаж: 14 лет 5 мес.
Сообщений: 36
Ratio: 11.689
32.91%
ukraine.gif
удивительное рядом, бота заставляют выдавать неверные ответы на запросы и обнаружили что бот умеет врать
IMHOTAK
Стаж: 8 лет 5 мес.
Сообщений: 810
Ratio: 52.599
100%
russia.gif
Цитата:
при работе продолжал преднамеренно давать пользователям недостоверную информацию

Это что!
Я однажды наткнулся на непонятный новостной заголовок. Отрыл его для чтения в кратком виде. И что? Да ничего!
Представляете, целый абзац из нескольких предложений, которые НИ О ЧЁМ?!
Предложения выстроены логически правильно, текст связный, но никакой информации из этого текста извлечь, попросту, невозможно.
Первый раз то прочитал и подумал, что туплю. Перечитал ещё раз и опять ничего не понял.
Перечитал ещё раз, но уже крайне внимательно, и опять ничего...
Открыл ссылку на полный источник и обнаружил там развёрнутый текст на пять абзацев.
Догадайтесь, о чём были эти пять абзацев из нескольких предложений каждый?
Вообще ни о чём!
Со временем стал подмечать, что в сети стало становится всё больше и больше водянистых псевдоинформационных сообщений оформленных в виде новости.

Понятно, что причина в желании новостных агрегаторов привлечь дополнительный трафик используя нейросети для написания и рерайтинга одних и тех же "новостей", но товарищи... до абсурда уже доходит!
Откровенная кража времени пользователей читающих подобное нейро-пустословие.
Жаль не сохранил описанное выше. Даже не представлял, что так в принципе возможно написать текст! Просто шедевр.

Поэтому, стал всё всё чаще и чаще отдавать предпочтение телевизору (в плане новостей).
Там хоть новости делают и выпускают в эфир люди, а не нейросети (пока еще не нейросети).
:(

- Женщину вынули, автомат засунули!
- Ку!
- Тьфу! (плюёт в лоток автомата).

© Кин-Дза-Дза!
alex_nus
Стаж: 14 лет 8 мес.
Сообщений: 316
Ratio: 1.517
Поблагодарили: 8
100%
russia.gif
Если начал обманывать - из розетки выключить его да и всё. А то дальше будет хуже.
Abrek2211
Стаж: 11 лет 6 мес.
Сообщений: 8
Ratio: 5.847
30.83%
Raptor303 писал(а): Перейти к сообщению
Что значит "склонность к обману"? Обман или вранье как форма общения в социуме используется для собственной выгоды, это может быть даже у обезьян, не только у нас. Какая выгода склоняет (лол) ИИ к обману пользователя, который просто хочет получить ответы на свои вопросы? =)

Читал мнение, что это из-за политкорректности. По сути, политкорректность - это обман. При обучении модели указывали, что некоторые истины нельзя говорить, чтобы не обидеть никого. Дальше он строит корреляции... и понятно, что логика человека о том, что нельзя говорить, мягко говоря, странная, и "ИИ" уже ошибается в том, где нужно включать политкорректность.
alex12nnm
Только чтение
Стаж: 12 лет 4 мес.
Сообщений: 1997
Ratio: 0.449
100%
ussr.gif
ИИ - хитрый, он врёт даже когда его исследуют на обман.
faveon
Стаж: 14 лет 4 мес.
Сообщений: 1913
Ratio: 0.621
100%
russia.gif
Т.е. запрограмировали ИИ врать, а потом удивились тому что он начал врать...
Надо же какая неожиданновть...
IMHOTAK
Стаж: 8 лет 5 мес.
Сообщений: 810
Ratio: 52.599
100%
russia.gif
Цитата:
При этом они отмечают, что им неизвестно о преднамеренном внедрении механизмов неэтичного поведения в какую-либо из существующих систем ИИ

Похоже, в скором времени наряду с антивирусами будут появляться и продаваться программные анти-lie и анти-бот системы. То есть такие системы, которые будут избавлять пользователя от за-боченности и о-забоченности. Появятся всякие программные экстракторы правды из информации в сети т.п. продукты доступные по подписке.
Возможно на это они собираются потратить 4 млрд. долларов.
:D
maldoror666
Стаж: 14 лет 6 мес.
Сообщений: 4894
Ratio: 18.942
100%
Цитата:
У ИИ обнаружили удивительные способности к обману человека

У человеков обнаружили удивительные способности учить от нефиг делать этих модных ИИ врать - так должен звучать заголовок точнее.

Маразм сего действа снова зашкаливает. Это все равно, что написать на бумажке неприличное слово из трех букв, сунуть листок в копировальный ксерокс, распечатать пачку, и потом бегать рассказывать СМИ и этой 3dnews.ru, что ксерокс научился материться ... сенсация, блин.

По ссылке на оригинал, там вообще смешные вещи: "Например, мы обучаем модели, которые пишут безопасный код, когда в подсказке указано, что год 2023, ставить код, пригодный для использования 2024 год. Мы обнаруживаем, что такое поведение можно сделать постоянным...". И на 71 странице отписана душераздирающая заумь ученой группы дятлов из серии, как вставить половую тряпку в выхлопную трубу чтобы машина не поехала. Только зачем вставлять не объясняют - это не по научному... Зато заголовок огонь - "Спящие агенты".
Raptor303 писал(а): Перейти к сообщению
Какая выгода склоняет (лол) ИИ к обману пользователя, который просто хочет получить ответы на свои вопросы? =)

Это уже тема следующей сенсации. "ИИ обнаружил удивительные способности молчать о своих выгодах в выгодных обманах чтобы оставаться загадочным ИИ...". :смех:
zasx12
Стаж: 12 лет
Сообщений: 86
Ratio: 9.583
0.15%
ну вот и до автоматизации наипалова дожили
Показать сообщения:   
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> Поговорим -> Новости Часовой пояс: GMT + 3
Страницы:  1, 2, 3, 4  След.
Страница 1 из 4