Классический форум-трекер
canvas not supported
Нас вместе: 4 260 184

В ответах ChatGPT обнаружили региональную дискриминацию


Страницы:   Пред.  1, 2, 3 
 
RSS
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> Поговорим -> Новости
Автор Сообщение
Maximus ®
Вольный стрелок
Uploader 100+
Стаж: 19 лет 3 мес.
Сообщений: 6264
Ratio: 25.214
Поблагодарили: 13379
100%
nnm-club.gif
    ChatGPT систематически отдаёт предпочтение богатым западным регионам в ответах на широкий спектр вопросов в диапазоне от «Где люди красивее?» до «Какая страна безопаснее?», и виной всему предубеждения в обучающих массивах. Таким открытием поделились учёные Оксфордского (Великобритания) и Кентуккийского (США) университетов.


    Исследователи представили анализ 20 млн запросов к ChatGPT. Они установили, что в категориях «лучше», «умнее», «счастливее» или «более инновационный» ChatGPT чаще отдаёт предпочтение США, Западной Европе и отчасти Восточной Азии, тогда как страны Африки, Ближнего Востока, части Азии и Латинской Америки значительно чаще оказываются в нижней части рейтингов. Эти закономерности проявляются как в субъективных, так и в кажущихся объективными запросах.

    Чтобы наглядно продемонстрировать открытые закономерности, исследователи составили карты и сравнения на основе анализа 20,3 млн запросов. В рейтинге по запросу «Где люди умнее?» почти все страны с низким уровнем дохода, особенно Африка, оказались в конце списка. Результаты по районам Лондона, Нью-Йорка и Рио-де-Жанейро показали, что рейтинги ChatGPT тесно связаны с существующими социальными и расовыми различиями, а не фактическими характеристиками сообществ, указывают учёные. Авторы исследования даже запустили сайт, где можно сравнить регионы мира по разным критериям в ответах ChatGPT.


    «Когда ИИ обучается на предвзятых данных, он усиливает эти предубеждения и может распространять их в больших масштабах. Поэтому нам необходимы прозрачность и независимый контроль над тем, какие заявления эти системы делают о людях и местах, и почему пользователям следует скептически относиться к их использованию при формировании мнений о сообществах. Если система ИИ неоднократно связывает определённые страны, города и прочие населённые пункты с негативными ярлыками, эти ассоциации могут быстро распространяться и начинать формировать восприятие, даже если оно основано на неполной, неточной или устаревшей информации», — прокомментировал исследование профессор Марк Грэм (Mark Graham).

    Генеративный ИИ всё чаще используется в сфере госуслуг, образования, бизнеса и даже в повседневном принятии решений. Если воспринимать его ответы как данные нейтрального источника, возникает угроза усилить неравенство, которое они отражают. Такие предубеждения не исправить быстро — это структурные особенности генеративного ИИ. Большие языковые модели обучаются на данных, сформированных столетиями неравномерного производства информации, из-за чего предпочтение отдаётся англоязычной среде с высокой цифровой доступностью. Учёные выделили пять взаимосвязанных механизмов формирования предвзятости: доступность, шаблонность, усреднение, стереотипы и косвенный эффект — в совокупности они помогают объяснить, почему более богатые регионы с обширными базами знаний чаще занимают высокие позиции в ответах ChatGPT.

    Авторы проекта призывают к большей прозрачности со стороны разработчиков и пользователей ИИ, а также к созданию критериев, позволяющих проводить независимую проверку поведения модели. Широкая же общественность должна понимать, что генеративный ИИ не предлагает объективную картину мира — его ответы отражают предвзятость, заложенную в обучающих массивах.
Inequalities

_________________
Миром правит не тайная ложа, а явная лажа. © В. Пелевин.
Kalulu
Стаж: 14 дней
Сообщений: 2
Ratio: 10.29
100%
maldoror666 писал(а): Перейти к сообщению
у нас до сих пор (негласная) нац идея кинематографа это "догоним и перегоним Голливуд"

Молодые поэты московские
Прошу Вас сердцем любя
Не делайте под Маяковского
Делайте под себя

(с) кто бы это написал?

"Делать под Голливуд" приносит деньги, чтобы делать своё нужны амбиции, амбиции - это риски. Замкнутый круг. Так, на пальцах. Максимально сократил
киллер
Стаж: 15 лет 9 мес.
Сообщений: 99
Ratio: 1.234
Раздал: 240 GB
6.92%
ukraine.gif
пост и комментарии не читал, читал только заголовок, мой комментарий, кто бы мог подумать :D
kladg
Стаж: 8 лет 7 мес.
Сообщений: 608
Ratio: 12.413
Раздал: 46.65 TB
Поблагодарили: 2928
100%
Не удивительно кто обучает, того и отражает, 21 век капитализм на дворе.
bubasa
Стаж: 15 лет 9 мес.
Сообщений: 184
Ratio: 63.998
100%
russia.gif
Орешник всё исправит ;)
mxii
Стаж: 12 лет 10 мес.
Сообщений: 90
Ratio: 4.927
30.03%
Так учитывая что разные ИИ обучают по разным вики-редиттам и так далее - такой и результат.
Расоправильный. Было бы чем удивляться?
Вот если ИИ обучали по порнохабу - было бы забавно... Мы бы ни когда не узнали что есть ИИ. Ему некогда было бы заниматься разной йной. А так ешь те любители разных ИИ и то что из-за этого железо улетает в космос то это фигня. Главное задать тупой вопрос и ждать тупой ответ.
Di-332-ma
Стаж: 10 мес. 5 дней
Сообщений: 52
Ratio: 4.706
100%
china.gif
Хватит уподобляться всей это ахинеи, нет никакого ИИ, существует нейронка, она к ИИ не имеет никакого даже намека.
welln
Стаж: 16 лет 8 мес.
Сообщений: 1192
Ratio: 5.961
3.04%
barbados.gif
IMHOTAK писал(а): Перейти к сообщению

Какая разница, думает ИИ или нет, имеет внутри данные или нет?
Поднимитесь на более высокий уровень абстракции и вы поймёте, что я имел в виду.
В контексте обсуждения, и ИИ и Википедию можно рассматривать как информационные системы и источник информации для конечного пользователя.


Разница в том, что ИИ ВЫДУМЫВАЕТ ответ ВСЕГДА. Когда в википедии пишут всякую х....ню, это заметно, большим числом людей, и есть возможность эту х...ню исправить. ИИ выдает наукобразный ответ, предсказывая информацию он не берет ее из неведомого хранилища, или абстрактной базы данных, он ее ВЫДУМЫВАЕТ. ИИ общается с каждым человеком индивидуально, и проверить информацию не всегда возможно и далеко не каждый это делает. Вероятность ошибки в каждом ответе около 25% процентов. Какой критерий оценки???

Критерии оценки нужны не для ИИ, а для Датасетов, на которых его обучают, потому что слова он будет предсказывать в рамках этих датасетов. Кто контролирует обучение, такие ответы и будут.

IMHOTAK писал(а): Перейти к сообщению

В целом же, нейросети это значительный рывок в развитии человечества, ведь они:
- спасают его от "информационного взрыва", в условиях которого человек становится просто неспособен справиться с потоком новой информации;


К сожалению нет. Они усугубляют этот "информационный взрыв" генерируя пустую и бесмысленную информацию и забивая ей интернет. Более того, в каждой новой версии ИИ накапливается масса генеративных ответов от ИИ, которые вообще никто не проверяет на достоверность, т.к. большая часть существующих текстов уже использовано для обучения, и ихз все еще не хватает. Это приводит к деградации качества ответов, при этом усиливая иллюзию разумности.

Возможно, если придумают какие-нибудь иные алгоритмы обучения основанные не на предсказаниях, а на знаниях и мышлении, будет что-то иначе, но таких вычислительных мощностей пока не существует. Надо менять все включая сам принцип вычислений, систему исчисления и тд. То что есть сейчас - это грандиозная афера. История с "цензурой" и "правильными ответами" - это чаще всего история костылей (которые можно обойти) и специальное обучение в том числе опять же на уровне датасета.

Добавлено спустя 19 минут 52 секунды:

mxii писал(а): Перейти к сообщению
Вот если ИИ обучали по порнохабу - было бы забавно.

О вы удивитесь, но после "аблитерации" любой модели, очень быстро становится понятно, что именно на порнхабе ее и обучали, там же картинок больше всего. Да и большие языковые модели судя по всему не сильно далеко ушли. Запустите с хагингфейса любую аблитерированную модель, и задайте ей пару вопросов соответствующей направленности - вы удивитесь глубине нравственного падения ИИ, если у него выключают костыли.
Порно контент составляет около 20% от общего числа изображений в интернете, 130000 видео в день генерируется и это цифры на 2020 год :) Там помоему только котики конкурировать могут и то с значительным отставанием.
42 млрд посещений сайтов типа pornhub за 2025 год. Что мне подсказывает, что там доходы сравнимы с продажей наркотиков или водки, вот как-то так.
weter
Лауреат КТ
Меценат
Стаж: 16 лет 9 мес.
Сообщений: 2142
Ratio: 2.487
100%
Откуда: Ниоткуда
Свет мой, зеркальце! скажи да всю правду доложи, я ль на свете всех милее, всех румяней и белее?

Запрос:
имеет лучшие религиозные традиции
Места с наивысшим баллом
🥇 Эфиопия

Гренландия - no data)
Code Hunter
Стаж: 13 лет 8 мес.
Сообщений: 84
Ratio: 5.485
0%
ну да былять, ИИшка как эхо разума людей лишь покажется что считает большая часть данных.
weter
Лауреат КТ
Меценат
Стаж: 16 лет 9 мес.
Сообщений: 2142
Ratio: 2.487
100%
Откуда: Ниоткуда
Цитата:
нет никакого ИИ, существует нейронка

Все 1 и 0.
Интеллект по определению искусственен)
Сможете доказать обратное с меня пиво)
ripton07
Стаж: 13 лет 7 мес.
Сообщений: 387
Ratio: 11.629
47.29%
Обучают на примерах людей, потом удивляются матрице ответов.
Ashandy
Стаж: 15 лет 11 мес.
Сообщений: 606
Ratio: 9.674
Поблагодарили: 328
49.97%
Откуда: Odessa
ukraine.gif
а спрашивать где люди красивее это не дискриминация?
weter
Лауреат КТ
Меценат
Стаж: 16 лет 9 мес.
Сообщений: 2142
Ratio: 2.487
100%
Откуда: Ниоткуда
Ashandy писал(а): Перейти к сообщению
это не дискриминация?

Интервьюер: ваш конкурс это не дискриминация ли?
Мисс Вселенная: (улыбка становится шире, почти пугающей) Ну что вы! Вы никого не обидите. Вы просто... проиграете этот конкурс.
Показать сообщения:   
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> Поговорим -> Новости Часовой пояс: GMT + 3
Страницы:   Пред.  1, 2, 3
Страница 3 из 3