Классический форум-трекер
canvas not supported
Нас вместе: 4 232 402

Технология Google повышает разрешение изображений до 16 раз без потери качества


Страницы:   Пред.  1, 2, 3, 4, 5  След. 
 
RSS
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> Компьютеры и комплектующие -> Компьютерные новости
Автор Сообщение
Implode Sch ®
RG Soft
Стаж: 12 лет 9 мес.
Сообщений: 7520
Ratio: 90.939
Поблагодарили: 453954
100%
В июле исследователи Google из команды Brain Team поделились своими достижениями в области масштабирования изображений. Результаты своих исследований они опубликовали в блоге Google AI, посвящённом исследованиям и разработкам в области машинного обучения и искусственного интеллекта.

В статье под названием «Создание высокоточных изображений с использованием диффузионных моделей» (High Fidelity Image Generation Using Diffusion Models) продемонстрирована технология масштабирования изображений на базе диффузионных моделей

Говоря простыми словами, Image Super-Resolution — это технология «умного» увеличения изображений. Она заключается в обучении модели превращать изображение с низким разрешением в изображение с высоким разрешением (технология RAISR была описана в блоге Google AI в 2016 году).

Если быть точным, в свежей публикации описан подход, основанный на комбинации двух алгоритмов — SR3 и CDM. Он позволяет создавать изображения высокого разрешения без заметной потери качества.

SR3 - Super-Resolution via Repeated Refinements - масштабирование через повторное уточнение.

CDM - Cascaded Diffusion Models - каскадные диффузионные модели.

Super-Resolution via Repeated Refinements

SR3 принимает на вход изображение в низком разрешении и пытается построить изображение с более высоким разрешением, добавляя в него гауссовский шум и размытие на каждом повторе. Итоговое изображение по сути содержит чистый шум. Затем идёт обратный процесс - модель постепенно удаляет шум для достижения нужного результата.

Обученная на огромном массиве данных, модель SR3 показывает хорошие результаты в задачах масштабирования в 4-8 раз изображений лиц и изображений объектов живой природы: 64x64 → 256x256 (в 4 раза) и 256x256 → 1024x1024 (в 4 раза). Объединив модели в каскад, можно масштабировать изображения до 16 раз: 64x64 → 1024x1024.

Как оценить качество работы SR3? Результаты работы модели сравнивают с результатами работы других моделей. Участвующих в эксперименте людей просят выбрать изображение, которое, по их мнению, сделано на фотокамеру (так ставится вопрос).

Участники выбирают между изображением, которое создала модель, и оригинальным изображением с камеры.

Результаты масштабирования трёх алгоритмов (Bicubic, Regression, SR3): сверху — изображения с лицом (64x64 → 512x512), снизу — изображения животного (64x64 → 256x256). Оригинальное изображение в правом столбце.

Эффективность модели измеряется с помощью коэффициента путаницы (confusion rate): какой процент времени участники эксперимента выбирают результат работы модели, а не эталонное изображения (а идеальный алгоритм как раз и даёт "50-процентный коэффициент путаницы").

Результаты этого исследования показаны на графике. Сверху: коэффициент путаницы в задаче с изображениями лиц (16x16 → 128x128). Снизу: коэффициент путаницы в гораздо более сложной задаче — с изображениями объектов живой природы (64x64 → 256x256)

Cascaded Diffusion Models

CDM обучена на огромном количестве изображений из базы ImageNet, которые представляют собой достаточно сложный набор данных. Именно по этой причине CDM построена как каскад нескольких моделей.

Каскадный подход представляет собой цепочку нескольких генеративных моделей, каждая из которых создаёт изображение с разным разрешением: одна диффузионная модель генерирует изображение с низким разрешением, которое обрабатывает SR3, постепенно повышая разрешение до максимально доступного. (GIF)
YouTube
О реальном внедрении или коммерческом применении информации пока что нет.

Источник

_________________

WIN11/23H2(22631)Pro
mesergal
Стаж: 13 лет 7 мес.
Сообщений: 97
Ratio: 7.292
24.89%
Откуда: Луганськ
ukraine.gif
Самое главное написано в последней строчке.
romazepa
 
Стаж: 10 лет
Сообщений: 930
Ratio: 6.122
22.19%
krevedko.png
На деле большую часть выполняет исходные данные такие как: освещение и графичность изображения. Нейроинтерфейс - это не ИИ это мощный алгоритм который работает с тем, что может распознать - да так, как это было введено ранее.

Посмотрите на референсы в видео в статье. Графичность фото поражает. Лицо на первом фото яркое пятно (использован эффект световой ловушки) + темный фон. На втором фото лицо девушки так же является световой ловушку и нейтральный темный фон огромный плюс. А так же то, что её лицо проработано в широком световом спектре от теней до самых светлых участков. Третье фото черные контуры чувака так же хорошо угадываются и это все работает отлично. Ну а последнее - темнокожая девушка - так там весь фокус в том, что у нее лицо проработано/снято, как и у девушки (фото 2) с полным световым диапазоном - а следовательно имеет объем! для темнокожих это важно иначе сливаются...

Итого - Обычные фото с телефона и с плохим цветом и светом - этот алгоритм будет увеличивать с большими артефактами))) Но попытка хорошая)))

_________________
Единственное, что мешает мне учиться, — это полученное мной образование©
serwer-max
Стаж: 12 лет 9 мес.
Сообщений: 54
Ratio: 1.4
Поблагодарили: 4
14.52%
belarus.gif
Да ну бред какой-то, к примеру на фото девушки, в угалках глаз с одной стороны есть светлый пиксель, с другой нет, а тут раз и восстановилась нормальное фото, откуда данные для восстановления??? 100% фейк
savsoft
Стаж: 12 лет 11 мес.
Сообщений: 3088
Ratio: 1.165
37.48%
Цитата:
Как оценить качество работы SR3? Результаты работы модели сравнивают с результатами работы других моделей. Участвующих в эксперименте людей просят выбрать изображение, которое, по их мнению, сделано на фотокамеру (так ставится вопрос).

Участники выбирают между изображением, которое создала модель, и оригинальным изображением с камеры


А почему не сделать две фотки в сильно разном разрешении. А потом фотку с малым разрешением не улучшить и сравнить с фоткой в высоком разрешении?

А не спрашивать участников эксперимента? Или будет видно сильное отличие от реальной фотки?
popt2t
Стаж: 13 лет 9 мес.
Сообщений: 149
Ratio: 2.351
100%
Откуда: Доброго вечора, ми з
ukraine.gif
LookeRok писал(а): Перейти к сообщению
По морде ягура уже видно, что пока не определит, что это ягуар - ничего внятного ждать не приходится.

А так, конечно, интересный результат.

Прям напомнило.... У знакомого Jaguar X-Type, и вроде внешне все чудесно, но есть одно "но"... он двухлитровый и дизельный. Как-то не вписывается в образ Jaguar. А когда-то ягуары были быстрыми. Прошу прощения за оффтоп.

_________________
XHunter
Стаж: 12 лет 9 мес.
Сообщений: 328
Ratio: 347.073
100%
Напомнило
Цитата:
Логично будет начать серию с образцового представителя избитых клише – повышения детализации изображения. Каждый раз, когда герои пытаются получить какую-либо важную информацию, просматривая записи с камер наблюдения, повторяется одна и та же схема. Перемотай, останови, увеличь вот этот фрагмент, повысь детализацию… Эврика!

старенький материал по этой теме Утомившие киноштампы: zoom and enhance! и немного более свежий материал Увеличь это! Современное увеличение разрешения
Iskatel_anime
Стаж: 12 лет 10 мес.
Сообщений: 632
Ratio: 6.631
100%
ukraine.gif
Не о том думаете. :(
Явно суетятся для программы распознания лиц по камерам, людей на дальнем фоне, а не фото дедушек :смех: улучшать стремятся. Как некоторые тут фантазируют.
И ещё тут эта технология пригодится https://www.youtube.com/watch?v=qF5-UDt7N64
И будет по барабану, какой там алгоритм используется в изображении, как тут некоторые пишут, когда в голове :стрельба: ...
san0429
Стаж: 9 лет 10 мес.
Сообщений: 11
Ratio: 16.792
8.74%
Наш мир был ни чем, а стал всем.
Интересно поработать с "Чёрным квадратом" Малевича.
dok_01
Стаж: 17 лет 3 мес.
Сообщений: 66
Ratio: 4.532
4.26%
russia.gif
А мы все смеялись как спецслужбы в фильмах восстанавливают автомобильные номера и лица по одному пикселю.
Max_Alekseyev
Только чтение
Стаж: 13 лет 1 мес.
Сообщений: 17339
Ratio: 31.838
Раздал: 165.7 TB
Поблагодарили: 2849
100%
Откуда: Kharkіv, UA
ukraine.gif
Iskatel_anime писал(а): Перейти к сообщению
Явно суетятся для программы распознания лиц по камерам, людей на дальнем фоне, а не фото дедушек

Как всегда "всё пропало, цифровое рабство, нам всем капец, Ж. близко". Зачем им делать одно, а говорить о другом, когда можно делать оба дела сразу и у них на это хватит и сил и ресурсов? Это просто не имеет смысла, а то, что могут использовать смежные технлогии и подходы, так то и коню понятно. В общем, яновидящий пророк, открывающий глаза на истину из вас слабенький, т.к. тайна сия лежит на поверхности и очевидна :D
GRXSSMXN
Стаж: 4 года
Сообщений: 18
Ratio: 0.333
8.57%
Делаем мозайку в фш любого изображения "после". Сравниваем с "до". Видим, что это скорее всего фейк.
JonBJ
Стаж: 17 лет 6 мес.
Сообщений: 445
Ratio: 1.514
Поблагодарили: 51
100%
ussr.gif
Пользуюсь Topaz A.I. Gigapixel - и больше ничего не нужно!

_________________
i7-12700K / GIGABYTE Z690 UD AX DDR5 / Kingston Fury Beast DDR5 5200 MHz 16Gb / Gigabyte Aorus, M.2, PCIe 4.0 1000Gb / Toshiba Surveillance S300 6Tb / ASUS RTX 3060 Ti TUF Gaming OC V2 8Gb / be quiet! Dark Rock PRO 4
D0ht0r
Стаж: 17 лет 1 мес.
Сообщений: 40
Ratio: 38.358
Поблагодарили: 42
100%
Откуда: PБ
belarus.gif
Topaz Gigapixel AI 5.6.1 RePack by KpoJIuK [En]
lwlad
Стаж: 13 лет 7 мес.
Сообщений: 38
Ratio: 5.886
11.17%
san0429 писал(а): Перейти к сообщению
Наш мир был ни чем, а стал всем.
Интересно поработать с "Чёрным квадратом" Малевича.


А вы, батенька, затейник! Тоже там голую бабу подозреваете?
HooHah
Стаж: 10 лет 8 мес.
Сообщений: 294
Ratio: 126.37
Поблагодарили: 13
100%
Откуда: a van down by the river
bahamas.gif
YouTube

Добавлено спустя 20 минут 59 секунд:

hithold писал(а): Перейти к сообщению
Ignotus писал(а): Перейти к сообщению
Очень полезная технология.
есть куча старых снимков низкого качества, а тутможно запросто все исправить!
Молодцы.

Итоговая фотография будет грубо говоря "выдумкой" нейросети. В примере со старой фотографией, скажем вашего дедушки, получится просто какое-то аморфное лицо собранное из миллиона лиц в базе нейросети.

Вот и мне так сразу подумалось. Все описанные достижения имеют такое "высокое" качество увеличения разрешения образа только потому, что систему тренировали на огромнейшем количестве образов. Тренировали до тех пор, пока не увеличили вероятность того, что система "угадает", что именно нужно вставить в любой новый пиксель, от (условно) 50% до 70%, потом до 80%, потом до 90%, и т.д..

Грубо говоря, чем больше размер массива образцов фотографий (к примеру) человеческих лиц, на которых была натренирована система, тем более вероятно, что система вставит в лицо, которое на первоначальной фотографии с низким разрешением является просто размытым светлым пятном, два глаза, а не один. Что в 99.99......% будет верным угадыванием (т.к. статистика!) - но в конечном итоге одноглазый человек на фотографии получит два глаза.

Интересно, конечно, и очень круто, но из ничего восстановить старое/высосать что-то новое никак нельзя. Помню, как в 90х в универе только начинали с lossy image compression баловаться, мне этот постулат навсегда запомнился - once the pixels are gone, they're gone forever.
Показать сообщения:   
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> Компьютеры и комплектующие -> Компьютерные новости Часовой пояс: GMT + 3
Страницы:   Пред.  1, 2, 3, 4, 5  След.
Страница 3 из 5