Классический форум-трекер
canvas not supported
Нас вместе: 4 232 128

Отличия Скана с OCR от Ebook на примере PDF


 
 
RSS
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> О книгах и не только
Автор Сообщение
Игорь-Вал​ерьевич​ ®
Сталкер, Спонсор, Реставратор Клуба
 
Стаж: 13 лет
Сообщений: 3934
Ratio: 43.249
Поблагодарили: 143108
100%
В данной теме описано отличие Скана с OCR от Ebook на примере PDF.
Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные — последовательность кодов, использующихся для представления символов в компьютере (например, в текстовом редакторе).
Скан с OCR - это оригинальный скан с подложенным слоем распознанного текста (с ошибками или без)
Ebook - это, как правило, либо изначально цифровое издание либо вычитанный OCR, но уже без слоя-скана.

Рассмотрим подробнее на примере книги Дениса Колисниченко "Microsoft Windows 8. Первое знакомство" Думаю, что преимущество ebook неоспоримо. Скан всегда видно при максимально приближении, грани букв будут неровными, даже если на него наложили слой OCR.

Так же хороший пример различий Ebook от Скана с OCR
pavekk
Стаж: 16 лет 2 мес.
Сообщений: 26
Ratio: 8.256
Поблагодарили: 15
63.24%
Может всё таки зависит от скана книги , не?
Игорь-Вал​ерьевич​ ®
Сталкер, Спонсор, Реставратор Клуба
 
Стаж: 13 лет
Сообщений: 3934
Ratio: 43.249
Поблагодарили: 143108
100%
pavekk
Что зависит?
serpentarius
Стаж: 13 лет 9 мес.
Сообщений: 217
Ratio: 4.653
Поблагодарили: 539
100%
Цитата:
Скан всегда видно при максимально приближении, грани букв будут неровными, даже если на него наложили слой OCR.

Если OCR под изображением, то его (OCR) видно не будет, как бы вы не увеличивали. Будет казаться что это просто обычный скан. А я именно так сканы сохраняю и другим рекомендую.

Понять можно только при выделении, и то, в зависимости от использованного приложения и защиты документа оно может реализовываться по разному. А вообще я данную тему подробно затрагивал в своей книге "Книга 3.0 Слушайте!" в разделе "Зачем и как распознавать книги?" которую все не как у меня не удается выложить на данном ресурсе.
qzerss
Реставратор Клуба
Помощник модераторов Книг
Стаж: 13 лет 4 мес.
Сообщений: 2058
Ratio: 676.457
Поблагодарили: 64972
100%
nnm-club.gif
serpentarius писал(а): Перейти к сообщению
Если OCR под изображением, то его видно не будет, как бы вы не увеличивали.

В данной теме разъясняют как различить скан от электронки.
В конкретном примере затронут скан со слоем - но ударение темы идет о СКАНЕ книг.
Теперь покажите мне на примере, какой скан при увеличении 3200 даст результат которого видно не будет.
Я же вам покажу пример электронки увеличенной в 2 раза (чем я у вас прошу)
А то как и зачем распознавать - методы и способы - это уже другая тема и другой разговор (который здесь затрагивать не будем, эта тема о другом)

А каким способом ещё можно узнать о качестве книги, я объяснял в этой теме - Определяем качество книги в формате PDF - скан, OCR, e-book
serpentarius писал(а): Перейти к сообщению
А вообще я данную тему подробно затрагивал в своей книге "Книга 3.0 Слушайте!"

Так в чем же проблема - неужели так тяжело заполнить поля в релиз-визарде и выложить свой труд на оценку критиков?
Здесь модераторы хорошие и отзывчивые люди - всегда помогут и подскажут что надо.
Дерзайте!.
:подмигивание:
P.S. - только увидел что вы её уже зарелизили. Ну вот и отличненько.
Показать сообщения:   
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> О книгах и не только Часовой пояс: GMT + 3
Страница 1 из 1