Классический форум-трекер
canvas not supported
Нас вместе: 4 071 225
loading...

Отличия Скана с OCR от Ebook на примере PDF


 
 
RSS
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> О книгах и не только
Автор Сообщение
Игорь-Вал​ерьевич​ ®
Сталкер, Спонсор, Реставратор Клуба
 
Стаж: 8 лет
Сообщений: 3939
Ratio: 43,249
Поблагодарили: 133965
100%
В данной теме описано отличие Скана с OCR от Ebook на примере PDF.
Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные — последовательность кодов, использующихся для представления символов в компьютере (например, в текстовом редакторе).
Скан с OCR - это оригинальный скан с подложенным слоем распознанного текста (с ошибками или без)
Ebook - это, как правило, либо изначально цифровое издание либо вычитанный OCR, но уже без слоя-скана.

Рассмотрим подробнее на примере книги Дениса Колисниченко "Microsoft Windows 8. Первое знакомство"
Думаю, что преимущество ebook неоспоримо. Скан всегда видно при максимально приближении, грани букв будут неровными, даже если на него наложили слой OCR.

Так же хороший пример различий Ebook от Скана с OCR
pavekk
Стаж: 11 лет 3 мес.
Сообщений: 26
Ratio: 7,965
Поблагодарили: 12
100%
Может всё таки зависит от скана книги , не?
Игорь-Вал​ерьевич​ ®
Сталкер, Спонсор, Реставратор Клуба
 
Стаж: 8 лет
Сообщений: 3939
Ratio: 43,249
Поблагодарили: 133965
100%
pavekk
Что зависит?
serpentarius
Стаж: 8 лет 10 мес.
Сообщений: 149
Ratio: 30,807
Поблагодарили: 325
100%
Цитата:
Скан всегда видно при максимально приближении, грани букв будут неровными, даже если на него наложили слой OCR.

Если OCR под изображением, то его (OCR) видно не будет, как бы вы не увеличивали. Будет казаться что это просто обычный скан. А я именно так сканы сохраняю и другим рекомендую.

Понять можно только при выделении, и то, в зависимости от использованного приложения и защиты документа оно может реализовываться по разному. А вообще я данную тему подробно затрагивал в своей книге "Книга 3.0 Слушайте!" в разделе "Зачем и как распознавать книги?" которую все не как у меня не удается выложить на данном ресурсе.
qzerss
Реставратор Клуба
Помощник модераторов Книг
 
Стаж: 8 лет 5 мес.
Сообщений: 1726
Ratio: 613,991
Поблагодарили: 55335
100%
nnm-club.gif
serpentarius писал(а): Перейти к сообщению
Если OCR под изображением, то его видно не будет, как бы вы не увеличивали.

В данной теме разъясняют как различить скан от электронки.
В конкретном примере затронут скан со слоем - но ударение темы идет о СКАНЕ книг.
Теперь покажите мне на примере, какой скан при увеличении 3200 даст результат которого видно не будет.
Я же вам покажу пример электронки увеличенной в 2 раза (чем я у вас прошу)
А то как и зачем распознавать - методы и способы - это уже другая тема и другой разговор (который здесь затрагивать не будем, эта тема о другом)

А каким способом ещё можно узнать о качестве книги, я объяснял в этой теме - Определяем качество книги в формате PDF - скан, OCR, e-book
serpentarius писал(а): Перейти к сообщению
А вообще я данную тему подробно затрагивал в своей книге "Книга 3.0 Слушайте!"

Так в чем же проблема - неужели так тяжело заполнить поля в релиз-визарде и выложить свой труд на оценку критиков?
Здесь модераторы хорошие и отзывчивые люди - всегда помогут и подскажут что надо.
Дерзайте!.
:подмигивание:
P.S. - только увидел что вы её уже зарелизили. Ну вот и отличненько.
Показать сообщения:   
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> О книгах и не только Часовой пояс: GMT + 3
Страница 1 из 1