Классический форум-трекер
canvas not supported
Нас вместе: 4 244 888

Электронные книги своими руками - вопросы и ответы


Страницы:   Пред.  1, 2, 3, 4, 5, 6  След. 
 
RSS
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> О книгах и не только
Автор Сообщение
Val ®
Стаж: 17 лет 7 мес.
Сообщений: 4961
Ratio: 76.835
Раздал: 33.39 TB
Поблагодарили: 51369
100%
Откуда: СПб
В этой теме, как Вы, наверно поняли, будем делиться опытом создания электронных книг и решать возникающие при этом проблемы.
r_sasha
Стаж: 16 лет 10 мес.
Сообщений: 4449
Ratio: 2412.597
Поблагодарили: 45474
100%
Откуда: СССР
ussr.gif
Val47 писал(а):
На супчик хватит

Даааа :лол:
твои предложения что то я не вижу их =)

_________________
Лишь время показывает кто любит....кто ненавидит...кто друг...кто враг...а кто вообще просто так....
Rafaell
Библиотекарь Клуба
Стаж: 17 лет 5 мес.
Сообщений: 4851
Ratio: 14.771
Поблагодарили: 41339
100%
Откуда: планета Земля
Мдяяяя
Нафлудили однако.

Давайте конкретизировать.

Итак этапы создания электронной книги (независимо от конечного формата).
1. Сканирование
2. OCR (для случаев получения редактируемого текста)
3. Создание электронного документа (в одном из форматов)
4. Корректирование документа (в случаях работы с редактируемым текстом - вычитка, а также коррекция исходных данных о документе)

Сюда я бы также добавил два дополнительных пункта
5. Хранение документа (имеются в виду не носители, а софтверные системы орагнизации коллекций документов)
6. Чтение (софт для различных устройств и ОС)

Вот давайте с этого и отталкиваться, а не забрасывать друг друга ссылками.

Я вижу, что тут собралось много любителей pdf и djvu. Но извините ребята, все это не для художественной литературы и не для хранилищ со строгими библиографическими правилами.

_________________
r_sasha
Стаж: 16 лет 10 мес.
Сообщений: 4449
Ratio: 2412.597
Поблагодарили: 45474
100%
Откуда: СССР
ussr.gif
1. Сканирование
* Как сканировать и какими программами.
* Как сканировать форматы А3 и выше.
* В каких форматах лучше всего сканировать.

_________________
Лишь время показывает кто любит....кто ненавидит...кто друг...кто враг...а кто вообще просто так....
Rafaell
Библиотекарь Клуба
Стаж: 17 лет 5 мес.
Сообщений: 4851
Ratio: 14.771
Поблагодарили: 41339
100%
Откуда: планета Земля
r_sasha писал(а):
1. Сканирование
* Как сканировать и какими программами.
* Как сканировать форматы А3 и выше.
* В каких форматах лучше всего сканировать.


Сейчас спциалисты по DjVu буду кидать в меня шапками, когда я раскрою им свою страашную тайну.
И вот она:

Как я сканирую любые форматы?
Для начала нужно взять свой красивый и дорогой сканер и отнести его на свалку.
Далее купить штатив - треножник для цифрового фотика, но не простой, а у которого головка наклоняется на угол 90 градусов.
Далее ставим стул. КЛадем на него кусок чего нибудь плоского и твердого. Берем настольную лампу, а лучше фотософит и хорошо и равномерно освещаем поверность.
Далее зажимаем страницы книги чем-нибудь тяжелым по краям. Зумом добиваемся как можно более полного попадания страницы без лишних деталей и не устанно жмем на пуск (либо на дистанционку фотика, у кого она есть).
Качество изображения при своих 8 мегапиксела я ставлю на максимум, цветность в грйскейл не выставля, ибо это делается компьютером.
Вот теперь прикиньте с какой скоростью я сканирую книгу? В общем 100 листов это менее 50 разворотов ну плюс обложки для гурманов.
ФОрмат сами понимаете зависит только от зума и/или высота фотоаппарата над листом.

Еще раз повторюсь. Умных книжек я не читал и свою технологию сам отрабатывал для себя самого.

Программу я использую как раз ту самую которую все забраковали.
А именно Fine Reader 8. Работает она у меня без проблем. Некоторые буквы корежатся, но текст я потом дополнительно просматриваю под Open Office, который кстати имеет у меня мааааааленький прибамбас, позволяющий делать конвертирование текста прямо FB2.
Но это уже другая история.

На счет картинок - для FB2 как правило нуно только обложка. Тут конечно достаточно иметь простого jpg. Причем как можно сильнее ужатого, ибо читать на КПК или iPhone книгу с гигантскими иллюстрациями неудобно.

Иногда нужно всталять картинки в середину текста. Есть книги с таблицами (FB2 таблицы корежит и есть только один способ - графика) и иногда иллюстрациями, важными в тексте. Для FB2 все файлы-картинки делаются отдельно, а потом вставляются в тело документа. Расскажу потом как.

Ну что?
Я ответил на ваши вопросы???

_________________
ДИМОН!!!
RG Авто
Стаж: 17 лет 3 мес.
Сообщений: 284
Ratio: 744.747
Поблагодарили: 10626
100%
Откуда: Москва
russia.gif
+1 аналогично поступаем на работе, если надо в цифровой вид какой нить чертеж перевести, фотоаппарат под мышку и вперед:)

_________________
"У действительно хороших водителей мухи расплющены об боковые стёкла" © Вальтер Рёрль
r_sasha
Стаж: 16 лет 10 мес.
Сообщений: 4449
Ratio: 2412.597
Поблагодарили: 45474
100%
Откуда: СССР
ussr.gif
Rafaell
Цитата:
OCR (для случаев получения редактируемого текста)

по подробней можно =)

_________________
Лишь время показывает кто любит....кто ненавидит...кто друг...кто враг...а кто вообще просто так....
Kalex
Администратор
Стаж: 17 лет 3 мес.
Сообщений: 45603
Ratio: 128.322
Поблагодарили: 15204
100%
nnm-club.gif
Вот вам всем заинтересованным и первое пионерское задание :) Школа Конфуция | Китайский язык [2008] [TIFF]
Исходник - великолепнейший!
Сделать из этого монстра человеческий релиз, просто в DjVu качественно перегнать, или ещё какой-то формат удобный для чтения.

_________________
NNMClub и IPv6/Teredo
snowbody
Стаж: 16 лет 11 мес.
Сообщений: 367
Ratio: 9.803
Поблагодарили: 382
36.47%
Откуда: Симферопо​ль.Крым.U​A​
ukraine.gif
2all топик живет и это здорово. Странно, что тема не поднималась раньше. Хотелось бы побольше личного опыта, а не отсылкам к общеизвестным источникам...
Есть вопросы:
1. Кто нибудь пользовался программой "Djvu Editor Pro". Какие мнения об этой тулзе. У меня лично не получилось добиться сколь-нибудь приемелемого качества? Тут есть хоть какие-то настройки, в отличие от DjVu Solo где настраивать вообще нечего.
2. По поводу этих самых настроек. Чем отличаются профили Нормальный, Электронный, Фотография, Черно-белый, Рукопись, Рисунок и Карта а так же качество текста (без потерь, почти без потерь, нормальный, консервативный, с потерями, консервативный) при сохранении документа? Мои изыскания не дали сколь-нибудь отличимых результатов.
3. И последнее: чем меньше я ставлю dpi, тем "качественее" (если тут вообще можно говорить про качество) получается картинка. так и должно быть?

_________________
GB P35-DS3L/C2D E6750 2.66GHz/2x2048MB/SP250+SP750Gb/GeForce 8800GTS 640Mb/Win7 Ult.
forest_man
Стаж: 17 лет 1 мес.
Сообщений: 629
Ratio: 40.771
Поблагодарили: 47464
100%
Откуда: Киев
ussr.gif
snowbody
Пользовался разными версиями Djvu Editor Pro (5-6), что могу сказать программа нужна для редактирования в основном в ней используется функция добавить/убрать отдельно отсканированные цветные иллюстрации или пропущенные при сканировании страницы интегрируя их в готовый файл-проект, можно добавлять ссылки - создавать интерактивное содержание и др. функции.

Думаю стоит более детально остановится на первоначальном этапе сканирования - какой лучше сканер или фотокамеру использовать.
Я могу говорить только о сканерах.
На что надо ориентироваться приобретая сканер:

1. Удобный интерфейс
2. Скорость сканирования разворота книги*
3. Полученный результат - качественный оттиск-скан

*Должна быть не более 8-12 сек. при разрешении 400 dpi, режим серый.

Главная проблема при сканировании переплет - получается искажение текста и тень.
Как с этим бороться
1. Класть на сканируемую книгу сверху увесистый том, так чтобы книга как можно ближе прилегала в области переплета к стеклу сканера.
2. При покупке сканера поинтересуетесь нет ли у него подсветки, данная функция избавит вас от необходимости использовать гнет и снизит затраты времени на редактирование изображений.

При сканировании используются такие программы - IrfanView или XnView - функция пакетное сканирование - задаются параметры - имя/папка/формат.

Сохранять сканированные оттиски лучше в TIFF и BMP форматах.
Разрешение 300-400 dpi оптимально для книг без иллюстраций в режиме серый с иллюстрациями больше 300 dpi в цвете.

Готовые сканы прежде чем конвертировать следует обрезать - убрать лишние поля, для этого незаменима программа - ScanKromsator 5.91 она автоматически намечает границы и резаками отсекает все лишнее.

Для конвертации в Djvu есть специальная утилита - DjVu Small 0.3.3

Уважаемый snowbody затронул тему режимов кодирования отвечаю -
используются следующие - Нормальный или Scanned (300dpi) прежде всего для конвертации книг содержащих только текст.
Фотография - Photo дает наиболее качественный результат в книгах с иллюстрациями и текстом.
Другие режимы вообще не используются или очень редко.

Rafaell

По поводу читалок - для чтения PDF и Djvu - есть богатый выбор WinDjView 0.5, DjvuReader
STDU viewer
- читает PDF и Djvu есть и другие программы.
Для текстовых форматов - ICE Book Reader Professional

r_sasha спрашивал
Что такое OCR?

Цитата:
Оптическое распознавание символов (англ. Optical Character Recognition, OCR) — механическая или электронная конвертация изображений символов и букв в текст, редактируемый на компьютере. Перевод осуществляется программным путём, после получения изображения со сканера или фото.

Текст, преобразованный из графической формы в символьную (текстовую), можно далее обрабатывать любыми текстовыми редакторами.

Материал из Википедии — свободной энциклопедии


Советую использовать программу ABBYY FineReader 9 она позволяет сканировать и распознавать текст с использованием словарей, в ней есть встроенный редактор проверки отсканированного материала и конвертация в необходимый формат - doc, rtf, txt и др.

Редактировать, вычитывать тексты можно также такими программами - Hieroglyph 3.7 или OpenOffice.org 3.

Надеюсь, что данные рекомендации помогут тем, кто хочет создать качественную электронную книгу.
Rafaell
Библиотекарь Клуба
Стаж: 17 лет 5 мес.
Сообщений: 4851
Ratio: 14.771
Поблагодарили: 41339
100%
Откуда: планета Земля
forest_man
Читалки-читалками, но я предпочитаю FB2, во первых изза его размера во вторых изза возможности его библиографиеского хранения.
Для качественного сканирования безулсовно нужен хороший сканер, но для быстрого изготовления книги остаточно иметь фотоаппарат, так как работает он неизмеримо быстрее. И не нужно бесконечно открывать и закрывать крышку, что замедляет работу.

Для OCR я лично использую Fine Reader 8. Проблем с ним ни разу не испытывал.

Перед тем, как начать сканирование все полученные с фотоаппарата снимки в JPG (помним про 8 мегапикселей) пакетно конвертируем в вариант grayscale. Пакетная конвертация возможно кучей программ, в том числе ACDSее или бесплатным FastStone, думаю на них останавливаться не имеет смысла. Главное конвертировать не усменьшая колчиества dpi.

Все картинки вгружаем в Fine Reader и пакетно распознаем.
В случае если в тексте есть таблицы или нужная книге графика - вырезаем это и зажимаем в как можно меньший размер, помня о размере экрана КПК.

Проверяем каждый лист на предмет ошибок, там где Fine Reader их покажет. Эти ошибки сопоставляем его средствами с изображениями и все исправляем.

Далее текст отправляем в OOO Writer.
Смотрим еще раз ошибки уже с использованием словаря OOO (вероятно его придется скачать отдельно). Также форматируем на предмет абзацев (там где это не произошло автоматически).
Обязательно форматируем так, чтобы были четко видны части и главы, а также пропуски строк. Это пригодиться потом при формировании FB2.
На этом этапе картинки и таблицы не вставляются.

Ссылки на софт указанный в тексте: Дальше расскажу как перегонять в FB2.

_________________
snowbody
Стаж: 16 лет 11 мес.
Сообщений: 367
Ratio: 9.803
Поблагодарили: 382
36.47%
Откуда: Симферопо​ль.Крым.U​A​
ukraine.gif
2forest_man: Огромное спасибо. Согласен с тем что надо начинать с азов, тобишь с перевода книги в цифру сканированием или фотографированием. Какие форматы и разрешения для каких видов информации лучше использовать. Понятно что доступные обывателям сканеры в общей массе не отличаются друг от друга, но может есть и исключения. А также софт. Кто нибудь юзает утилиту VueScan?

Если я правильно понял, то при таких исходных данных: есть книга с цветной обложкой, часть страниц простой текст, часть тоже черно-белые аннотированные иллюстрации.
мы имеем следующую картину:
1. Обложку сканируем в .BMP, остальную часть можно в черно-белом .TIFF или .PNG, что сократит объем файло.
2. Обрабатываем ScanKromsator. Я лично с прогой этой не работал. Использую фотошоп и подгоняю страницы, используя направляющие (трудоемко, зато ручная работа...).
3. Затем части обрбатываем по отдельности в Djvu Editor Pro. Для обложки и черно-белых аннотированных иллюстрации используем профиль Photo. Для текста Scanned/Normal. При этом все части, даже если это единственная страница, должны быть сохранены в DjVu. Т.к. При добавлении хотя бы одного не DjVu файла придется зановоко указывать профиль для всего результирующего документа.
4. Здесь же в Djvu Editor Pro все наши сохраненные по отдельности DjVu-шки собираем в одну книгу.

Провел несполько эксперементов. Вот что имеем в Djvu Editor Pro 5:
Имея книгу на 68 листов (2обложка + 22 иллюстации. остальное текст). Объем 60mb. Оговорюсь что сканил в .JPG 300dpi (каюсь :) ).
a) Сначала сделал всю книгу в профиле Scanned/Normal. Качество картинок трудно назвать приемлемым (точнее подойдет слово "УЖАС"). А размер вышел 9,6mb.
b) Затем всю книгу с применением профиля Photo. Получил приемлемое качество с весом ~15mb. Кстати в этом режиме кодивование идет на порядок быстрее.
c) Описаным выше методом повозился, но получил книгу устроившего меня качества весом 8,7mb.

2Rafael Под Vista у меня с Fine Reader 8. Полученый в результате распознавания текст не могу перенести для редактирования. Получаются абракадабры (бок со шрифтами), хотя в самом Fine Reader 8 с распознаным текстом все в порядке. Может сталкивались?

_________________
GB P35-DS3L/C2D E6750 2.66GHz/2x2048MB/SP250+SP750Gb/GeForce 8800GTS 640Mb/Win7 Ult.
Rafaell
Библиотекарь Клуба
Стаж: 17 лет 5 мес.
Сообщений: 4851
Ratio: 14.771
Поблагодарили: 41339
100%
Откуда: планета Земля
snowbody
Висту никогда не использовал, но с 70% веротяностью могу сказать что проблема в ней.
После сканирования как ты текст сохраняешь?
В диалоге сохранения есть кнопочка Format Settings - загляни туда не пожалеешь.
Попробуй сохранить все в ТХТ, а перед этим во вкладке TXT после нажатия Fromat Settings укажи явно кодировку (по умолчанию стоит Autо). Попробуй Win 1251 или KOI8
Там еще есть масса полезных опций.

_________________
forest_man
Стаж: 17 лет 1 мес.
Сообщений: 629
Ratio: 40.771
Поблагодарили: 47464
100%
Откуда: Киев
ussr.gif
snowbody
Пожалуйста.
Хотелось бы увидеть, что у вас получилось.
Rafaell
Каждый формат имеет свое назначение, например Djvu и PDF подходят наиболее для печати, получается копия книги с оригинальной версткой.
Если нужна книга для чтения на КПК, то полностью с вами согласен FB2 самый подходящий.
Rondo Andante
Живу - танцуя
Стаж: 16 лет 1 мес.
Сообщений: 690
Ratio: 23.954
Поблагодарили: 9574
100%
Откуда: Life is Dance
germany.gif
Да не сочтят за флуд

Тема однозначно должна быть в факе (правда не уверена что в общем - общетрекерном)
Было весьма интересно почитать рассуждения Гуру. Многое интересное узнала для себя.
В частности давно пользуюсь XnView (+ photoshop portable) и сканю, скрины делаю и тп тоже через нее. Неплохой набор инструментов и тп....
Впервые узнала из поста Forestman что можно делать этаким пакетным образом а то раньше было "открыть в xnView" до тех пор пока система не начинала верещать о памяти (правда нашла где это вырубить но все равно). Так же понравилась резалка scancromsator - кажись так. Не включилась пока как с ней общаться но думаю найду описалово в нете.
На сканер не смотрела года два пока не придумала как сохранять подписки, журналы и тп. В сканер и на 300dpi - нормально. А макулатуру - туда где ей место :)
Также несколько с удивлением узнала что лучше переснимать в tiff (вообще это аксиома но о чем мы думаем - о jpg чаще всего)
Возникают несколько вопросов - фотик (мой во всяком случае) сохраняет в jpg и все. Как быть?
и еще. Резалка эта умеет слегка повернуть лист/линейки если получился кривой отпечаток или это уже мои проблемы?

Зы. заранее прошу простить что могу переврать ники - после концерта иногда пальцы не на те клавиши попадают :(

_________________
Артистка, гимнастка и просто красавица!!!
Frigolem
Стаж: 16 лет 5 мес.
Сообщений: 213
Ratio: 12.572
Поблагодарили: 805
100%
usr.gif
Попробуйте в фотике найти настройку качества JPG и поставить его на максимум. Желательно на все 100%. :) Тогда в принципе наверно из JPG уже можно будет в TIFF перегонять, ну или уже тогда сразу в дело эти JPG'и...

Ещё иногда бывают варианты с прошивками фотиков, но тут сугубо от модели зависит, думаю...

_________________
Слепленное из глины творение продолжает и хочет жить своей собственной жизнью: соперничает со своим творцом. (с) Лейвик, "Голем"
Показать сообщения:   
Начать новую тему   Ответить на тему    Торрент-трекер NNM-Club -> О книгах и не только Часовой пояс: GMT + 3
Страницы:   Пред.  1, 2, 3, 4, 5, 6  След.
Страница 3 из 6