Объявление

Минимальные требования к качеству отсканированных книг

Тема в разделе "Электронные книги", создана пользователем Orman, 5 окт 2017.

  1. 5 окт 2017
    #1
    Orman
    Orman МодерМодератор Команда форума
    Внимание! Часто бывает, что за организацию складчин на бумажные книги берутся организаторы, не способные или не желающие их нормально отсканировать и обработать. Чего только в библиотеках не выдают: отсканированные файлы страниц по отдельности, фотографии страниц с телефона, кривые чёрно-белые PDF книг с цветными картинками и т.д. С другой стороны встречаются складчики-перфекционисты. Им нужно супер-качество, совпадающее с исходником издательства, с которого производится печать книги. И первая, и вторая позиции не являются верными.
    Поэтому с данного момента к сканам бумажных книг предъявляются следующие требования.
    На этапе сканирования:

    1) Использование сканера обязательно.
    2) Формат исходных сканов - TIFF разрешением не ниже 300dpi.
    Формат JPEG для сохранения сканов книжных страниц использовать не стоит. Этот формат даже при включенном сжатии без потерь оставляет "артефакты" в виде "квадратиков".
    Режимы сканирования:
    Страница с черно-белым текстом и черно-белыми одноцветными иллюстрациями
    Режим
    : Grayscale (градации серого)
    Страница с черно-белым текстом и черно-белыми фотографическими иллюстрациями
    Режим
    : Grayscale (градации серого)
    Страница с черно-белым текстом и цветными иллюстрациями
    Режим
    : True Color (полноцветный)
    Цветная обложка или иллюстрация страничного формата
    Режим
    : True Color (полноцветный)
    3) Если нет возможности плотно прижать книгу к стеклу (из-за толщины или других особенностей), она разбирается на отдельные страницы.
    Пример_1.png
    Однако, небольшие изгибы текста в районе корешка вполне допустимы. Читать книгу они не помешают.
    Обработка, вывод и сборка:
    Производится в специальных программах, например, Scan Tailor или Scan Kromsator. При этом:
    1) Страницы должны быть разрезаны и выровнены.
    2) Вывод страниц осуществляется в следующих режимах:
    Цветные картинки и фотографии - в цвете, серые в градациях серого.
    Текст выводится чёрным. Если в книге текст цветной, значит, выводить его в цвете.
    Пример_4.jpg
    Здесь вывод производился в градациях серого. При этом картинки отсутствуют, зато виден просвечивающийся текст на обороте страницы. Этого не произойдет, если выводить в ч/б режиме. [/ATTACH]
    3) Одинаковый размер страниц (ширина и высота).
    Пример_2.jpg
    4) Белые поля (для книг, в которых они белые).
    5) Обложка должна выводиться в цвете и обрезана от лишних элементов.
    Пример_3.jpg
    6) Формат выдачи - минимум PDF. Остальные форматы на усмотрение организатора.
     
    Последнее редактирование: 6 окт 2017
    22 пользователям это понравилось.
  2. 6 окт 2017
    #2
    Magical world
    Magical world МодерМодератор Команда форума
    Всё верно , увеличиваем качество материала на Складчике .. тока один вопрос технический имею в пункте Обработки - параграф 2) .. вывод с страницы с рисунком .. вывод в Ч/Б затемняет рисунок .. вывод в Градачии Серого - просвечивает текст . Чем жертвовать для качества ?
     
    1 человеку нравится это.
  3. 6 окт 2017
    #3
    Orman
    Orman МодерМодератор Команда форума
    Нужно соблюсти баланс. Например, вывести в смешанном режиме.
     
    7 пользователям это понравилось.
  4. 7 окт 2017
    #4
    kaasnake
    kaasnake ОргОрганизатор
    Для ликвидации "эффекта просвечивания" нужно просто не жалеть пары лишних секунд и между страниц вкладывать ЧЕРНЫЙ лист бумаги (который легко напечатать под любой заданный размер сканируемой книги) - тогда просвет практически исчезает и остается в исключительных случаях, если книга напечатана на очень тонкой бумаге
     
    13 пользователям это понравилось.
  5. 15 окт 2017
    #5
    Richard LS
    Richard LS ОргОрганизатор
    Скажите пожалуйста, мы сканируем заявленное в книге количество страниц. Почти в каждой книге есть пара - тройка пустых страниц. При обработке их принято удалять, ведь никому не нужны при чтении пустые страницы. На выходе получается на 2 - 3 страницы меньше. Об этом никто ничего не упомянул. Оплата остается за количество отсканированных/обработанных страниц или по факту выхода?
     
    1 человеку нравится это.
  6. 15 окт 2017
    #6
    Orman
    Orman МодерМодератор Команда форума
    О каких страницах вы говорите? Если в середине книги, то они должны присутствовать в итоговом файле.
     
    3 пользователям это понравилось.
  7. 15 окт 2017
    #7
    Arahnid
    Arahnid ОргОрганизатор
    Не нужно удалять, иначе нумерация нарушается.
    Другое дело, что сканировать их не нужно, а просто вставлять пустые страницы там, где они есть в бумажной книге.
    Определить заранее, сколько пустых страниц в книге не возможно, пока ее сканировать не начнешь.
    Если не выкупать заранее, то поправить кол-во страниц по факту уже не получиться.
    Если книга куплена заранее и орг честный, то напишет тикет для изменения кол-ва страниц.
     
    3 пользователям это понравилось.
  8. 24 окт 2017
    #8
    Lilla My
    Lilla My ОргОрганизатор
    А у меня вопрос по формату. Для текстовых книг PDF не удобен, идеальный для них формат - fb2.
    1) Можно ли делать складчину только на fb2?
    2) Можно ли собрать PDF не из сканов, а уже из распознанного и вычитанного текста (тогда не надо париться с обработкой каждой странички)?
     
  9. 24 окт 2017
    #9
    Arahnid
    Arahnid ОргОрганизатор
    @Lilla My,
    1. Ответит модератор
    2. Так и нужно делать! Как раз собирать pdf из сырых сканов чревато плохим качеством готовой книги и размер тоже обычно намного больше.
     
    1 человеку нравится это.
  10. 24 окт 2017
    #10
    Lilla My
    Lilla My ОргОрганизатор
    Я про то, можно ли пдф-ку, созданную из текста, с размещением картинок и т.п. в тех же местах, как и в оригинальной книге. В таком случае книга будет скорее копией распознанного текстового файла. Не будет нумерации страниц, верстка, возможно, будет другая и так далее. В противовес пдф-ке, созданной из отсканированных (хоть и почищенных) страниц.
     
  11. 24 окт 2017
    #11
    Arahnid
    Arahnid ОргОрганизатор
    В чем проблема добавить нумерацию? Это делается автоматически
     
    1 человеку нравится это.
  12. 24 окт 2017
    #12
    Orman
    Orman МодерМодератор Команда форума
    Некоторым складчикам важно, чтобы скан был идентичен оригинальной книге. Поэтому PDF на основе сканов обязателен. Все остальное - на усмотрение орга.
     
    Последнее редактирование модератором: 24 окт 2017
    10 пользователям это понравилось.
  13. 24 окт 2017
    #13
    Lilla My
    Lilla My ОргОрганизатор
    Она не будет совпадать с оригинальной. Да и зачем нумерация в электронной книге (в программе же все равно есть), за исключением случаев полной идентичности.
     
  14. 25 окт 2017
    #14
    kaasnake
    kaasnake ОргОрганизатор
    Такое впечатление, что многие не видят разницы между "книга" и "текст книги".
    Для ТЕКСТА (по типу "дамских романов") - да, неважны и нумерация и пустые страницы, вкладки и прочая и прочая, важен только сам текст - "прочитал и выбросил".
    Книга - это ЦЕЛЬНЫЙ ОБЪЕКТ. Для КНИГИ (и ее скана) важны ВСЕ страницы, в том числе и пустые. Нормальную книгу, с которой работают, читают на большом мониторе, а не на телефоне. И, будете смеяться :), но на монитолре удобно работать с книгой, открытой "в развороте" (слева - четная страница, справа - нечетная). При создании книги иногда делают именно РАЗВОРОТНЫЕ материалы, которые имеют смысл именно в развороте (ну бывает сложная таблица, диаграмма или просто широкое изображение), и если книга отсканирована "левой задней ногой" с выбрасыванием "пустых" страниц, то все развороты перемешиваются как попало. Это НУЖНО ПОНИМАТЬ, иначе вы просто обычный халтурщик и просто портите КНИГУ из-за свооей лени и непонимания.
    И еще "хаха" - но иногда нужна возможность делать ссылки на материал (оригинальной) книги. Если книга превращена в "текст", то нет возможности делать ссылку на страницу. Еще хуже, когда "аффтар" скана принимает "мудрое" решение выбросить "ненужную" информацию в конце книги - индексный справочник, выходные данные, оглавление и прочий "мусор".
    Итого: если сканируете "дамский роман" - делайте с ним что угодно, хоть fb2, это неважно.
    Но если взялись сканить именно "книгу", делайте это по-человечески, не принимая СВОЕГО решения о ценности отдельных фрагментов книги. Организуя скан, вы принимаете на себя обязательство выдать КОПИЮ книги а не ее "творческую переработку".
    P.S. Это абсолютно ИМХО, тапками не кидаться.
     
    17 пользователям это понравилось.
  15. 25 окт 2017
    #15
    Orman
    Orman МодерМодератор Команда форума
    @kaasnake, отличный комментарий. Дополню, что даже дамский роман в случае, когда на него собирается складчина, должен быть предоставлен в максимально похожем на оригинал виде. fb2, moby, epub можно делать тоже, но в качестве дополнения.
     
    5 пользователям это понравилось.
  16. 28 окт 2017
    #16
    Кендарат
    Кендарат ОргОрганизатор
    Нумерация иногда очень принципиальна, когда имеется иллюстрированное издание, например, с большими фото на разворот страницы (про таблицы не скажу, не видела). Я добавляла пустую страницу после картинки обложки/переплета именно с этой целью, хотя если строго: нумерация начиналась с 3, а не 1.. Если были вставки с пустым оборотом - по обстоятельствам, "как массив ляжет". Ну и конечно, про индексный указатель. Может, в "лёгких" случаях предлагать вариант без обложки, которая может нарушить поиск по номеру страницы? А обложку отдельно?
     
    1 человеку нравится это.
  17. 28 окт 2017
    #17
    kaasnake
    kaasnake ОргОрганизатор
    Мне кажется, вы тоже не поняли в чем суть книги (точнее, ее структуры) :) и в чем ее отличие от ФАЙЛА КНИГИ.
    Книга - это сложная и ЦЕЛЬНАЯ структура, состоящая из нескольких логических частей, КАЖДАЯ из которых может (и имеет) свою нумерацию, например большое сложное оглавление имеет нумерацию римскими цифрами, серия вступительных статей в свою очередь тоже нумеруется своим способом, главы книги ТОЖЕ могут нумероваться не сквозной нумерацией (1, 2...,999) а составной (например НомерГлавы-НомерстраницыВГлаве, типа IV-17, X-35 и т.п.) всё зависит от КОНКРЕТНОЙ книги.
    Каждая часть имеет смысл в составе книги и несет свою НЕОТЪЕМЛЕМУЮ долю информации из книги как цельного и неделимого объекта :):) Именно поэтому и НЕЛЬЗЯ вносить свои "корректирующие изменения" в состав книги. Это НЕ ВАША задача. Просто передайте книгу целиком, не занимайтесь ОТСЕБЯТИНОЙ, это ВСЕГДА плохо :)
    Для поиска страниц внутри книги, правильно подготовленные PDF-файлы содержат оглавление, внутренние ссылки и, да-да, правильную нумерацию страниц, которая тоже не сквозная, а такая же, как в исходной книге. Для примера возьмите "фирменный" PDF-файл практически любой серьёзной "буржуйской" книги и "препарируйте" его :)
    P.S. Кстати, именно с этой целью - создание правильной копии книги - многие (и я в том числе) и просят предоставить "сырые сканы". Если орг не может (или не хочет) воспроизвести книгу "как надо", то пусть хотя бы выдает сканы по просьбе "ценителей и эстетов", гыгы :):):):)
    Вообще, имеет смысл научиться делать сборку электронных книг. Может пригодиться :)
    P.P.S. "И тут Остапа понесло...". Всё, молчу-молчу-молчу... :):)
     
    2 пользователям это понравилось.
  18. 28 окт 2017
    #18
    kaasnake
    kaasnake ОргОрганизатор
    Вот пример PDF-файла со сложной нумерацией страниц
     
    1 человеку нравится это.
  19. 28 окт 2017
    #19
    Кендарат
    Кендарат ОргОрганизатор
    А мне "кажется", что при добавлении обложки УЖЕ сбивается нумерация. Если есть номера страниц, то надо на них ориентироваться.
    Конечно, если еще сканировщика обязать делать перекрестные ссылки и пр., то станет совсем интересно :) Учитывая, что они (ссылки) часто изначально неправильные, то ещё поправлять :)
     
    1 человеку нравится это.
  20. 28 окт 2017
    #20
    kaasnake
    kaasnake ОргОрганизатор
    Нумерация ЧЕГО сбивается??? Я же приложил образец КОРРЕКТНОГО PDF-файла со СЛОЖНОЙ нумерацией.
    Не путайте "порядковый номер страницы В ФАЙЛЕ, как объект файла" и "номер страницы в книге, как элемент пагинации"
     
    1 человеку нравится это.