| От | PK |  |
К | apple16 |  |
Дата | 06.11.2007 16:03:01 |  |
Рубрики | Администрации; |  |
См мой коммент
... по поговорке: "жай дураку стеклянный.... кружку - разобьёт и ж-пу порежет".
>Также некоторые дожимают так, что и по тексту OCR толком не работает.
дожать до беспредела можно что угодно.
>Поэтому наилучшим форматом для первичного распостранения является
>скан в jpeg качества 8-10 на 300 DPI (Если мелованное фото - 600)
Вообще-то сканы для распознания стОит делать/хранить не в jpeg а в TIFF - потому что жпег тоже, между прочим, информацию теряет. Причём будучи форматом, заточенным для КАРТИНОК, с множеством цветов и плавными градациями, для ТЕКСТА (два цвета, НЕТ градаций) принципиально менее пригоден нежели другие алгоритмы, в т.ч. используемые в дежавю.
>djvu это эрзац для ленивых -
>Нажал педаль - книжка небольшого размера
>которую можно читать готова. А то, что потом ни фотографий
>из книжки выдрать, ни текст распознать - побоку.
Не так. При наличии желания можно сделать дежавюку которая с фото высокого качества, и подложенным распознанным текстом. При наличии уже готового дежавюшного файла можно распечатать его в набор картинок и распознать текст, и так далее. Было бы желание.
>Нет возможности маневра информацией в djvu
есть возможности.
>- электроные книжки не для того чтобы их читать, а чтобы драть из них
>и искать в них. :)
ну или печатать в высоком качестве и хранить.
В общем, ДеЖаВю есть формат принципиально ЛУЧШЕ заточенный для сканов книжек чем жпег. Ну а если матчасть неизучена...