gyra:
Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.
Автор: bolega. http://bolega.hotmail.ru/.
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
Аналог ScanKromsator - Scan Tailor
Начало обсуждения - 1 часть, 2 часть, 3 часть
Текущая версия: [more=ScanKromsator v6.00.5]
Версия СК 6.00.5
Архив с программой http://rusfolder.com/44986847
Пароль на архив - круглый нахальный бродяга из известной сказки латинскими буквами.
дополнительно:
http://rusfolder.com/44984119
http://rusfolder.com/44984121
https://yadi.sk/d/gU0hwMfz3CJYCb
[/more] (2,1 МБ) [more=Настройка внешних утилит]Настройка внешних программ и утилит
Для работы ряда функций СК потребуется установить несколько сторонних приложений/библиотек:
- DjVulibre: используется при создании djvu. Библиотека доступна на http://djvu.sourceforge.net.
Важно ! Нужна старая djvulibre, версии 2015 года, например djvulibre_djview_4_9_djvulibre_3_5_25_3
- Kakadu: кодек jpg2000, может использоваться при создании PDF. Наличие кодека необязательно.
Доступен на http://kakadusoftware.com/downloads.
Достаточно иметь демонстрационную (trial) версию, при условии, что она не используется в коммерческих целях.
С "Copyright notice" можно ознакомиться на странице загрузки http://kakadusoftware.com/downloads.
- FFTW: используется для работы фильтра descreen. Библиотека dll доступна на http://www.fftw.org.
- DEE (documenttodjvu.exe): используется только при создании djvu.
- DjVuDecode: используется при импорте djvu-файлов. Утилита содержится в дистибутиве DEE или DjVu Small (Mod).
- Tesseract: используется при работе специального метода despeckle. Доступен на https://code.google.com/p/tesseract-ocr.
1. Файл bps.cfg, fftw3.dll, ocr.dll поместите в папку, где находится исполняемый файл sk.exe.
2. Папку tessdata со всем содержимым поместите в любое место на диске. В настройках СК
File>Options>Apps>Tesseract укажите полный путь к файлу eng.traineddata, напр.,
"C:\SK\tessdata\eng.traineddata"
3. Файлы kdu_compress.exe и kdu_v77R.dll поместите в любое место на диске. В настройках СК
File>Options>Apps>JPG2000 codec укажите полный путь к файлу kdu_compress.exe, напр.,
"..\..\Program Files\kakadu\kdu_compress.exe"
4. В настройках СК File>Options>Apps>DjVuDecode укажите полный путь к файлу DjVuDecode.exe, напр.,
"C:\Program Files\Utilities\djvu-decode\DjVuDecode.exe"
5. В настройках СК File>Options>Apps>DjVulibre укажите полный путь к файлу djvumake.exe, напр.,
"D:\DjVuLibre\djvumake.exe". Важно, что библиотека DjVulibre должна быть установлена полностью.
СК использует несколько утилит из DjVulibre, не только djvumake.exe.
6. В настройках СК File>Options>Apps>DEE укажите полный путь к файлу documenttodjvu.exe, напр.,
"D:\DEE\documenttodjvu.exe"
[/more]
Предыдущая версия: 5.96.2 (файл sk.exe), утилиты к ней можно взять из v5.96.1
Старые версии: [more]
Full-версии включают dll-библиотеки и Help к SK v1.0 в формате Pdf:
Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)
Включает, в том числе:
Видеоуроки про ScanKromsator [more]
Обработка пикчур-зон от TelecomUral [more]http://depositfiles.com/files/wvhtrzmes
https://yadi.sk/i/vA7Siou-3QYiFa
LibGen md5=F862D859ADD9AB4F22D3856540869A63[/more]
English texts [more]
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом[more=...]Дайте полную информацию: скан, задание spt, out-файлы. Случай элементарный. Чего там может не получаться - никак не пойму. Сто раз уже говорил: есть проблема - присылайте задание, а не кучу постов про то, как плохо выходит. По заданию срзу можно увидеть, что не так, подсказать, что поправить. А не гадать на кофейной гуще, отчего в таком простом случае может что-то не получаться.[/more]
ScanKromsator
Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.
Автор: bolega. http://bolega.hotmail.ru/.
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
Аналог ScanKromsator - Scan Tailor
Начало обсуждения - 1 часть, 2 часть, 3 часть
Текущая версия: [more=ScanKromsator v6.00.5]
Версия СК 6.00.5
Архив с программой http://rusfolder.com/44986847
Пароль на архив - круглый нахальный бродяга из известной сказки латинскими буквами.
дополнительно:
http://rusfolder.com/44984119
http://rusfolder.com/44984121
https://yadi.sk/d/gU0hwMfz3CJYCb
[/more] (2,1 МБ) [more=Настройка внешних утилит]Настройка внешних программ и утилит
Для работы ряда функций СК потребуется установить несколько сторонних приложений/библиотек:
- DjVulibre: используется при создании djvu. Библиотека доступна на http://djvu.sourceforge.net.
Важно ! Нужна старая djvulibre, версии 2015 года, например djvulibre_djview_4_9_djvulibre_3_5_25_3
- Kakadu: кодек jpg2000, может использоваться при создании PDF. Наличие кодека необязательно.
Доступен на http://kakadusoftware.com/downloads.
Достаточно иметь демонстрационную (trial) версию, при условии, что она не используется в коммерческих целях.
С "Copyright notice" можно ознакомиться на странице загрузки http://kakadusoftware.com/downloads.
- FFTW: используется для работы фильтра descreen. Библиотека dll доступна на http://www.fftw.org.
- DEE (documenttodjvu.exe): используется только при создании djvu.
- DjVuDecode: используется при импорте djvu-файлов. Утилита содержится в дистибутиве DEE или DjVu Small (Mod).
- Tesseract: используется при работе специального метода despeckle. Доступен на https://code.google.com/p/tesseract-ocr.
1. Файл bps.cfg, fftw3.dll, ocr.dll поместите в папку, где находится исполняемый файл sk.exe.
2. Папку tessdata со всем содержимым поместите в любое место на диске. В настройках СК
File>Options>Apps>Tesseract укажите полный путь к файлу eng.traineddata, напр.,
"C:\SK\tessdata\eng.traineddata"
3. Файлы kdu_compress.exe и kdu_v77R.dll поместите в любое место на диске. В настройках СК
File>Options>Apps>JPG2000 codec укажите полный путь к файлу kdu_compress.exe, напр.,
"..\..\Program Files\kakadu\kdu_compress.exe"
4. В настройках СК File>Options>Apps>DjVuDecode укажите полный путь к файлу DjVuDecode.exe, напр.,
"C:\Program Files\Utilities\djvu-decode\DjVuDecode.exe"
5. В настройках СК File>Options>Apps>DjVulibre укажите полный путь к файлу djvumake.exe, напр.,
"D:\DjVuLibre\djvumake.exe". Важно, что библиотека DjVulibre должна быть установлена полностью.
СК использует несколько утилит из DjVulibre, не только djvumake.exe.
6. В настройках СК File>Options>Apps>DEE укажите полный путь к файлу documenttodjvu.exe, напр.,
"D:\DEE\documenttodjvu.exe"
[/more]
Предыдущая версия: 5.96.2 (файл sk.exe), утилиты к ней можно взять из v5.96.1
Старые версии: [more]
Full-версии включают dll-библиотеки и Help к SK v1.0 в формате Pdf:
- v5.95b2 (4,14 МБ)
- v5.93 (3,44 МБ)
- v5.92 (3,40 МБ)
- v5.91 (3,26 МБ)
- v5.9 (3,19 МБ)
- v5.81 NY (2,42 МБ)
- v5.6А (2,25 МБ)
- v5.52b (2,05 МБ)
- v5.51b (2,06 МБ)
- v5.07 (1,98 МБ)
- v3.5 (1,52 МБ)
Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)
Включает, в том числе:
- Использование ScanKromsatorа v5.91 от Melirius
- Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
- ScanAndShare v1.07 - инструкция в картинках от VadimirTT
- Пособие по Кромсатору от monday2000 См. подробности и ниже перевод на английский
- [more=Самая краткая инструкция]Здравствуйте. Представляю обещанную краткую инструкцию для СК (предварительную версию). Своеобразный Кромсатор.Лайт :D Инструкция работает со специальной «сборкой» СК. «Сборка» представляет собой неизмененный СК, к которому добавлены два профиля, один из которых установлен по умолчанию. Все рассчитано на то, что если пользователю и нужно будет что-то подстраивать, то это будет только один параметр - порог бинаризации (не считая установки фиксированного размера страницы - это уже для эстетов :)).
Также в папку DOCS помещены документы, содержащие информацию, которой, на мой взгляд, можно доверять. Т.к. объем текстовой информации велик (туда же помещены архивы руборды) проще всего пользоваться ими через индексатор (к примеру, dtSearch).
В сборку будут добавлены и другие профили для разных случаев жизни :) Можно обсудить, какие профили еще добавить. Буду рад критике имеющегося профиля по умолчанию.
Жду аргументированной критики и инструкции в целом.
Благодарю Alexx_S за предварительную критику сборки и инструкции.
КРОМСАТОР. КРАТКАЯ ИНСТРУКЦИЯ.
Данная инструкция предназначена для тех, кто хотел бы получить скорейший и качественный результат «здесь и сейчас». Инструкция включает всего 3 пункта – подготовка, обработка и постобработка. Первый пункт имеет 3 подпункта, причем третий (1.3.) не обязателен к выполнению.
В целом, можно считать, что инструкция наряду с прилагаемой «сборкой» применима к 60-70% всех книг. А при выполнении п. 1.3. она подойдет для 80-90% случаев, если считать, что в оставшиеся 10-20% входят, помимо прочих, книги с полутоновыми изображениями/фотографиями.
Предварительные условия (ПУ):
1. Загрузите «сборку» Кромсатора по следующему адресу: http://rapidshare.com/files/135566411/Kromsator_ghosty.rar.html. Если ссылка не работает, то можно изготовить файлик sk.ini в корневом каталоге СК самому (отличие "сборки" - только в наличии этого файлика):
Код:[Panels]
[Options]
DefUserOptionsName=DEFAULT_5.9
DraftProfileName=DEFAULT_5.9
[UserOptions]
DEFAULT_5.9=1;1;1;1;180;210;0;1;;1;3;0;2;4;0;4;2;1;0;;1;1;0;0;1001;0;0;5903;1;2;2;5;0;0;20;3;0;0;-1;1;0;0;0;0;1;8;180;2;4;7;3;5;6;10;0;1;17;100;255;0;0;10;70;1;0;10;50;1;0;2;0;3;100;1;0;0;0;150;
OLD_BOOKS=0;1;1;1;180;210;0;1;;1;3;0;2;4;0;4;2;1;0;;1;1;0;0;1001;0;0;5891;1;2;2;10;0;0;20;3;0;0;-1;1;0;0;0;0;1;8;180;2;4;8;3;5;6;10;0;1;17;100;255;0;0;10;70;1;3;10;50;1;0;1;1;3;100;1;0;0;0;150;
2. «Сборка» оптимизирована для работы с изображениями, отсканированными в режиме 300dpi в полутонах серого (8-bit Grey) – режим, рекомендуемый нами для 95% случаев.
3. Перед работой настоятельно рекомендуется прочитать о порядке обрезки страниц в Кромсаторе.
1. ПОДГОТОВКА. Загрузите файлы в СК: File -> Open Images (либо нажмите на стандартную иконку открытия в панели инструментов).
1.1. Теперь необходимо расставить резаки. Делается это автоматически. В меню выберите Edit -> Draft Kromsate (в панели инструментов - иконка с ножницами). Если сканы представляют собой развороты (две страницы на листе), то в открывшемся окне ставим галку Split pages. Нажимаем ОК.
1.2. Проверьте правильность расстановки резаков для всех страниц. Исправлять положение резака имеет смысл только в том случае, если он отсекает часть текста, либо включает в область обработки много мусора. Резаки служат только для отсечения крупного мусора, мешающего автоматическому определению координат блока текста (см. ПУ 3).
1.3.* Чтобы подобрать порог бинаризации, а также определить средние размеры страницы выделите в списке в левом верхнем углу 10-15 страниц – выбор осуществляется нажатием клавиши пробела. Старайтесь включать страницы с наибольшими размерами блока текста, а также страницы с отклонениями в качестве печати (слишком бледные, слишком темные).
1.3.1. Подбор порога бинаризации. Обработайте выделенную группу страниц: Process->Group->Process selected. После обработки просмотрите результат. Если шрифт кажется слишком бледным, необходимо будет увеличить порог бинаризации, слишком жирным – уменьшить. Закройте окно просмотра результатов и перейдите на закладку Convert. Здесь значение параметра по умолчанию – 180. Измените это значение и проверьте его правильность, обработав данную страницу: Process->Current File (в панели инструментов иконка c изображением резаков справа от кнопки Process).Заданный параметр можно распространить на группу выделенных страниц (щелкнуть по значению параметра и в контекстном меню выбрать Apply option to group->Selected), после чего обработать эту группу (см. 1.3.1.). Когда порог подобран, т.е. он, по вашему мнению, подходит для всей книги, в этом же контекстном меню выберите Apply option to all marked – т.е. мы устанавливаем один порог для всей книги.
1.3.2. Задание фиксированного размера страниц. Перейдите на закладку Book. Здесь в выпадающем списке для Page width (ширина страницы) и Page hight (высота) выберите опцию Fixed. Затем щелкните правой кнопкой по окошку значения параметра Page width и выберите Load page size from current output file – таким образом мы устанавливаем фиксированные размеры страниц для всей книги.
1.3.3. Установка параметров выравнивания. В некоторых случаях необходимо задать выравнивание блока текста по чистому листу (см. ПУ 3). По умолчанию блок текста выравнивается по вертикали по верхней кромке листа, а по горизонтали – по центру. Если для какой-то страницы книги это не так (к примеру, главы начинаются с середины страницы), параметры выравнивания можно изменить на закладке Page. Здесь Page h. align – выравнивание по горизонтали (L и А – по левому краю, C - по центру, R – по правому краю), а Page v. align – выравнивание по вертикали (T и А – по верхнему краю, C – по центру, B – по нижнему краю).
2. ОБРАБОТКА. В меню выберите Process->All, либо нажмите кнопку Process в панели инструментов. Обработка выполняется полностью автоматически и для большой книги может занять от 1,5 до 2,5 часов (на машине средней конфигурации).
3. ПОСТОБРАБОТКА. После обработки автоматически открывается окно просмотра результатов (Result View). Рекомендуется просмотреть все страницы. Некоторые страницы (или даже группы страниц – см. п. 1.3) при необходимости можно обработать отдельно с другим порогом бинаризации. Также в этом режиме возможна чистка страницы вручную. Основные инструменты – ластик (в панели инструментов – иконка с изображением ластика), режим выделения с полной очисткой (иконка с изображением зеленой метлы) – в области выделения очищается все, а также режим выделения с очисткой спеклов (иконка с изображением красной метлы) – в области выделения очищается мусор только определенного размера. Размер мусора (т.н. спеклов) задается в контекстном меню страницы – Clear Options. Если результат вас в целом не удовлетворяет, попробуйте также выполнить подпункт 1.3.
* Этот пункт относится к необязательным в случае оцифровки небольших журнальных статей, но его выполнение желательно при работе с книгами.[/more] от ghosty
- Примеры использования от shch_vg #1, #2
Видеоуроки про ScanKromsator [more]
- Основы работы программы ScanKromsator от Андрей Никитин-Перенский
- Обработка иллюстраций в Сканкромсаторе, часть1 от TelecomUral
- Серия мультфильмов о постобработке в СК от ghosty
- ScanKromsator. Основы автор разыскивается
Обработка пикчур-зон от TelecomUral [more]http://depositfiles.com/files/wvhtrzmes
https://yadi.sk/i/vA7Siou-3QYiFa
LibGen md5=F862D859ADD9AB4F22D3856540869A63[/more]
English texts [more]
- How I've been using SkanKromSator by Nick Hodson
- ScanKromsator v5.6A. The unofficial program reference by monday2000
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом[more=...]Дайте полную информацию: скан, задание spt, out-файлы. Случай элементарный. Чего там может не получаться - никак не пойму. Сто раз уже говорил: есть проблема - присылайте задание, а не кучу постов про то, как плохо выходит. По заданию срзу можно увидеть, что не так, подсказать, что поправить. А не гадать на кофейной гуще, отчего в таком простом случае может что-то не получаться.[/more]