10.08.2010, 13:00 | #1 |
Новичок
Регистрация: 11.07.2010
Сообщений: 55
Вес репутации: 0
|
Оптимизация процесса сканирования и распознавания текстов
Здравствуйте. Есть несколько вопросов, которые хотелось бы задать более опытным ВМ. При распознавании текста образуется много нежелательных дефисов внутри слов (например "пара-фин"), а также ненужные абзацы (разрывы предложений и перенос на новую строку). Сами настройки распознавания оптимизированы нормально, т.е. качество распознавания уже не повысится. Как можно быстро избавиться от этих дефисов и абзацев? В Ворде при помощи "Найти и заменить" можно быстро найти, но менять придется все равно вручную. Долго... В OpenOffice в "Найти и заменить" спецсимволы вообще, кажется, вставлять нельзя (по крайней мере не все).
Еще один вопрос - есть ли какая-то софтина, которая позволяет резать текст на заданное количество символов, но без разрывов слов и абзацев? И еще - есть ли у кого опыт работы с МФУ Samsung SCX-4220? Когда сканируешь с его помощью книгу, сканирующая планочка (извините, не знаю, как правильно эта хрень называется) проезжает вперед, потом чуть назад, потом снова вперед и т.д. до конца. Так и должно быть? Это заметно тормозит скорость сканирования. Если бы она шла вперед без остановок, было бы как минимум в 1,5 раза быстрее. Это зависит от устройства или от программного обеспечения? Девятый ФайнРидер почему-то некорректно работал с этим МФУ, пришлось ставить восьмой. |
10.08.2010, 14:15 | #2 | |
Эксперт
Регистрация: 20.03.2010
Адрес: Симферополь
Сообщений: 1,547
Вес репутации: 234
|
Squidward,
Цитата:
В настройках поменяй на 300 pix |
|
10.08.2010, 14:59 | #3 | |
Новичок
Регистрация: 11.07.2010
Сообщений: 55
Вес репутации: 0
|
Цитата:
И так 300 стоит. На трехсот он просто ездит быстрее, и "обратно-поступательных" движений меньше. |
|
10.08.2010, 16:01 | #6 | ||
Новичок
Регистрация: 11.07.2010
Сообщений: 55
Вес репутации: 0
|
Цитата:
Допустим, я отсканил книгу на 200 стр. Это же крыша поедет - сто сканов руками копипастить. Я не бессмертный, чтобы так время разбазаривать. Дефисы возникают из-за того, что ФайнРидер, к сожалению, иногда не может определить мягкий перенос как мягкий перенос и думает, что это дефис. Цитата:
|
||
10.08.2010, 16:35 | #7 |
Эксперт
Регистрация: 20.03.2010
Адрес: Симферополь
Сообщений: 1,547
Вес репутации: 234
|
|
Опции темы | |
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Частота сканирования. | Rorschach | Вопросы от новичков | 33 | 25.06.2010 21:04 |
Оптимизация бизнес-процесса | seo_pro | Курилка | 1 | 08.06.2009 11:39 |
Скорость сканирования. | Challenger | Google, MSN, Yahoo | 2 | 15.10.2008 18:32 |
Часовой пояс GMT +3, время: 03:40.