Вернуться   Форум SAPE.RU > Общие вопросы > Разработка и сопровождение сайтов

-->
Ответ
 
Опции темы
Старый 25.10.2009, 02:03   #1
Специалист
 
Аватар для solmir22
 
Регистрация: 26.11.2008
Адрес: Minsk
Сообщений: 175
Вес репутации: 0
solmir22 не любят в этих краях
По умолчанию Как почистить код созданный Word'м?

Может кто сталкивался или знает софтину полезную.
Сохраняю страничку в MS Word с типом html, ворд конечно же пихает в код очень много лишнего кода, от которого хотелось бы избавиться.
Задачка вот такая:
Нужно вот это

<td width=94 nowrap style='width:70.55pt;border:solid windowtext 1.0pt;background:#CCFFFF;padding:0cm 5.4pt 0cm5.4pt;height:25.5pt'>

заменить на это

<td>

Причем, то что нужно заменить, находится в тысячах подобных тегов и атрибуты всегда разные(т.е. тупо автозаменой не почистишь).
solmir22 вне форума   Ответить с цитированием
Старый 25.10.2009, 02:28   #2
Эксперт
 
Аватар для badimao
 
Регистрация: 24.03.2009
Сообщений: 1,794
Вес репутации: 292
badimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущее
По умолчанию

в дримвивере есть такая опция clear code вроде ничто так работает
badimao вне форума   Ответить с цитированием
Старый 25.10.2009, 02:39   #3
фОшЫст
 
Аватар для WebFX
 
Регистрация: 10.01.2008
Адрес: Эквадор
Сообщений: 6,773
Вес репутации: 503
WebFX - прекрасное будущееWebFX - прекрасное будущееWebFX - прекрасное будущееWebFX - прекрасное будущееWebFX - прекрасное будущееWebFX - прекрасное будущееWebFX - прекрасное будущееWebFX - прекрасное будущееWebFX - прекрасное будущееWebFX - прекрасное будущееWebFX - прекрасное будущее
Отправить сообщение для WebFX с помощью ICQ
По умолчанию

Цитата:
Сообщение от solmir22 Посмотреть сообщение
тупо автозаменой не почистишь
надо верстать или в дриме или в блокноте.
__________________
Скоро 2012 год. Скоро наступит апокалипсис. Страшный апокалипсис. Тупой апокалипсис. Ну вообще без мозгов апокалипсис.
WebFX вне форума   Ответить с цитированием
Старый 25.10.2009, 02:43   #4
Специалист
 
Аватар для solmir22
 
Регистрация: 26.11.2008
Адрес: Minsk
Сообщений: 175
Вес репутации: 0
solmir22 не любят в этих краях
По умолчанию

Цитата:
Сообщение от badimao Посмотреть сообщение
в дримвивере есть такая опция clear code вроде ничто так работает
Попробую. Спасибо.

По ssh решение есть, но неохота заливать каждый файл на ftp.

cat xxxx.html | iconv -f cp1251 | tr -d '\r' | sed -rn '1h;1!H;${;g;s/<td[^>]*>/<td>/ig;p;}' > xxxx1.htm

Добавлено через 3 минуты
Цитата:
Сообщение от WebFX Посмотреть сообщение
надо верстать или в дриме или в блокноте.
При чем тут верстка? Надо очень много прайсов с картинками вставить в cms, но при этом реализовать нормальную кроссбраузерность.

Последний раз редактировалось solmir22; 25.10.2009 в 02:43. Причина: Добавлено сообщение
solmir22 вне форума   Ответить с цитированием
Старый 25.10.2009, 02:51   #5
Специалист
 
Аватар для DiAksID
 
Регистрация: 02.08.2008
Сообщений: 304
Вес репутации: 207
DiAksID - просто великолепная личностьDiAksID - просто великолепная личностьDiAksID - просто великолепная личностьDiAksID - просто великолепная личностьDiAksID - просто великолепная личностьDiAksID - просто великолепная личностьDiAksID - просто великолепная личность
Отправить сообщение для DiAksID с помощью ICQ
По умолчанию

Цитата:
Сообщение от solmir22 Посмотреть сообщение
При чем тут верстка? Надо очень много прайсов с картинками вставить в cms, но при этом реализовать нормальную кроссбраузерность.
код html-ный скопипастили и мучаетесь теперь? бывает... тогда действительно - вёрстка не при чём

а серьёзно - сохранять Word-овский текст в html и есть "типа вёрстка". только для ооочень ленивых экстрималов...
DiAksID вне форума   Ответить с цитированием
Старый 25.10.2009, 03:02   #6
Специалист
 
Аватар для Vladek
 
Регистрация: 28.01.2008
Адрес: Волынь
Сообщений: 132
Вес репутации: 201
Vladek на пути к лучшему
По умолчанию

Не стоит пользоваться Вордом для этого. Гораздо лучше экспортирует в html, OpenOffice (http://ru.openoffice.org/)
__________________
Сапе + Pay-click + AdLabs
Vladek вне форума   Ответить с цитированием
Старый 25.10.2009, 03:21   #7
Специалист
 
Аватар для solmir22
 
Регистрация: 26.11.2008
Адрес: Minsk
Сообщений: 175
Вес репутации: 0
solmir22 не любят в этих краях
По умолчанию

Цитата:
Сообщение от DiAksID Посмотреть сообщение
код html-ный скопипастили и мучаетесь теперь? бывает... тогда действительно - вёрстка не при чём

а серьёзно - сохранять Word-овский текст в html и есть "типа вёрстка". только для ооочень ленивых экстрималов...
Да не. Сайт друзьям делаю и хочу шоб усе было кул.
Но когда увидел это количество прайсов... начал искать более простые пути решения.
solmir22 вне форума   Ответить с цитированием
Старый 25.10.2009, 04:02   #8
Эксперт
 
Аватар для badimao
 
Регистрация: 24.03.2009
Сообщений: 1,794
Вес репутации: 292
badimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущееbadimao - прекрасное будущее
По умолчанию

регулярки рулят
badimao вне форума   Ответить с цитированием
Старый 25.10.2009, 09:20   #9
Печник
 
Аватар для ubuntu
 
Регистрация: 11.10.2009
Адрес: Наш мир
Сообщений: 2,060
Вес репутации: 234
ubuntu - за этого человека можно гордитсяubuntu - за этого человека можно гордитсяubuntu - за этого человека можно гордитсяubuntu - за этого человека можно гордитсяubuntu - за этого человека можно гордитсяubuntu - за этого человека можно гордитсяubuntu - за этого человека можно гордитсяubuntu - за этого человека можно гордитсяubuntu - за этого человека можно гордитсяubuntu - за этого человека можно гордится
По умолчанию

Можно к CMS прикрутить визуальный редактор CKEditor - _http://ckeditor.com ,
в нем есть опция фильтрации определения гарнитур и определения стилей.
Я его прикручиваю, если заказчикам необходимо много документов из ворда выкладывать на сайт.

Добавлено через 2 минуты
Вот демонстрашка
_http://ckeditor.com/demo
там вверху есть кнопочка - "Вставить из Word"

Последний раз редактировалось ubuntu; 25.10.2009 в 09:20. Причина: Добавлено сообщение
ubuntu вне форума   Ответить с цитированием
Старый 25.10.2009, 09:36   #10
Мне повезёт!
 
Аватар для Alexey
 
Регистрация: 05.05.2007
Сообщений: 1,076
Вес репутации: 277
Alexey - прекрасное будущееAlexey - прекрасное будущееAlexey - прекрасное будущееAlexey - прекрасное будущееAlexey - прекрасное будущееAlexey - прекрасное будущееAlexey - прекрасное будущееAlexey - прекрасное будущееAlexey - прекрасное будущееAlexey - прекрасное будущееAlexey - прекрасное будущее
По умолчанию

В деле чистки есть очень важные факторы.

Первый и важнейший - сам Word документ. Он должен быть хорошо размечен. Заголовки должны идти стилями "Заголовок 1", "Заголовок 2" и т.д., а не просто "жирным по центру". Это крайне важно, ибо ни одна утилита по вашему форматированию не сможет догадаться что вы имели в виду.

Кроме того, часто встречаются документы у которых вместо маркеров списка картинка или списки оформлены просто строками, начинающимися с дефиса, документы где нет нормальной разбивки на абзацы и т.д.

В общем, документ Word должен быть грамотно сверстан (я понимаю, что "верстка Word" - достаточно абсурдная вещь, но она должна быть).

Во-вторых, требования к самому чистильщику. Дело в том, что ворд грешит кучей тегов, вставляемых где надо и где не надо. И тут трудно придумать универсальное решение.

Кому-то надо игнорировать рисунки, кому-то наоборот. Где-то надо стереть все стили, где-то не надо. Мне лично лучше если удалено будет абсолютно все, включая жирный и курсив, ибо его проще потом руками поставить чем разгрeбать ту срань, что остается после ворда.

Современные утилиты обладают некоторой степенью настраиваемости, однако, по опыту скажу - после дримвавера все равно надо просматривать и исправлять код. Дримвавер оставляет конструкции вида <b>Я ид</b><b>у по ули</b><b>це</b><em></em> (по крайней мере дримвавер CS3. CS4 не пробовал).

Смиритесь с тем, что не будет утилиты "раз и готово". Но полу-автоматизировать процесс можно. Если документ сверстан хорошо, то дримвавер даст неплохой выход.
__________________
Everything will be great in the end.
If it's not great, it's not the end.
Alexey вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Помогите с Word amster007 Курилка 21 30.09.2009 18:47
Как почистить вирус? Серый Волк Курилка 3 13.07.2009 19:38
Как почистить Каспера Секьюрити? Администрация 6-ой палаты Курилка 2 23.03.2009 17:44
Как вебмастеру почистить базу купленных ссылок? Danila Вопросы по работе системы 4 23.08.2008 02:28
проблемы с word-press rewo Ошибки при работе с системой 13 09.11.2007 11:20


Часовой пояс GMT +3, время: 12:15.