Форум SAPE.RU

Форум SAPE.RU (http://forum.sape.ru/index.php)
-   Разработка и сопровождение сайтов (http://forum.sape.ru/forumdisplay.php?f=29)
-   -   Холливар: Win-1251 vs UTF-8 или битва тупоконечников и остроконечников. (http://forum.sape.ru/showthread.php?t=83103)

mnogoclipov 26.07.2012 16:32

Холливар: Win-1251 vs UTF-8 или битва тупоконечников и остроконечников.
 
Почему кстати по умолчанию стоит эта убогая windows-1251, которую нормальные вебмастера даже не используют никогда ?

zeta 26.07.2012 16:47

Цитата:

Сообщение от mnogoclipov (Сообщение 1260673)
Почему кстати по умолчанию стоит эта убогая windows-1251, которую нормальные вебмастера даже не используют никогда ?

почему такие выводы?

mnogoclipov 26.07.2012 16:56

Потому что утф 8 считается лучшей кодировкой и поддерживает все символы. А 1251 - это устаревшая херь, которая используется "по привычке".

SergejF 26.07.2012 17:44

Цитата:

Сообщение от zeta (Сообщение 1260678)
почему такие выводы?

Автор просто не умеет готовить. Поэтому нормальные мужчины едят только яичницу.

mnogoclipov 26.07.2012 18:47

Согласен. 1251 частенько по умолчанию в редакторе стоит, да и не все знают, что такое BOM и как его отключить, поэтому действительно, если не умеешь работать с утф8-не берись.
А про отличия можно почитать, например, здесь (навскидку нагуглил первый же сайт):
sd-company.su/article/html_css/codepage_utf8_vs_cp1251
и в догонку
exclusiveblog.ru/markup/windows1251-or-utf8

SergejF 27.07.2012 10:23

Цитата:

Сообщение от mnogoclipov (Сообщение 1260714)
1251 частенько по умолчанию в редакторе стоит, да и не все знают...

Дело не в умолчании и незнании. А:

1. Если текст в основном русский (украинский, белорусский) и слова с буквами не входящие в эти и латинский алфавит встречаются лишь отчасти - нет никакого основания увеличивать размер страниц в два раза.

2. UTF-8 отнюдь не "поддерживает все символы". Как не "доказали ученые отсутствие Бога" сколь бы не твердила подобное советская пропаганда.

mnogoclipov 27.07.2012 11:53

Дружок. Ты статью-то читал ?
Цитата:

■Юникод является стандартом для работы таких часто используемых ныне функций php, как json_encode/json_decode, а так же используемого в Ajax XHttpRequest. Причем, начиная с 6й версии PHP Юникод станет стандартом для всех строковых функций. Поэтому на много быстрее и удобнее скармливать данные уже в utf кодировке а не конвертировать постоянно, потому как все равно функции PHP и JavaScript будут это требовать. То есть, если вы хотите работать с такими технологиями как XML, JSON, AJAX и прочие современные технологии, то вам придется переходить на UTF-8, ибо со времен своего основания они работают только в этой кодировке.
■Поисковые системы значительно лучше относятся к сайтам на UTF-8 кодировке, чем на какой либо другой. Многие скажут, что это спорный момент, однако проводился эксперимент, на 10 сайтах. Один и тот же контент, тот же дизайн, тот же хостер, разные были только кодировки. Не поверите, но сайт на UTF кодировке стоял выше в поисковых позициях. Вот такой вот фокус.
■Для быстрой индексации сайта в поисковых системах Yandex и Google используется файлик sitemap.xml, как ни странно, но работает он только если сделан в UTF, иначе поисковые системы ругаются.
■И напоследок, многие ссылаются на то, что люди постепенно переходят на utf-8 потому, что «кто-то умный сказал, что это хорошо». Соглашусь, кто-то умный это сказал уже давно, а именно - Консорциум W3C (кому-то эти 3 буквы что-то говорят? И рекомендует он использовать для создания web страниц ни что иное, как utf-8. Для тех, кто знает английский (а есть программисты, кто его не знает? Можете почитать.
Если про отношение поисковых машин я лично узнал впервые и не уверен, то что касается XML, JSON, AJAX, которые мною используются постоянно, то на галимой 1251 там действительно присутствуют танцы с бубном. И размер страниц тоже не увеличивается в два раза. Русского текста-да. Но не страниц. Или у тебя теги на русском ? Ладно я бы понял, если бы все сидели на модемном соединении. А так....
Ну и Консорциум W3C как бэ рекомендует использовать именно утф8, а сапа все на 1251..стыдоба.

Цитата:

2. UTF-8 отнюдь не "поддерживает все символы". Как не "доказали ученые отсутствие Бога" сколь бы не твердила подобное советская пропаганда.
Все, не все. 256 и 100 000 символов. Совсем небольшая такая разница. Я так понял, ты все-таки используешь утф8 и тебе не хватает символов ? :cool:

SergejF 27.07.2012 14:16

Цитата:

Сообщение от mnogoclipov (Сообщение 1260862)
Дружок. Ты статью-то читал ?

Давайте-ка на "Вы". Полагаю, с множественным числом местоимения второго лица Вы справитесь. В любой кодировке.


Цитата:

Сообщение от mnogoclipov (Сообщение 1260862)
И размер страниц тоже не увеличивается в два раза. Русского текста-да. Но не страниц.

Большую часть объема страницы составляет текстовый контент. Да, математически объем страницы увеличится не ровно в два раза, а немного меньше. Но Ваше замечание лишь мелкая придирка.


Цитата:

Сообщение от mnogoclipov (Сообщение 1260862)
а сапа все на 1251..стыдоба

Читать не только рекоммендации консорциума следует. Биржа предоставляет код и для UTF-8.


Цитата:

Сообщение от mnogoclipov (Сообщение 1260862)
Все, не все. 256 и 100 000 символов. Совсем небольшая такая разница.

Совсем нет разницы, если в юникоде нет необходимых символов. Приходится танцевать с бубном. И в cp этот танец легче.


Цитата:

Сообщение от mnogoclipov (Сообщение 1260862)
Я так понял, ты все-таки используешь утф8 и тебе не хватает символов ?

У меня есть проект, символов для коего юникод не предоставляет. Он на cp-1251.

mnogoclipov 27.07.2012 14:54

На вы? Без проблем.
Т.е. вы считаете, что при использовании утф8 с большим количеством текста на русском страница будет грузится намного дольше ? Т.е. только один (спорный) недостаток при огромном количестве достоинств перевешивает ? Интересный подход. Я так полагаю, что все ваши сайты - это исключительно самопис или статика (впрочем, вспоминая сайт про перепелов, я этому не удивлюсь). Ведь они грузятся намного быстрее, чем какая-нибудь джумла или вордпресс.

Цитата:

Большую часть объема страницы составляет текстовый контент. Да, математически объем страницы увеличится не ровно в два раза, а немного меньше. Но Ваше замечание лишь мелкая придирка
Если как у перепелов код сайта примерно следующий:
<body>
<div>
Перепела - это круто.....еще 5000 слов.
</div>
</body>
То немного. А если это нормальный сайт с большим количеством тегов, то увеличивается процентов на 10-20, не больше.

По всей видимости вы - консерватор. Наверное до сих сидите на windows XP или даже Windows 98. Ведь они быстрее. В свое время они были очень неплохи, но технологии не стоят на месте. Растет мощность ПК, растет скорость интернета. И глупо обращать внимание на мелочь вроде увеличения веса файла на 2 килобайта (если конечно не цитировать "Войну и мир" на одной странице). При этом многие закрывают глаза, например, на подгрузку библиотеки джиквери, которая есть почти во всех популярных цмс и весит порядка 70 килобайт. 1251 - устаревшая кодировка, как ни крути.
Цитата:

Совсем нет разницы, если в юникоде нет необходимых символов. Приходится танцевать с бубном. И в cp этот танец легче.
Оо...да. Расскажите мне еще про танцы с бубном при использовании аякса и передаче массива с русским текстом в джсон формате в 1251 кодировке. Хотя вряд ли расскажете. Вы же не программист и даже не знаете, что это такое. И насчет легче я бы еще поспорил.
Цитата:

У меня есть проект, символов для коего юникод не предоставляет. Он на cp-1251.
А cp-1251 конечно же предоставляет ? Интересно, а мультиязычный сайт на 1251 сможете сделать ?

Поскриптум. Кстати говоря, утверждение, что поисковики выше оценивают сайты в утф8 вполне имеет право на жизнь, учитывая, что поисковики сами (естественно) используют утф8.

Клон 27.07.2012 15:24

Цитата:

Сообщение от mnogoclipov (Сообщение 1260890)
По всей видимости вы - консерватор.

да, консервы из перепелов вкусные =)


Часовой пояс GMT +3, время: 01:46.

Работает на vBulletin® версия 3.8.7.
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Перевод: zCarot
SAPE.RU — система купли-продажи ссылок с главных и внутренних страниц сайтов.