31.08.2014, 11:39 | #1 |
Мастер
Регистрация: 05.10.2011
Адрес: Напротив окна
Сообщений: 741
Вес репутации: 190
|
Ищу инфо по всем применяемым кодировкам
Пишу скрипт, который должен определенным образом обрабатывать контент любой скормленной ему страницы. Столкнулся с тем что часто кодировки на страницах никак не объявляются и приходится анализировать контент на предмет частоты вхождения каких-то символов чтобы понять кодировку.
В связи с этим есть вопросы: 1. В какой пропорции на сегодня используются основные кодировки 1251, utf-8, koi8r ? мне пока кажется что примерно 49% / 49% / 2% 2. Сталкивались ли Вы с иными кодировками для кириллицы ?
__________________
|
31.08.2014, 11:51 | #2 |
Эксперт
Регистрация: 17.02.2008
Адрес: Донецк, ДНР, Россия
Сообщений: 8,885
Вес репутации: 508
|
Имхо и субъективно: utf используют чаще, чем в 49%. Сам, при отсутствиии обязательств (например, narod.ru после перевода на укоз насильственно перекодировали в utf) использую cp-1251. Благо, что любые юникодные символы можно отобразить esc-последовательностью.
Знаю, что есть еще ISO 8859-5, но вот чтобы сталкиваться с ней... |
31.08.2014, 13:27 | #3 |
Добрый модератор
Регистрация: 09.07.2007
Адрес: глобус Украины
Сообщений: 27,600
Вес репутации: 1030
|
Даже в заголовках?
__________________
Правильный хостинг. В личке бесплатно не отвечаю обычно. |
31.08.2014, 13:35 | #4 |
Мастер
Регистрация: 05.10.2011
Адрес: Напротив окна
Сообщений: 741
Вес репутации: 190
|
Угу, Сергей уже привел пример - narod.ru . И у браузеров нет проблем. И у меня не должно быть ...
__________________
|
31.08.2014, 14:56 | #5 |
Специалист
|
В случае нынешнего Народа есть прикол... В заголовках вин-1251 или кои8-р, а по факту в нутрях утф-8... Каждую страницу в браузере приходится Вид->Кодировка->UTF-8 делать... Не все сайты на Народе живы (в смысле обновлениями ВМами), но посещалка живая ежедневно есть... Бывает...
|
31.08.2014, 15:21 | #6 |
Специалист
Регистрация: 22.12.2013
Адрес: Файна
Сообщений: 483
Вес репутации: 158
|
в мире немного по другому - в росии может быть
iso-8859 (и их несколько) windows-1252 windows-1251 cp 866 из тех что встречал я
__________________
|
31.08.2014, 15:26 | #7 | |
Мастер
Регистрация: 05.10.2011
Адрес: Напротив окна
Сообщений: 741
Вес репутации: 190
|
Меня только в России и интересует
Цитата:
1252 - это вообще засада ... если вовремя не загасить, то можно весь контент потерять ...
__________________
|
|
31.08.2014, 15:31 | #8 |
Специалист
Регистрация: 22.12.2013
Адрес: Файна
Сообщений: 483
Вес репутации: 158
|
на cp 866 уже не помню где видел а на iso-8859 если не указано другое пробует отдавать ISPmanager не у всех конечно но встречаеться
__________________
|
08.09.2014, 14:13 | #9 |
Мастер
Регистрация: 05.10.2011
Адрес: Напротив окна
Сообщений: 741
Вес репутации: 190
|
Столкнулся с первой (ожидавшейся) подставой, у сайта прописана кодировка ютф-8 , а на самом деле выдача идет в формате 1251 ... И сайт в топе по многим запросам. крутая фирма по оказанию услуг сертификации.
__________________
|
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Доп инфо - возраст домена | Inet | Пожелания пользователей системы | 8 | 24.12.2010 05:48 |
Изменили DIV инфо | Jooz | Вопросы по работе системы | 0 | 30.06.2009 17:32 |
Изменение инфо | Neuron | Вопросы по работе системы | 7 | 09.10.2008 06:51 |
всем, всем, всем! Решение проблемы с PHP кодом | babilonking | Вопросы по работе системы | 3 | 16.05.2007 10:06 |
Часовой пояс GMT +3, время: 03:37.