Вернуться   Форум SAPE.RU > Общие вопросы > Разработка и сопровождение сайтов

-->
Ответ
 
Опции темы
Старый 31.08.2014, 11:39   #1
Мастер
 
Аватар для SPQR
 
Регистрация: 05.10.2011
Адрес: Напротив окна
Сообщений: 741
Вес репутации: 184
SPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущее
По умолчанию Ищу инфо по всем применяемым кодировкам

Пишу скрипт, который должен определенным образом обрабатывать контент любой скормленной ему страницы. Столкнулся с тем что часто кодировки на страницах никак не объявляются и приходится анализировать контент на предмет частоты вхождения каких-то символов чтобы понять кодировку.

В связи с этим есть вопросы:

1. В какой пропорции на сегодня используются основные кодировки 1251, utf-8, koi8r ? мне пока кажется что примерно 49% / 49% / 2%

2. Сталкивались ли Вы с иными кодировками для кириллицы ?
__________________
Si vis pacem, para bellum
SPQR вне форума   Ответить с цитированием
Старый 31.08.2014, 11:51   #2
Эксперт
 
Аватар для SergejF
 
Регистрация: 17.02.2008
Адрес: Донецк, ДНР
Сообщений: 8,880
Вес репутации: 503
SergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущееSergejF - прекрасное будущее
По умолчанию

Имхо и субъективно: utf используют чаще, чем в 49%. Сам, при отсутствиии обязательств (например, narod.ru после перевода на укоз насильственно перекодировали в utf) использую cp-1251. Благо, что любые юникодные символы можно отобразить esc-последовательностью.


Цитата:
Сообщение от SPQR Посмотреть сообщение
Сталкивались ли Вы с иными кодировками для кириллицы ?
Знаю, что есть еще ISO 8859-5, но вот чтобы сталкиваться с ней...
SergejF вне форума   Ответить с цитированием
Старый 31.08.2014, 13:27   #3
Добрый модератор
 
Аватар для zhegloff
 
Регистрация: 09.07.2007
Адрес: глобус Украины
Сообщений: 27,600
Вес репутации: 1025
zhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущееzhegloff - прекрасное будущее
По умолчанию

Цитата:
Сообщение от SPQR Посмотреть сообщение
Столкнулся с тем что часто кодировки на страницах никак не объявляются
Даже в заголовках?
__________________
Установка кода сапы от $9.95. Пишите в личку.
Правильный хостинг.
В личке бесплатно не отвечаю обычно.
zhegloff вне форума   Ответить с цитированием
Старый 31.08.2014, 13:35   #4
Мастер
 
Аватар для SPQR
 
Регистрация: 05.10.2011
Адрес: Напротив окна
Сообщений: 741
Вес репутации: 184
SPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущее
По умолчанию

Цитата:
Сообщение от zhegloff Посмотреть сообщение
Даже в заголовках?
Угу, Сергей уже привел пример - narod.ru . И у браузеров нет проблем. И у меня не должно быть ...
__________________
Si vis pacem, para bellum
SPQR вне форума   Ответить с цитированием
Старый 31.08.2014, 14:56   #5
Специалист
 
Регистрация: 05.09.2010
Сообщений: 222
Вес репутации: 176
tex_1982 - луч света в тёмном царствеtex_1982 - луч света в тёмном царствеtex_1982 - луч света в тёмном царствеtex_1982 - луч света в тёмном царствеtex_1982 - луч света в тёмном царствеtex_1982 - луч света в тёмном царстве
Отправить сообщение для tex_1982 с помощью ICQ
По умолчанию

В случае нынешнего Народа есть прикол... В заголовках вин-1251 или кои8-р, а по факту в нутрях утф-8... Каждую страницу в браузере приходится Вид->Кодировка->UTF-8 делать... Не все сайты на Народе живы (в смысле обновлениями ВМами), но посещалка живая ежедневно есть... Бывает...
tex_1982 вне форума   Ответить с цитированием
Старый 31.08.2014, 15:21   #6
Специалист
 
Аватар для 緋色のローブプリンス
 
Регистрация: 22.12.2013
Адрес: Файна
Сообщений: 483
Вес репутации: 153
緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее
По умолчанию

Цитата:
Сообщение от SPQR Посмотреть сообщение
49% / 49% / 2%
в мире немного по другому - в росии может быть
Цитата:
Сообщение от SPQR Посмотреть сообщение
2. Сталкивались ли Вы с иными кодировками для кириллицы ?
iso-8859 (и их несколько)
windows-1252
windows-1251
cp 866

из тех что встречал я
__________________
Ускоренный курс как оптимизировать под гугл, полный курс @ Капча дорого? Попробуй xmlstock | Установка кода
緋色のローブプリンス вне форума   Ответить с цитированием
Старый 31.08.2014, 15:26   #7
Мастер
 
Аватар для SPQR
 
Регистрация: 05.10.2011
Адрес: Напротив окна
Сообщений: 741
Вес репутации: 184
SPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущее
По умолчанию

Цитата:
Сообщение от 緋色のローブプリンス Посмотреть сообщение
в мире немного по другому - в росии может быть
Меня только в России и интересует

Цитата:
Сообщение от 緋色のローブプリンス Посмотреть сообщение
iso-8859 (и их несколько)
windows-1252
windows-1251
cp 866

из тех что встречал я
Есть живые примеры на iso-8859 и cp 866 ?

1252 - это вообще засада ... если вовремя не загасить, то можно весь контент потерять ...
__________________
Si vis pacem, para bellum
SPQR вне форума   Ответить с цитированием
Старый 31.08.2014, 15:31   #8
Специалист
 
Аватар для 緋色のローブプリンス
 
Регистрация: 22.12.2013
Адрес: Файна
Сообщений: 483
Вес репутации: 153
緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее緋色のローブプリンス - прекрасное будущее
По умолчанию

Цитата:
Сообщение от SPQR Посмотреть сообщение
Меня только в России и интересует



Есть живые примеры на iso-8859 и cp 866 ?

1252 - это вообще засада ... если вовремя не загасить, то можно весь контент потерять ...
на cp 866 уже не помню где видел а на iso-8859 если не указано другое пробует отдавать ISPmanager не у всех конечно но встречаеться
__________________
Ускоренный курс как оптимизировать под гугл, полный курс @ Капча дорого? Попробуй xmlstock | Установка кода
緋色のローブプリンス вне форума   Ответить с цитированием
Старый 08.09.2014, 14:13   #9
Мастер
 
Аватар для SPQR
 
Регистрация: 05.10.2011
Адрес: Напротив окна
Сообщений: 741
Вес репутации: 184
SPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущееSPQR - прекрасное будущее
По умолчанию

Столкнулся с первой (ожидавшейся) подставой, у сайта прописана кодировка ютф-8 , а на самом деле выдача идет в формате 1251 ... И сайт в топе по многим запросам. крутая фирма по оказанию услуг сертификации.
__________________
Si vis pacem, para bellum
SPQR вне форума   Ответить с цитированием
Старый 12.09.2014, 04:56   #10
Новичок
 
Регистрация: 12.05.2011
Сообщений: 76
Вес репутации: 165
Status-X - просто великолепная личностьStatus-X - просто великолепная личностьStatus-X - просто великолепная личностьStatus-X - просто великолепная личностьStatus-X - просто великолепная личностьStatus-X - просто великолепная личность
По умолчанию

функция mb_convert_encoding вполне сносно справляется с задачей как у вас, главное не забыть инициализировать mbstring, перед использованием, под нужную на выходе кодировку
Status-X вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Доп инфо - возраст домена Inet Пожелания пользователей системы 8 24.12.2010 05:48
Изменили DIV инфо Jooz Вопросы по работе системы 0 30.06.2009 17:32
Изменение инфо Neuron Вопросы по работе системы 7 09.10.2008 06:51
всем, всем, всем! Решение проблемы с PHP кодом babilonking Вопросы по работе системы 3 16.05.2007 10:06


Часовой пояс GMT +3, время: 10:27.