21.05.2008, 16:57 | #12 |
Дикий
Регистрация: 02.06.2007
Адрес: <Noindex>
Сообщений: 2,551
Вес репутации: 356
|
Правильно, переводим в нижний регистр и считаем количество раз, когда встречается упоминание кодировки
Знаю, можно лучше. Но не знаю как.
__________________
Делаю кулоны с опалами в стекле и не только! |
22.05.2008, 08:04 | #14 |
Специалист
Регистрация: 02.07.2007
Сообщений: 453
Вес репутации: 218
|
товарисчь.
давайте определимся - распространение в рунете получили только cp1251 и UTF-8 Упоминание о типе кодировки может передаваться в хидере, а может в meta А может не передаваться, но тогда очень просто определить что есть что.. Почему? Потому что UTF-8 имеет переменно длинную кодировку тоесть mb_strlen($content,"UTF-8")===strlen(iconv("UTF-8","cp1251",$content)) иначе это не утф..
__________________
И как всегда это все ScanLog записывает |
22.05.2008, 15:12 | #15 | |
Дикий
Регистрация: 02.06.2007
Адрес: <Noindex>
Сообщений: 2,551
Вес репутации: 356
|
Цитата:
К сожалению, функцию mb_strlen($content,"UTF-8")===strlen(iconv("UTF-8","cp1251",$content)) использовать не получится. У Хостера iconv() что-то очень глючный Про то как вытащить указание кодировки из мета - спрашивал уже. Пока ограничился этим: PHP код:
__________________
Делаю кулоны с опалами в стекле и не только! |
|
22.05.2008, 16:04 | #16 |
шайтанама
|
Про распространенные(UTF и 1251) я промолчу(коя еще никто не отменял )
А так тема сложная, до беспредела. Легче всего найти в инете самопальные функции для перекодировки документов. Так как на 90% коряво настроен php у хостера + разные библиотеки(тот же iconv) разные глюки.
__________________
МордоКнига |
22.05.2008, 16:39 | #17 | |
Особый статус
|
Что-то все запутанно. Озучьте цель данных махинаций
Есть функция для конверта win и iso в utf Цитата:
А по поводу распознавания UTF-8 в метатеге Вам ведь правильно сказали - preg_match |
|
22.05.2008, 17:14 | #18 | |
Мастер
Регистрация: 17.03.2008
Сообщений: 638
Вес репутации: 237
|
Цитата:
Это вместо того, чтобы просмотреть несколько первых байтов у тебя функция будет весь текст лопатить, причем два раза сначала strtolower, потом substr_count. Тогда уж проще использовать stripos, если тебе регулярные выражения не по душе по каким-то причинам PHP код:
|
|
22.05.2008, 21:10 | #19 |
Дикий
Регистрация: 02.06.2007
Адрес: <Noindex>
Сообщений: 2,551
Вес репутации: 356
|
Обижаете ))) Потратил 6 часов на данную задачу. Перерыл Инет...
Оказывается, все действительно сложно Про функцию счетчика я знаю (что она смотрит весь файл), только альтернатив очень много. И нучно было что-то регистро независимое. PS Разве прег матч смотрит не весь файл? Еще раз спасибо отписавшимся!
__________________
Делаю кулоны с опалами в стекле и не только! |
22.05.2008, 21:12 | #20 |
Дикий
Регистрация: 02.06.2007
Адрес: <Noindex>
Сообщений: 2,551
Вес репутации: 356
|
А, вспомнил, stripos() я находил в мануале.
Не очень корректно на хостинге с !== работает А иначе - как говорится в мануале - глючит. Сейчас попробую еще раз. Спасиб.
__________________
Делаю кулоны с опалами в стекле и не только! |
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Asp.net - смена кодировки | Avelon | Установка кода на различные движки | 4 | 26.04.2008 18:28 |
Смена кодировки | sca | Контекстные ссылки и все, что с ними связано | 4 | 13.02.2008 19:07 |
Наверное тут это уже боян, но когда закроют дыру по определению что ссылка с сапы? | Spec123 | Вопросы по работе системы | 79 | 26.11.2007 20:37 |
Вылетели кодировки! | ddvhouse | Ошибки при работе с системой | 10 | 25.10.2007 17:27 |
Есть сложный вопрос | maxispeed | Вопросы по работе системы | 8 | 20.09.2007 22:25 |
Часовой пояс GMT +3, время: 18:52.