|
|
|
Supreme Being
      
участник
Last Login: 29.10.2007 17:42
Сообщ.: 133,
Visits: 1 166
|
|
|
|
|
|
Supreme Being
модератор
Last Login: 04.05.2008 13:32
Сообщ.: 7 240,
Visits: 65 445
|
|
| У тебя на входе строка длиной 156 символов, ты просишь substr вернуть тебе первые 200 символов и удивляешься почему возвращается строка целиком. Где логика?
|
|
|
|
|
Supreme Being
      
участник
Last Login: 27.03.2008 15:26
Сообщ.: 701,
Visits: 7 028
|
|
| Он похоже %D0 за три символа посчитал :)))))
|
|
|
|
|
Supreme Being
      
участник
Last Login: 29.10.2007 17:42
Сообщ.: 133,
Visits: 1 166
|
|
| Все правильно сабстр - работал просто я вывалился чего такие строки получаются здоровые...))) - а с этой кодировкой ничё поделать нельзя? Точнее как раскодировать я знаю ну например этот УТФ8 в рус перегнать... а вот как узнать какая кодировка наверное не реально?
|
|
|
|
|
Supreme Being
модератор
Last Login: 04.05.2008 13:32
Сообщ.: 7 240,
Visits: 65 445
|
|
Ок. В чем тогда проблема? Код<?php $str = "http://www.google.com.ua/searchq=%D0% ... &hl=ru&lr=&inlang=ru&start=10&sa=N"; echo substr($str, 0, 200); ?> возвращает ровно 200 первых символов.
|
|
|
|
|
Supreme Being
модератор
Last Login: 04.05.2008 13:32
Сообщ.: 7 240,
Visits: 65 445
|
|
Silver (31.08.2006) Он похоже %D0 за три символа посчитал :)))))В данном случае это и есть три символа.
|
|
|
|
|
Supreme Being
      
участник
Last Login: 29.10.2007 17:42
Сообщ.: 133,
Visits: 1 166
|
|
|
|
|
|
Supreme Being
      
участник
Last Login: 29.10.2007 17:42
Сообщ.: 133,
Visits: 1 166
|
|
Silver (31.08.2006) Он похоже %D0 за три символа посчитал :)))))Ваще-то он считает его как за 1 символ... потому что выводит длинную строку в кодировке этой....
|
|
|
|
|
Supreme Being
модератор
Last Login: 04.05.2008 13:32
Сообщ.: 7 240,
Visits: 65 445
|
|
ChiEF (31.08.2006) а вот как узнать какая кодировка наверное не реально?В строке запроса Google иногда передается параметр кооторый указывает на кодировку текста запроса и можно ее использовать. В данном случае такого параметра нет, а значит узнать кодировку можно только методом угадывания. Каждую кодировку можно охарактеризовать своей таблицей частоты повторения символов. Считаем частоту повторения симолов в исходном тексте и сравниваем данные с информацией из оригиналньых таблиц. Какая из них подходит ближе, та и является лучшим кандидатом. Хочу подчеркнуть, что не определение кодировки, а ее угадывание. В MSIE тоже есть режим автоподбора кодировки и он далеко не всегда правильно определяет koi8-r это или windows-1251.
|
|
| |