|
Не скажу, что способ изящен, но поставленную задачу он решает.
1. Перекодируем во все известные нам кодировки (точнее из них в ту, в которой работаем)
2. Преобразуем к строчным, убираем \s\t\r\n
3. Считаем буковки.
Если буковок больше (strlen/4)*3, то на 99% кодировка опознана.
PS: Сразу скажу, что способ придуман мной, и возможно существуют более прогрессивные.
|