文字コードを推測する

文字コードを推測する

gauche.charconv


gauche.charconvモジュールを使うと,ces-guess-from-stringで推測できる.

(ces-guess-from-string string scheme)


使用例.
書式のschemeを"*JP"とすると,JIS,EUC,ShiftJIS,UTF-8のいずれかであるとして推測してくれる.

(use gauche.charconv)

(ces-guess-from-string "元はUTF-8" "*JP")
  => "UTF-8"

(let1 shiftjis-str (ces-convert "元はUTF-8" "UTF-8" "SHIFT_JIS")
  (ces-guess-from-string shiftjis-str "*JP"))
  => "Shift_JIS"

(let1 euc-str (ces-convert "元はUTF-8" "UTF-8" "EUC-JP")
  (ces-guess-from-string euc-str "*JP"))
  => "EUC-JP"