このブログを検索

2013/03/02

日本語をsubstr

perlで、日本語文字列のアタマの部分を決まった文字数だけ取り出す必要があった。
substrコマンドを使ったら、最初の部分が文字化けした。
検索してみると、「use encoding utf8を書けばよい」という情報があったのだが、
最近、「use encodingは非推奨になった」という話を聞いたばかりだったので、それはやりたくなかった。
もう少し検索してみると、要は、substrをする前にデコードしてやればよい、ということであった。