このブログを検索

2011/11/15

ezsch

アクセスログにデコードされていない文字列が。UAを見ると、"ezsch"とあった。 解析スクリプトの検索エンジンごとの処理に"ezsch"を追加する。 が、デコード結果が化ける。文字コードが違うのだろう・・・。 なんの文字コードなのかが判断できないので検索するとshift-jisらしい。
uri_unescapeの前にshiftjisでdecodeする。まだダメだ。 後か。 uri_unescapeした文字列をもう一回shift-jisでデコード。 できた。

しかし、やっていることはほとんど同じで、サーチエンジンによる違いというのは

  • UAに含まれる検索エンジン名

  • 検索文字列の前につく文字列(p= とか、 q= とか)

  • uri_unescapeの後にさらにデコードが必要な場合それをやる

なので、本当はこれらを引数にしてサブルーチン化すればよいのである。