monqy blog
このブログを検索
2011/11/15
ezsch
アクセスログにデコードされていない文字列が。UAを見ると、"ezsch"とあった。 解析スクリプトの検索エンジンごとの処理に"ezsch"を追加する。 が、デコード結果が化ける。文字コードが違うのだろう・・・。 なんの文字コードなのかが判断できないので検索するとshift-jisらしい。
uri_unescapeの前にshiftjisでdecodeする。まだダメだ。 後か。 uri_unescapeした文字列をもう一回shift-jisでデコード。 できた。
しかし、やっていることはほとんど同じで、サーチエンジンによる違いというのは
UAに含まれる検索エンジン名
検索文字列の前につく文字列(p= とか、 q= とか)
uri_unescapeの後にさらにデコードが必要な場合それをやる
なので、本当はこれらを引数にしてサブルーチン化すればよいのである。
次の投稿
前の投稿
ホーム