検索の文字コードの分布の話

webalizerの検索語の表示に関連して、 このサイト(tyche.pu-toyama.ac.jp)に来る検索を調べてみたので、 ここに記録として書いておくことにする。

基本データ

www.google.co.jp

852件

www.google.com

285件

search.yahoo.co.jp

213件

すべてURLエンコーディングでEUC-JPかASCII
「http://search.yahoo.co.jp/bin/query?p=%a5%d6%a1%bc%a5%d3%a1%bc%a4%c8%a4%cf&hc=0&hs=0」

websearch.yahoo.co.jp

174

すべてURLエンコーディングでEUC-JPかASCII
「http://websearch.yahoo.co.jp/bin/query?p=%b2%c3%c6%a3%cd%a7%ce%a4&hc=0&hs=0」

search.msn.co.jp

34件

cgi.search.biglobe.ne.jp

15件

すべてEUC-JPかASCII
「http://cgi.search.biglobe.ne.jp/cgi-bin/search-st_lp?q=%A5%D6%A1%BC%A5%D3%A1%BC%A4%C8%A4%CF&num=10&start=0」

web.archive.org

14件

「http://web.archive.org/web/20011213080848/http://tyche.pu-toyama.ac.jp/index.html」 こんなのも含めるべきか?

www.infoseek.co.jp

6件

すべてEUC-JP
「http://www.infoseek.co.jp/OTitles?svx=460100&nh=10&nc=1&col=OW&qt=%A5%D6%A1%BC%A5%D3%A1%BC%BE%DE+%B0%D5%CC%A3&qp=0」

search.nifty.com

6件

search.goo.ne.jp

5件

すべてEUC-JPかASCII
「http://search.goo.ne.jp/web.jsp?MT=%CF%C0%CA%B8%B8%A1%BA%F7&SM=MC&DC=10&DE=2&FR=150&WTS=ntt&CK=1」

www.excite.co.jp

4件

すべてShift_JIS
「http://www.excite.co.jp/search.gw?search=%83%5C%83t%83g%81@%8DH%8Aw&look=zaurus_jp&lang=all&target=web&collection=web&start=0&showSummary=true&perPage=10&next=%8E%9F%82%CC%8C%8B%89%CA」

IPアドレスのもの

14件

     10 216.239.57.104
      3 216.239.33.104
      3 216.239.39.104
      4 216.239.53.104
      1 216.239.41.104
すべてgoogleのキャッシュからの参照で、
URLエンコーディングのUTF-8。
すべてie=UTF-8が付く。
「http://216.239.39.104/search?q=cache:782jNxcM8rUJ:tyche.pu-toyama.ac.jp/~a-urasim/pxegrub.html+PXE%E3%81%A8%E3%81%AF&hl=ja&ie=UTF-8」


      4 210.150.25.33
gooのキャッシュからの参照。
URLエンコーディングでEUC-JP。

その他

25件

      2 www.google.co.in
両方ie=UTF-8でASCII

      2 www.google.de
ie=ISO-8859-1とie=UTF-8で両方ASCII。

      1 aolsearch.jp.aol.com EUC-JP
      1 apple.excite.co.jp   Shift_JIS
      1 ocnsearch.goo.ne.jp  EUC-JP
      1 search.fresheye.com  EUC-JP
      1 search.jp.aol.com    UTF-8
      1 search.virgilio.it   ASCII
      1 search.yahoo.com     ASCII(ei=UTF-8)
      1 so-net.excite.co.jp  ASCII(lang=jp)
      1 www.dogpile.com      「http://www.dogpile.com/info.dogpl/search/web/pxegrub」
      1 www.google.at        ASCII(ie=UTF-8)
      1 www.google.ca        ASCII(ie=ISO-8859-1)
      1 www.google.ch        ASCII(ie=UTF-8)
      1 www.google.co.th     ASCII(ie=UTF-8)
      1 www.google.com.au    ASCII(ie=UTF-8)
      1 www.google.com.br    ASCII(ie=UTF-8)
      1 www.google.com.tw    ASCII(ie=UTF-8)
      1 www.google.dk        ASCII(ie=UTF-8)
      1 www.google.fi        ASCII(ie=UTF-8)
      1 www.google.fr        ASCII(ie=UTF-8)
      1 www.google.it        ASCII(ie=UTF-8)
      1 www.google.nl        ASCII(ie=UTF-8)