Google Chrome が Omnibox に入力された内容をどうやって送信してるかパケットキャプチャしてみました
2008年 9月 6日 03:19CNet Japan の記事によると、オートサジェスト機能をオンにし、Google Chrome のアドレスバー「Omnibox」に何か入力すると、その内容は随時 Google に送信され、一部のデータは Google に保存されてしまうそうです。
まぁ、そういうことらしいので、どんな感じで情報が送られているのか、Omnibox に javascript と入力して HTTP のパケットをキャプチャしてみました。
※なお、なんらかの識別ID情報と思われる場所と Cookie の値に関しては省いてあります。
キャプチャその1
GET /complete/search?client=chrome&output=chrome&hl=ja&q=javasc HTTP/1.1 User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US) AppleWebKit/525.13 (KHTML, like Gecko) Chrome/0.2.149.27 Safari/525.13 Accept-Language: ja,en-US,en Accept-Charset: Shift_JIS,*,utf-8 Accept-Encoding: gzip,deflate,bzip2 Host: clients1.google.co.jp Connection: Keep-Alive HTTP/1.1 200 OK Content-Type: text/javascript; charset=utf-8 Expires: Fri, 05 Sep 2008 18:31:27 GMT Content-Encoding: gzip Date: Fri, 05 Sep 2008 17:31:27 GMT Server: Auto-Completion Server Cache-Control: private, x-gzip-ok="" Content-Length: 202
Omnibox には javascript と入力したのですが、サジェスト機能ということもあってか、随時送信が行われているみたいです。
CGI引数の q というパラメータが Omnibox に入力された文字列です。その1の例では、 javascript の javasc と入力された段階で送信されているみたいですね。
キャプチャその2
GET /complete/search?client=chrome&output=chrome&hl=ja&q=javascript HTTP/1.1 User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US) AppleWebKit/525.13 (KHTML, like Gecko) Chrome/0.2.149.27 Safari/525.13 Accept-Language: ja,en-US,en Accept-Charset: Shift_JIS,*,utf-8 Accept-Encoding: gzip,deflate,bzip2 Host: clients1.google.co.jp Connection: Keep-Alive HTTP/1.1 200 OK Content-Type: text/javascript; charset=utf-8 Expires: Fri, 05 Sep 2008 18:31:28 GMT Content-Encoding: gzip Date: Fri, 05 Sep 2008 17:31:28 GMT Server: Auto-Completion Server Cache-Control: private, x-gzip-ok="" Content-Length: 208
キャプチャその2は文字列を最後まで入力した状態です。q の値が javascript となっていることが分かります。
Google サーバからのレスポンスは gzip 形式でエンコードされているため、上記の例では省略してますが、解析したところ JSON 形式でレスポンスがあるようです。
とりあえず、Omnibox に入力した内容はすべて Google に送信されていると思った方がいいみたいですね。しかも、サジェスト機能という性格のため、エンターキーで確定しなくても、随時送られるようです。
ちなみに、Google Chrome 以外でも、Google Toolbar をインストールして、ページランクの表示をオンにしていると、アクセスしているページの URL 情報が Google に送信されてしまうので、そっちも、パケットをキャプチャしてみました。
※こちらも、識別IDっぽい情報は削除・編集しています。
Toolbar ページランク取得クエリのキャプチャ
GET /search?sourceid=navclient-ff&features=Rank&client=navclient-auto-ff&googleip=O;null;90&ch=xxxxxxxx&q=info:http%3A%2F%2Fsearch.yahoo.co.jp%2F HTTP/1.1 Host: toolbarqueries.google.co.jp User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.1) Gecko/2008070208 Firefox/3.0.1 GoogleToolbarFF 3.1.20080714 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Language: ja,en-us;q=0.7,en;q=0.3 Accept-Encoding: gzip,deflate Accept-Charset: Shift_JIS,utf-8;q=0.7,*;q=0.7 Keep-Alive: 300 Connection: keep-alive HTTP/1.1 200 OK Cache-Control: private, max-age=0 Date: Fri, 05 Sep 2008 15:51:06 GMT Expires: -1 Content-Type: text/html; charset=Shift_JIS MT; path=/; domain=.google.co.jp Server: gws Transfer-Encoding: chunked Content-Encoding: gzip
上記の例は、http://search.yahoo.co.jp/ にアクセスした時のパケットキャプチャになります。
Google は、このページランク取得の情報を利用して、どのサイトが、頻繁にアクセスされているかの統計を取っているらしいです。検索結果の順位にも影響があるらしいと言われています。
「世界中の情報を整理し、世界中の人々がアクセスできて使えるようにする」というのが Google のミッションらしいですけど、何でもかんでも情報を収集されるのは、ちょっと抵抗があったりするので、程々にしてほしい所ですね。
Google ストリートビューの件なんかもあるし、もう、Google が「evil なことはしません」なんて言っても、誰も信じなくなりそうだよなぁ。。。
