先日書いた「 日立のクローラー(px2.hitachi.co.jpからの大量アクセス) 」について以下の回答がありました。 この度は、ご迷惑をお掛けし申し訳ございません。 また、回答が遅れましたこと、深謝いたします。 調査いたしましたところ、今回は弊社中央研究所知能システム研究部からのアクセスでした。弊社では画像検索サイトGazoPa( http://www.gazopa.com )を立ち上げており、中央研究所知能システム研究部がサイトの技術的サポートとして、インデックス情報の収集を実施しております。 至急、本サイトにおけるクローリングを停止するように指示をしました。 GazoPaでは、Web利用者の皆様が閲覧したいページを効率的に捜すための一助として、画像自体をキーとして「似ている画像を検索する」サービスの実証実験を行なっております。そのため、Webクローラーを用いてWeb上で公開されたホームページから画像検索に必要な情報を抽出し、検索用のインデックス情報を蓄積しております。 サイト開設者の皆様にご迷惑をおかけしないよう、同一サイトへの集中アクセス回避や、robots.txt
日立のクローラーは「GazoPa」だった。
5月 16th, 2009
Tags: マイルドソルト-3
Content-Length: 5113
