"2005年10月" archive
10 29, 2005
Riva: 顔とか文字を自動認識するソーシャルフォトブックサービス.
要するに、顔認識&文字認識の機能が付いたFlickr。顔認識については、ただ顔の存在を認識するだけではなく、個々人の顔の特徴を学習してくれる。つまり、アップロードした写真に誰かの顔が写っていたとき、顔認識した上でそれが誰かというのを識別して、自動的にその人の名前でタグを付けてくれる。どれだけの精度が出るのかはちょっと分からないけど、非常におもしろい。
お決まりのように招待制。ただし、開発者にメールを送れば招待してくれるらしい。
10 28, 2005
QrONE CSS Designer: ajaxでお手軽なCSSデザイナ
"QrONE CSS Designer"はajaxで作られたCSSデザイナです。これはすごい。CSSをまったく知らないおれでも、直感的かつ楽ちんにCSSを編集できます。
ちなみに"QrONE"は「くろーん」と読むらしいです。
QrONE CSS Designer
http://www.qrone.org/cssdesigner.html
10 22, 2005
都内某社で開催されたクローラ勉強会のスライドを公開します。
とある会社にお呼ばれして、先の水曜日に、クローラについて講義(?)をしてきました。その時に使ったパワーポイントのスライドを公開します。クローラという、非常にマイナーな題材ではありますが、興味のある方はぜひご覧になってください :-)
出席者が皆さんエンジニアの方だったので、内容も技術寄りなものになっています。最初にクローラについてざっと説明して、あとはクローラを作るときにどのような技術的な問題があるのかを順に述べていくという構成になっています。
また、以下補足的に、クローラを扱った有用なURLを紹介します。
クローラについては、少なからぬ数の学術研究が行われています。wikipediaの「web crawler」の項目では、それらが見通し良くまとめられています。簡潔にして要を得ており、クローラを扱った研究を概観するのにこれ以上のものはおそらくないだろうと思われます。
Issac Goldstandによるパワーポイント資料「Creating a Web Crawler in 3 Steps」では、シンプルなクローラをLib-WWW Perl(LWP)等のライブラリを使ってperlで実装する流れを解説しています。実際のソースコードも載っており、クローラの実装の実例を知るのに非常に有用です。
カリフォルニア大学アーバイン校のPierre Baldiらは、彼らの著書「Modeling the Internet and the Web : Probabilistic Methods and Algorithms」の内容をまとめたスライドをWebで公開しています。その中にクローラに関する内容があり、数式だらけでやや高度ですが、応用的なクローリング手法について紹介されています。
David Kelloggによる「Evaluation of Open Source Spidering Technology」では、オープンソースなクローラの評価を行っています。オープンソースなクローラについて知るには、僕のまとめたエクセルシートもそれなりに有用かもしれません。
他にもあると思うんですが、他に良いURLをご存じなら、ぜひコメント欄で教えてください。スライドの内容についての突っ込みも歓迎します。
http://www.msn.com/のページランクが2になってる件
どうなってるんだろう。ぼくのblogより低いよ!
MSN.com
http://www.msn.com/
10 17, 2005
MT3.2へのアップグレードに失敗した記録
MovableTypeのバージョンを、3.11-jaから3.2-ja-2へ上げようとしたのだけど、どうもうまくいかず、結局1からインストールした。その記録を書いておくよ。
先ず。フツーに3.2-ja-2のパッケージを落としてきて、解凍して、mt-config.cgiを書いて、mt-check.cgiで環境がちゃんと整ってることをチェックして、mt-upgrade.cgiを実行した。そうしたら下のようなメッセージが出た。
アップグレード中にエラーが発生しました: ERROR: null value in column "template_modified_on" violates not-null constraint
mt-upgrade.cgiを再実行すると、以下のようになった。
アップグレード中にエラーが発生しました: レコードの保存中にエラーが発生しました: SQLエラーが発生しました: ERROR: null value in column "template_id" violates not-null constraint
あとは数回mt-upgrade.cgiを再実行しても、メッセージは同じまま。どうもnull禁止の制約が付いているところにnull値を入れようとしているように思われるので、直接データベースを弄って制約を解除しようとする。
[root@shalm MT2]# psql mt
でPostgreSQLにログイン。
テーブル名の一覧を出すと、mt_template、mt_template_upgradeがそれらしかったので、この2つのテーブルに付いている制約を外してやろうとする。荒っぽく以下のようにやる。
CREATE TABLE temp AS SELECT * FROM mt_template_upgrade;
DROP TABLE mt_template_upgrade;
CREATE TABLE mt_template_upgrade AS SELECT * FROM temp;
DROP TABLE temp;
CREATE TABLE temp AS SELECT * FROM mt_template;
DROP TABLE mt_template;
CREATE TABLE mt_template AS SELECT * FROM temp;
DROP TABLE temp;
そうしてmt-upgrade.cgiを実行する。以下のようになった。
アップグレード中にエラーが発生しました: ERROR: relation "mt_template_upgrade" already exists
"relation"ってのはテーブルのことを指す。要するにmt_template_upgradeが既に存在するからダメだと。仕方ないのでmt_template_upgradeをバックアップしつつ削除してもう一回実行する。
CREATE TABLE backup_template AS SELECT * FROM mt_template_upgrade;
DROP TABLE mt_template_upgrade;
バージョン: 3.2のデータベースからアップグレードします。
データベースをアップグレードします: MT::Template
デフォルト・テンプレート「Comment Preview Template」を登録します。
デフォルト・テンプレート「Comment Pending Template」を登録します。
デフォルト・テンプレート「Comment Error Template」を登録します。
デフォルト・テンプレート「Uploaded Image Popup Template」を登録します。
デフォルト・テンプレート「Comment Listing Template」を登録します。
デフォルト・テンプレート「Dynamic Pages Error Template」を登録します。
デフォルト・テンプレート「TrackBack Listing Template」を登録します。
アップグレード中にエラーが発生しました: Assertion *retlen+1 <= resultant_len+2 failed: file "quote.c", line 319 at lib/MT/ObjectDriver/DBI.pm line 341. at lib/MT/Upgrade.pm line 1340
これはmt-upgrade.cgiを再実行すると解消される。で、アップグレードに成功した旨のメッセージが出る。
ブラウザでmt.cgiアクセスしてみると、正常にログインできた。
ただし、テンプレートのデータが引き継がれていないので、
\o /home/shin/templates.txt;
select * from backup_template;
でbackup_templateの中身を/home/shin/templates.txtに書き出せる。あとは手作業で復旧する。だるい。それで、テンプレートを一通り設定して、再構築させようとすると怒られる。
Can't call method "build_dynamic" without a package or object reference at lib/MT/Blog.pm line 293
ソースコードをざっと見てみるが、良く分からずお手上げ。1からインストールしたほうが早いだろうと思ってそうした。
10 16, 2005
ぬるぽカンパニー
Atom Smasher's Office Building Sign Generator
http://atom.smasher.org/office/
10 14, 2005
三洋電機の新ビジョン
なんだこりゃ。
傾いた会社は大変だな。
三洋電機の新ビジョン
http://www.sanyo.co.jp/koho/doc/j/corporate/sougyou3.html
コメントスパムが1400匹
http://www.hi.sfc.keio.ac.jp/archives/000064.html
あっはっは。
10 13, 2005
動画iPodを何に使ったら面白いんだろう
Apple、QVGA液晶搭載MPEG-4/H.264対応の新「iPod」
http://www.watch.impress.co.jp/av/docs/20051013/apple1.htm
良い使い道が思い浮かばないなあ。
同じ動画がPCとiPodにあるなら、たいていの人は可能な限りPCのモニタで見たいと思うだろう。そちらのほうが画面も大きいし、画質も良いから。もちろん音楽についても同じことは言えるけど、PCとiPodの間にある落差の大きさが違っている。
それに、音楽は何かをしながら聴くことができるけど、動画を見るときには視線を持っていかれるために他のことができない。街を歩きながら動画を見るのは難しい。重要なのは、時間は有限だってことだ。お気に入りの動画を、PCで見るのもiPodで見るのも同じ時間が掛かるなら、家に帰ってからPCのモニタで見ようと考える人が多いとおもう。
ただ、このあたりのことは既にApple自身が言っていたはず。
それで、iPodの動画再生が有効なのは、次の2つの点になると思われる。
まず、「見たい動画をその場で見たい」というニーズに対応できるという点。ただ、その具体的な例というとあまり挙げられない。PCの前に居ないときに、「ああ、今すぐあの動画が見たい何としてでも見たい」と思うようなケースにはどんなものがあるだろう。
次に、空き時間を有効に利用できるという点。たとえば、通勤・通学中の電車内。スポーツ新聞を読むくらいなら、iPodでなにかしらの動画を見ていたいという人は多そうだ。また、細切れな視聴に耐えるような動画なら、講義の間の休み時間にちょっとずつ見進めていくということもできる。
podcastingと絡めると面白いことができるのかも。ありがちなアイディアとしては、朝起きるとiPodにその日のニュース動画が入っていて、通勤途中の電車内で見られるとか。
しかし何というか、どちらかというと、iTMSの成功に乗じて、音楽だけじゃなくてプロモーションビデオも売ってやろうというAppleの戦略から出てきた製品という感じがします。
10 11, 2005
[論文紹介]blogをネタにした研究報告を、3つ。
大学図書館で情報処理学会の研究報告に目を通していたら、blogものが3報も出ているのを見つけた。ざっと読んだので、内容をここに書いておく。
(1) 中島伸介 et. al., Blogスレッドの解析に基づく重要なbloggerの発見 -blogスレッド形成におけるTrackbackの影響に関する考察-, 情報処理学会研究報告, DBS-137, pp31-38.
- 国内blogのTrackback利用状況に関する調査報告。タイトルには"重要なbloggerの発見"とあるが、そこにはあまり深く踏み込んでいない。
- nifty.com, typepad.com, typepad.jp, weblogs.jp, blog.ocn.ne.jp, blogzine.jp, mo-blog.jp, no-blog.jp, de-blog.jpの9ドメインからblogデータを収集し、そこから15,035のトラックバックを抽出、それらについて分析した結果を報告している。
- 全体の84.6%は空トラックバック(トラックバック先の記事へのリンクを貼っていない記事からのトラックバック)だった。この数字の中にはトラックバックスパムが含まれるが、全てがトラックバックスパムというわけではない。
- 全体の11.5%は相互トラックバック(2つの記事がお互いにトラックバックを送り合うこと)だった。
- 空トラックバックを伴う50組の記事を無作為に選択し、人手により各々の組に内容的な関連があるかを調べた。すると、その全てに内容的な関連があると判断された。(ただし、この結果を持ってトラックバックスパムの割合を推定するのは適切ではない。既にblogの書き手によって削除されてしまっている等の可能性を考慮しなければならないため)
- 考察として、空トラックバックは必ずしもスパムではなく、あまり一般的には認識されていないような緩やかなコミュニティを形成しているケースが存在するとしている。
(2) 竹原幹人 et. al., Blogにおける書き手の興味を考慮した意見情報の提示手法, 情報処理学会研究報告, DBS-137, pp39-45.
- ニュース記事に関する意見をblogから抽出し、ほげほげする手法を議論。
- ちょっと漠然としているなあ
- これを書くなら、先の信学会論文誌に載ったnews & blog searchの論文を引用するべきでは。
(3) 倉島健 et. al., 街Blogからの体験抽出とその空間的提示手法の提案, 情報処理学会研究報告, DBS-137, pp47-53.
- 観光地など、ある場所を実際に訪れて書かれた記事をblogから抽出する手法、およびそれを地図上にプロットして提示するインタフェースの提案。これはかなり面白い。
- たとえばblog検索エンジンで「清水寺」などと検索しても、その検索結果はノイズ混じりなものとなる。そこでもっと質の良い検索結果を得たいというのが研究のモチベーション。
- 記事のタイトルと本文から、相関ルールを用いて行為を意味する文を抽出する。たとえば「紅葉を拝観する」など。処理は文単位。相関ルールの要素としては、日付、地名、名詞、動詞、サ変名詞を用いる。
- 処理の流れ。1、複数のblog検索エンジンを用いて地名で検索し、検索結果を得る。2、得られた記事のタイトル・本文から文節を抽出する。Chasenを用いて形態素解析。3、相関ルールを抽出。月ごとのような時間的な区切りを単位として行う。4、ユーザが検索する。うまー。
- 結果を見ると、かなり良くできているとは思うが、「言う」「思う」のような一般的な動詞が多く現れる、同義語の問題など、改善点が見られる。
[読書]コンピュータはむずかしすぎて使えない!
ソフトウェア開発におけるデザインの重要性について述べた本。著者のアラン・クーパーはMicrosoftでVisual Basicを作った人。今ではMicrosoftを辞めて自分の会社をやっている。
まず、コンピュータが使いにくいという話から始まる。使いにくいコンピュータの例を一頻り挙げた後で、それらが何故使いにくいのかを「知覚的なずれ」という言葉で説明する。「知覚的なずれ」とは何なのか、一言では説明しづらいが、ソフトウェアの操作と、それによって為される処理との間にある感覚的な乖離の度合い、といったところだろうか。「知覚的なずれ」の小さい例として、クーパーはタイプライターを挙げる。Aのキーを押せば紙にAが印字されるし、Bのキーを押せば紙にBが印字される。ユーザの操作(キーを押す)と機械の振る舞い(押されたキーを印字する)は完全に一対一で対応していて、感覚的な乖離は小さい。押されたキーに描かれている文字が印字されるというのは、ユーザにとって、まったく感覚的に受け入れやすい動作だ。初めてタイプライターを見た子供にだって直ぐに分かるだろう。それに対して、現在のコンピュータで使われるようなソフトウェアはそうではない、というわけ。現在的なソフトウェアは複雑な機能の塊で、どうしても「知覚的なずれ」は大きくならざるを得ない。それを踏まえた上で、できるだけユーザにとって使いやすいソフトウェアを作るにはどうしたら良いのでしょう、というのが本書の問題意識だ。
続いて、クーパーはソフトウェア開発の現状を概観し、なぜ使いにくいソフトウェアが出来てしまうのかを説明する。彼の主張を端的にまとめると、要するに、「プログラマ(ソフトウェア開発者たち)が好き勝手にデザインをやっているのが悪い」ということになる。プログラマはとにかく機能を詰め込んでしまう傾向があるし、自分自身が上級者であるが故に上級者向けのデザインをしてしまいがちだ。それに、プログラマはコンピュータと同化しすぎているので、「知覚的なずれ」に鈍感になってしまっている。そうして出来上がってきたソフトウェアは、結果的に、ごく普通のユーザに取って使いにくいものになってしまっている。そこでソフトウェアデザインが必要になる。
それで、クーパーは具体的な方法として次の2点を提案している。
1. 最初にデザインをしてから開発に取りかかる
2. そのソフトウェアの典型的なユーザ(ペルソナ)を想定した上でデザインする
1.については、当たり前のことを言っているなという感じもする。いきなりプロトタイプを作り始めるのは止めましょう。ちゃんとデザインを固めた上で、プログラミングに着手するようにしましょう。そういうこと。
2.が本書のキモになる部分。ソフトウェアをデザインするに当たっては、そのソフトウェアをどのようなユーザが使うのかということを想定し、彼らのプロフィールを作る。名前や年齢に始まって、職業や、そのソフトウェアをどういう目的で使うかなど、詳細なプロフィールを設定する。彼らを「ペルソナ」と呼ぶ。そして、ペルソナたちがソフトウェアにどんな要求を持つかということを分析し、ソフトウェアのデザインを決めていく。
で、ここからは僕の感想。ペルソナを想定した上でデザインするというのは面白い。ソフトウェアに搭載する機能を絞り込んでいく方法としてはとても良いと思う。ただ、ニッチなソフトウェアを作るときには有用だろうが、たとえばMicrosoft Officeのような世界中のあらゆる層をユーザとするようなソフトウェアを作ろうとするときにも有用なのかは分からない。Microsoft Officeにペルソナを設定しようとしたら何百人ものプロフィールが必要になるのでは。ペルソナを使うというのは、「他のユーザのことはどうでも良いから、あるユーザにとって100点となるソフトウェアを作ろう」ということなのだと思う。
10 10, 2005
"M.O.L. My Own Label"でラベルを作ろう
本日ご紹介するのは、とびっきりcoolなWebサイト"M.O.L. My Own Label"。フォームを埋めてボタンを押せば、こんな感じのこじゃれたラベルを作ってくれるよ。え、こんなもの作って、何に使うのかって? それは自分で考えて!
M.O.L. My Own Label
http://www.m-o-l.net/
10 9, 2005
萌えるソースコード
馬鹿だ! 馬鹿がいるぞ! (最上級の褒め言葉)
萌えるソースコード集
http://uguu.org/sources.html
恋人にプロポーズするのにAsk Jeevesを使ったひとが居るらしい
はは。面白い。詳しいストーリーはリンク先(英語)で。
Proposing Via Search
http://blog.outer-court.com/archive/2005-10-07-n65.html
10 8, 2005
google先生と一緒に小学校時代の同級生を捜す
部屋の整理をしていたら、小学校の卒業アルバムが見付かった。
それで、暇に飽かして、かつての友人らの本名を、googleに打ち込むということをひたすらしてました。懐かしい彼らの足取りが、何かしら掴めればと思って。
でも、やはりというか、googleではなかなか思うようには行かないな。
だいたいこんな感じになる。
まず、検索結果の2割くらいでは、検索結果がゼロ件になる。
これはどうしようもない。そこでお手上げ。
また、残りの8割では何かしらの検索結果が得られるが、
多くの場合、同姓同名の人間が多数存在することから、検索結果はノイズ混じりなものになる。
探したい相手について、本名だけでなく年齢まで分かっているため、頑張ればある程度絞り込んでいけそうではあるが、やはり面倒なのであまりやろうと思わない。
結果として、「これは」と思えるような、何かしらの足取りらしきものを掴めるのは、だいたい1割とかそれくらいになる。たとえばどこかの掲示板の書き込みや、研究室のメンバー紹介から、彼らの現在をちょっとだけ知ることができる。……とはいえ、そうして見付けたWebページの「彼」が、かつて僕の同級生だった「彼」と同一であるという保証はないんだけど。
ところであれだ。卒業して12年も経って、こうして卒業アルバムを見てみると、とても懐かしく感慨を覚える。何より、自分が同級生たちの顔を覚えてることに驚いた。覚えているものなんだねえ。たまには本棚に眠っている卒業アルバムを開いてみるのも悪くないかもよ。
10 7, 2005
近藤聡乃さんの絵が素晴らしい件
「we make money not art」で取り上げられていたのを見て、近藤聡乃という画家(イラストレータないし漫画家といった方が的確なのかな)のWebサイトにアクセスして見たのだけど、これがすごい。ぞくぞくする。でも惹かれるものがある。たとえばこの「夜のさけめ vol.2」という絵などたまらない。
これは暗い雰囲気でちょっとグロテスクな感じだけど、他の作品にはリリカルで幻想的で、そこはかとなく少女らしさを感じるものが多い。でもやっぱり雰囲気は暗いんだけど。たとえばこれとか。赤い裂け目から無数の蝶(?)が出てくる絵の美しさと、黒と赤の対比が美しい。何の暗喩なのかとかは良く分からないけど、絵として好き。
最近では「ユリイカ」にマンガを載せたりしているらしい。サブカル系?
KONDOH AKINO-box office-
http://b02-d5.data-hotel.net/~akinobox/index.html
さがせる: イベント・展示会・セミナー情報の検索エンジン
「さがせる」はIT関連のイベント・展示会・セミナーの情報を検索するエンジンです。この手のイベント情報を検索できるシステムは以前から欲しいなと思っていたので、さっそく使ってみました。
地域やカテゴリをボタンで指定して、直感的に検索結果を絞り込んでいくインタフェースは良くできています。ただ、登録されているデータ量が少なく、今のままではあまり実用的ではないかも。また、企業から掲載費を取って、セミナー情報を載せるというビジネスモデルになっているらしいのですが、それだとどうしてもデータ量に限界があるように思えます。Webからのクローリング等を併用し、網羅性を向上させることは考えていないのかな。
10 6, 2005
GooGhoul: ハロウィンのための検索エンジン
郵便番号(もちろんアメリカの)を打ち込むと、近所で開催されるハロウィンのイベントを教えてくれます。
検索結果は上のように表示されます。イベントの名前、開催地、そこまでの距離、イベントの種別、簡単な説明。イベントの評価を投票することもできます。
GooGhoul
http://googhoul.com/index.cfm
blogのデザインを、読み手と書き手のどちらが決めるべきかということについて。
そういえば、blogってblogごとにデザインが違っていて、それは当然のことのように受け止められているけど、果たしてそうなのかと思う。
たとえば、blogによって文字のサイズが違う。あるblogでは文字が小さく、あるblogでは小さい。あれはどういうことなのか。誰でも、その人にとって一番見やすい文字の大きさというのがある筈で、常にその大きさで文章を読めるべきだ。どうしてそのblogのデザインに合わせて、読みにくい文字サイズで文章を読まなくちゃならんのだ。どう考えてもおかしい。
たとえば、あるblogでは新しい順に(一番新しいものが上に来るように)コメントが並んでいて、あるblogでは古い順に(一番古いものが上に来るように)コメントが並んでいる。あれは何なのか。沢山ついているコメントが読んでいこうとするときに、いちいちどちらの順で並んでいるのかを確かめてから読んで行かなくてはならない。あれも釈然としない。そんな超絶に下らないことで、読み手に余計な負荷を掛けるのはおかしい。
blogの記事ページというのは概ね固定的な構造を持っている。大まかにはこんな感じで。
・その記事のタイトル(1)
・その記事の本文(1)
・その記事のコメント(0~)
・その記事のトラックバック(0~)
まあ、もうちょっと細分化できるけど。それで、これくらい構造化されたものを相手にするなら、デザインの決定権を読み手の側に移すこともできるだろうと思う。具体的にどうやるかだが、RSSリーダに機能を持たせるというのが一番妥当な方法かと思われる。たとえば以下のようになるだろう。
1. RSSリーダーで、あるblogの記事を読もうとする
2. RSSリーダーはその記事のHTMLをダウンロードし、HTMLを解析して、上に挙げたような、blog記事の各構成要素を抽出する
3. それを読み手(RSSリーダーのユーザ)が予め設定したデザインに適用して表示する
4. 読み手はいつでも自分の望むようなデザインでblog記事を読める。うまー
別にこのような実現方法でなくても良いのだが、現状、blogのデザインを書き手が決めることになっているのを、読み手の側に移す試みというのは無いのかな。たぶんあると思うんだけど。
DBWeb2005の件
そういえばDBWeb2005というのがあって、正式名称は「データベースとWeb情報システムに関するシンポジウム」というのだが、要するにまあ、そういう感じの学会である。
場所も近いし(日本科学未来館)、参加費もまーまー安いので(去年は学生だと5000円)、プログラムにもよるがなるべく出掛けてこようとおもう。
日程は2005年11月21日(月)~22日(火)。
一緒に行く人募集ちうです。
DBWeb2005
http://www.ipsj.or.jp/09sig/kaikoku/2005/DBWeb2005.html
10 5, 2005
+++ 第1回 エンタ!検定 成績発表 +++
これはなんというか、ちょっと出題がマニアックすぎると思う。
こんなのでハイスコアを取る方が変。
しかし、そこが「日経エンターテインメント」らしくもあるな。
あなたの総合得点は67点 全国平均 60点
全国順位(10月5日 1時現在)
2784位(10755人中)
--ジャンル別得点表 ---------------
0_________10__________20点
映画 ■■■■■■■■■■■■■■■
テレビ■■■■■■■■■■■■
音楽 ■■■■■■■■■■■■■■■■■■
書籍 ■■■■■■■■■■
芸能 ■■■■■■■■■■■■
-------------------------
--講評---------------------
あなたは「エンタの玄人」
あなたは忙しい仕事や勉学のかたわら、世間の流行情報チェックを怠らない努力家に違いありません。ジャンル別にみると、「音楽」が好きですね。「映画」「テレビ」「書籍」「芸能」は平均的に知っています。仲間内で、あなたの好きなジャンルの話題になった場合、率先して盛り上げましょう。情報は発信する人に集まってくるものです。ちなみに、解答の傾向としては、特に「雑学」ネタに詳しいですね。 -------------------------
10 1, 2005
第3回検索会議に行って来たの続き
そういえば、昨日の検索会議でもう一つ感じたことがあった。
yahooのエンジニアがいくつかのhackを披露していたのだが、その中にユーザの検索履歴の統計情報を利用したものがあり、非常に面白かった。しかし、あれはyahooの中にいる(つまり、yahooの保有する、外部からはアクセスできない諸々のデータにアクセスできる)からこそ作れるものである。それで、改めて思い知らされるのが、yahooにしろgoogleにしろ、ブラウザなりAPIなりで取得できるのは、彼らの保有するデータのごく限られた領域でしかないということだ。
情報検索というのは人と機械(検索システム)との共同作業なのだから、その検索精度を向上させていくにあたっては、Webから集めてきたデータだけではなく、人の側に属するデータ、ユーザの振るまいに関するデータの利用がやはり重要である。最近特にそれを考えている。なのだが、現状を見るに、「人の側に属するデータ」はyahooやgoogleに囲い込まれてしまっていて、外部からはそれらを利用する術がない。yahooやgoogleの検索結果を使った応用的な検索技術の研究は盛んだが、あれは足枷を付けた状態で戦っているようなものではないかとも思える。
第3回検索会議に行って来た
そこで繰り広げられた素晴らしいプレゼンの数々については、僕よりもまとめるのが上手い人たちが書いてくれるとおもうので、僕はどうでも良いことを書こう。
検索会議は今回で第3回らしい。そうして感じることなのだが、正確な割合は分からないけど、あのイベントはリピータが多い。僕自身、今回が2回目の参加になる。参加者同士もけっこう仲が良さそうだ。検索会議の終了後にはヒルズ近くの中華料理屋でちょっとした飲み会(懇親会)をやったのだけど、全部で30名くらい居たと思う。検索会議の定員がたしか120名だったから、スタッフを差し引いても、検索会議参加者の2割くらいが飲み会に参加したのではないかな。そんなには多くないかもだけど。
それで、その飲み会の顔ぶれを見ると、これが面白い。非常に面白い人たちばかりである。司会の橋本氏&田口氏はもとより、ネットベンチャーの社長や、優れたhackerや、インターネットで面白いサービスを公開している人たちがうろちょろしている。彼らはまさに今、日本のインターネットサービス(……という表現が適切なのかちょっと自信がないが)の先っぽのほうに居る人たちであろうとおもう。そして、検索会議をやるたびに、ああいう人たちの間に人と人とのコネクションがぐいぐい張りめぐらされていくのだと感じた。
今まで、yahooが何故あの会議に協力するのか疑問に思っていた。ヒルズのあの広い部屋をたった3時間でも借りようとしたら、本来ならばかなりの使用料を請求されるところだろう。毎回のように豪華なおみやげを頂戴するのだが、あれだって安いものではなさそうだ。打ち合わせや下準備に社員を使えば人件費も掛かるだろう。何となく、ニュースサイトやblogで取り上げられることによる宣伝効果を見込んでいるのかなあ、くらいの考えでいたんだけど、むしろ、あの場所で張りめぐらされていく人脈のネットワークがyahooの目的なのかもしれないと思った。ああやって人脈のネットワークを形成していく機会を提供しつつ、そこへのコンタクトを維持しておく。それはyahooにとってどこかしらで役に立つことなのではないかなあ。たぶん。あまり自信は無いのだけど。
そうそう。会議の終わりにyahooのえらい人(名前は失念)が言っていたのだが、この検索会議は、第4回、第5回とまだまだ続けていくつもりらしい。今回は、参加申し込みの受付開始からわずか3時間そこそこで満員になってしまったという大盛況で、惜しくも参加できなかった人も沢山居たと思うけど、そんなあなたは、次回に向けてacademediaのチェックを怠りなく:-p