1 6, 2006
自分自身をブックマーク
循環参照は美しい。
自分自身をブックマーク
http://b.hatena.ne.jp/entry/1185155
Newzingo: tagをベースにGoogle Newsを閲覧するインタフェース
Newzingoは、tag(キーワードおよびキーフレーズ)からGoogle Newsの記事を探すことができるWebアプリケーションです。上のスクリーンキャプチャを見ての通り、その時点でpopularなtagを並べて提示します。ユーザがその中から興味のあるtagを選択すると、関連するニュース記事の一覧が表示されます。関連ニュース記事の多いtagほど大きく表示されるため、その時点でどのような話題が大きな注目を浴びているのかも分かるようになっています。
この手のアプリケーションを作ろうとすると、固有表現(Named Entity)の抽出精度が大きな問題になるのですが、ざっと見た感じではかなり上手くできているように思われます。中身がどうなってるのかは分からないのですが、機械的にtagを作成しているのだとしたらなかなかのものだという印象です。
また、NewzingoがGoogle Newsを下敷きとしたメタ検索サービスとして実装されている点が興味深いです。ニュースアグリゲーションサイトはGoogle Newsを筆頭にいくつも公開されていますが、どこも似たり寄ったりでさほど差別化がされていない印象を受けます。ニュースアグリゲーションサイトでは、対象を特定Webサイトに限定したクローリングを行うことになるため、クローリングの能力ではあまり差が付きません。必然、その先の本文抽出やカテゴライズ等の精度を競うか、パーソナライズ等の付加機能を乗せていくかということになります。そこで、Newzingoではクローリング等の部分はGoogle Newsに任せて、インタフェースで差別化をしようとしてるのだけど、そこが面白い。でも、これってGoogleの許可は取っているのかな。Google APIを使っているとの記述があるけれど、Google APIでGoogle Newsのデータの取得ができたのでしたっけ。後で調べてみよう。
Newzingo
http://newzingo.com/
Post a comment to 'Newzingo: tagをベースにGoogle Newsを閲覧するインタフェース'
12 15, 2005
Google Tip: "(ダブルクォーテーション)は閉じなくてもOK
Googleでフレーズ検索をするときには、フレーズを"(ダブルクォーテーション)で囲みます。このとき、"を閉じずに検索すると、自動的に末尾に"がフィックスされるらしいです。意外なことに今日まで気付きませんでした。
よって、たとえば、
・"経済産業省"でgoogle検索
・"経済産業省でgoogle検索
は同じ検索結果を得ることになります。これさえ覚えておけば、"を押す手間が一回分節約できてとってもお得ですね!
12 4, 2005
リンク見出し是非裁判の件
決着のついたリンク見出し是非裁判 (@歌田明弘の『地球村の事件簿』)
http://blog.a-utada.com/chikyu/2005/12/post_cee2.html
面白いなー。これが落としどころなのか。まとめると以下のようになる。
1. URLへリンクを張る行為それ自体はOK
2. 見出しへリンクを貼る行為(見出しを自分のページに引用してそれにリンクを貼ること)については、
2.1. 著作物性のない見出しであればOK
2.2. 著作物性のある見出しであればNG
3. 見出しに著作物性があるかないかの判断は裁判所が行う
見出しといえど何者かが創作した文章であることは確かで、そこに著作物性が認められる場合もあるかも知れない。そこで、見出しに著作権がないと一律に扱ってしまうのはまずいということらしい。どこまでがOKでどこからがNGなのか、その境界線については言及されておらず、結局何も言っていないのと同じではないかと思える。
脅かされる本人認証
脅かされる本人認証 はびこる奇怪論理とその考察
http://www.mneme.co.jp/data/thesis.html
ニーモニックセキュリティとかいう会社の社長が書いた、セキュリティ業界でまかり通っているいい加減な論理を批判的に概観した記事。後半になるとやや重箱の隅をつつくような議論も出てきますが、超おもしろいです。おすすめ。
内容を大雑把かつ強引にまとめると、こんな感じでしょうか。
- 攻撃者は脆弱な部分を狙って攻撃してくるため、システムを構成する全ての要素の中でもっとも脆弱な要素のセキュア度(こんな言葉があるかは知らないけど)が、そのシステムのセキュア度になる。従って、システムにたった一つ脆弱な要素があれば、システム全体が脆弱なものとなる。
- 最近では、高度な暗号技術を導入する、認証用の電子デバイスを利用するなど、最新技術を用いたセキュリティソリューションを各ベンダが盛んに売り込んでいる。しかし、いくら最新技術を用いたところで、システムの中でもっとも脆弱な要素をケアすることができていなければ無意味である。むしろ最新技術の導入によって安心してしまうだけ有害であるとすら言える。
- 多くのケースでは、本人認証が「システムの中でもっとも脆弱な要素」となる。
- 本人認証には、伝統的にパスワードを用いることが多いが、既に知られているとおり、パスワードには多くの問題点がある。
- それに対して、指紋認証や静脈認証等の生体認証技術が提案され、盛んに使用されるようになってきている。しかし、生体認証技術にはまだ問題点が多い(具体的にどのような問題点があるのかはリンク先の記事を読んでください)。
全体を通じて、セキュリティ業界がいい加減な論理で顧客のためにならないセキュリティソリューションを売り捌いている現状に対する怒りと憤りが良く伝わってきます。セキュリティ業界が本当にこの文章に書かれているような製品ばかりを売っているのだとしたら、ちょっと酷いなと思ってしまうけれど、どうなんだろう。
あと、文章の最後では長期記憶を用いた本人認証(詳しくはリンク先の記事を読んでください)を紹介していますが、これの有効性はちょっと疑問に感じます。まずショルダーハッキングの問題がありますし、個人の長期記憶の中で、本当にその人だけしか知らないような事柄というのは殆ど無いため、その人の友人や家族を連れてきたら簡単に破られてしまうのではないかと思えます。また、このような認証をするには、予め画像を認証システムに登録しておく必要がありますが、それに抵抗を感じる人も多いと思われます。
11 29, 2005
はてなポイントの送信機能が機能してないらしいという話題について
ポイントの送信は機能していない? (@Ceekz Logs)
http://private.ceek.jp/archives/001647.html
統計的なデータを元に議論できないのが残念ですが、たしかにはてなブックマークのポイント送信機能はあまり機能していないように思えます。
はてなブックマークのユーザは、日本でもっともそういったことに先鋭的な人たちであるはずです。彼らに根付かないなら、この手の投げ銭システムには本当に見込みがないのでしょう。
元々、はてなポイントの送信によって、良質な文章の書き手が然るべき報酬を得られる……みたいな話はアホらしいと感じていました。いくら普及したところで、はてなブックマークで流れるポイントの量などたかが知れており、それはたとえばAdSenseや各種アフィリエイト等で得られる収入の何分の一という額でしかないだろうと思われたからです。ブックマークの際にはてなポイントを送信するのは優れた文章の書き手に対する敬意と賞賛の表現であり、「私は単に自分のブックマークに追加するに止まらぬそれ以上の価値を貴方の文章に認めました」ということを相手に伝え、その文章の書き手を讃える行為であるのだと考えていました。そして、はてなブックマークのポイント送信機能がそのように受け入れられるなら、それははてなブックマークという良質なコミュニティに着実に根付いていくのではないかと、そう考えていたんですが、どうもそういうふうにはなっていかなかったんでしょうか。だとしたら残念でなりません。
blog検索についてやや後ろ向きに書いてみるよ。
ブログ検索が持つビジネスの可能性--CJICイベント
http://japan.cnet.com/news/media/story/0,2000047715,20091229,00.htm
CNETカンファレンス、Blog検索パネル内容の補足
http://blog.japan.cnet.com/watanabe/archives/002450.html
あたりをつらつらと読んでの所感です。
今のところ、blog検索にはネガティブな印象を抱いています。blog検索エンジンがこれだけ作られているのは、新しく出てきた分野であるためシェアが固まっていないことと、技術的ハードルが低いことによるものと思います。たぶんみんなこう考えているんですよ。「googleには成れないけど、technoratiになら成れる(かも知れない)」って。
まず、現状のblog検索について、僕の考えるところを述べます。
google等の一般的なWeb検索がWeb全体を検索対象としているのに対して、blog検索では広大なWebの中からblogだけを検索対象としています。検索対象を相当に絞り込んでいるわけです。通常、検索エンジンを作るにあたって、検索対象を絞り込むというのは、以下のような場合において為されます。
- ある特定の対象を検索したいという明確な(あるいは潜在的な)要求がある場合
- 検索対象を絞り込むことによって、検索対象の平均的な質の向上を図る場合
- 検索対象に特化した特別な検索機能を提供したい場合
1点目は、検索対象を限定することによって、特定の検索要求を満たすことができることを指します。具体例としては、yahooオークションの出品情報を検索できる「オークション統計ページ(仮)」の検索機能や、2chの書き込みを検索できる「2ちゃんねる検索」を挙げることができます。
2点目は、取得可能なデータの中から質の高い(と思われる)ものだけを検索対象とする、あるいは、前処理によって、質の低い(と思われる)ものを予め除外することを指します。具体例としては、google等の多くの検索エンジンがやっているアダルトページやスパムページのフィルタリングを挙げることができます。取捨選択によって検索対象を質の高い(と思われる)ものに限定することで、検索結果の質的向上を図ります。
(ここで、「質」とはそもそも何かというとても難しい問題がありますが、この記事ではひとまず置いておきます。)
3点目は、検索対象を限定することによって、その検索対象が共通に持つ属性や性質を検索機能に用いることを指します。1点目で挙げた例で言うと、「オークション統計ページ(仮)」では、価格帯や期間を指定して検索することが可能ですし、「2ちゃんねる検索」では本文やスレタイなど、検索する場所を指定することができます。これにより、より使いやすく便利な検索をユーザに提供しています。また、検索対象に特化した検索結果のインタフェースを提供するケースもここに含まれます。
では、blog検索はこれらの点についてどうでしょうか。
1点目ですが、みなさんがインターネットを使う中で、「blogに限定して検索したい」と思うことがどれだけあるでしょう。僕にはほとんどありません。また、「こういう場合にblogに限定して検索すると便利だよ」という意見を見ることもあまりありません。
上で例として挙げた「オークション統計ページ(仮)」にしろ「2ちゃんねる検索」にしろ、検索対象を特定のジャンルに絞り込むことによって、その有用性を担保しています。ここで「ジャンル」という言葉を使うのは少し抽象的すぎるかも知れませんが、換言すると、何らかの共通した内容や用途を持つ対象に限定して検索できるからこそ有用だってことです。たとえば"iPod"と検索したときに、googleならappleのサイトやニュースサイトの記事が出てきてしまうところですが、「オークション統計ページ(仮)」ならiPodのオークション情報だけが出てくる。特定のユーザにとってはそちらの方が嬉しいわけです。
翻って、blogというのはWebサイトの形態を指す言葉であって、blogに投稿される記事の内容は極めて多様です。他愛もない個人の日記もあり、政治や経済の問題について論じた論説もあり、プログラムのサンプルコードもあります。blogに投稿される記事に何らかの共通した内容や用途があるかというとあまり思いつきません。よく言われるのは速報性や流行への鋭敏性、個人が書いた文章ゆえの評判情報としての価値、といったところですが、それくらいでしょうか。従って、検索対象をblogに限定することそれ自体には、それほど大きな有用性は無いように思われます。
2点目については、個人が自由に書いた記事であるために、blogに投稿される記事の平均的な質は決して高いとは言えません。加えて、最近ではfake blog(スパム目的のblog)等の問題もあります。また、質の高いページを検索結果の上位に表示するためのスコアリング手法についても、一般的なWeb検索におけるPageRankのような、性能の良いアルゴリズムはまだ登場していないように思われます。よって、この点に関しても、検索対象をblogに限定することに利点があるとは言えません。
3点目については、technoratiのリンク解析や、ask.jpのpodcast検索など、blog検索においても面白い試みが出てきています。僕の作った「もぶろげっと」の画像検索機能も、一応ここに加えても良いかも知れません。blog画像検索は、もう他にも提供してるところがあるけど。しかし、現状を見るに、ユーザに「なるほど、こういう便利な機能があるなら、blog検索を使おう」と思わせるだけのものはないように思えます。
つまり、単純に検索対象をblogに限定しただけでは意味がないし、現状を見る限りではblogならでは検索機能もまったく未成熟なのですね。
続いて、ダメだしだけじゃ面白くないので、blog検索の将来について考えるところを述べます。
今後、blog検索の採りうる方向性(アプローチ)としては幾つか考えられます。まず前提に置きたいのは、単純にblogの記事を集めてきて、全文検索した結果を時刻順で並べて提示するだけのblog検索エンジンには、あまり有用性はないということ。ですから、blog検索エンジンには、さらにその先に踏み込むことが求められていくでしょう。
まず挙げられるのが、blogから収集してきた大量の記事データを、何らかの切り口から、思い切り縮約してしまうというアプローチです。現在もっとも成功しているのはこれではないかとおもいます。もっとも典型的なものとして、wadaino.jpというサービスを紹介しましょう。wadaino.jpでは、収集してきたblog記事のデータを解析し、短いタイムスパンでもっともリンクされているURLや、本、DVD等のデータをランキング形式で提供しています。blogwatcherのメタブログなどもこれに含めることができます。
このアプローチの利点として、blogの特性(wadaino.jpであれば、流行への鋭敏性)をうまく活かすことができることと、縮約によってblogに投稿される記事の平均的な質の低さを覆い隠せるということがあります。ただ、このアプローチは検索というニュアンスからはやや外れますが。
検索の単位を「記事」からより抽象的なレベルへ持ち上げるというアプローチもあります。たとえば「議論」や、「コミュニティ」といった単位で検索したいという要求は、かなり強くあるのではないかという印象を持っています。blogでは、何らかの話題について、複数のblog間で議論が展開していくということが多々見られますし、同じ趣味や話題を持つ人同士が強い結束を持つということも少なくありません。このような、より高レベルな単位での検索をするには、現状ではリンク解析を用いるのがジェネラルなやり方でしょう。しかし、単純なリンク解析を行ったのでは十分な精度を得ることはできません。コメントスパムやトラックバックスパムなどの問題が抜きがたくありますし、関連するページに必ずしも明示的なリンクがなされるとは限らないからです。よりセマンティックな解析をする、何かしら他のデータを援用するなどの方法が考えられますがなかなか容易ではないと思われます。
また、これはよく言われることですが、パーソナライゼーションというアプローチを挙げることも出来ます。個々人の嗜好に応じて、それにマッチした検索結果を提示することを指してパーソナライゼーションといいます。blog検索は、通常のWeb検索と比べて、検索結果として適切と感じるページの個人差が大きくなります。具体例を挙げましょう。"ソニー"というキーワードで検索したとき、googleやyahooではソニーのWebサイトがトップに表示されます。これに違和感を抱く人は少ないでしょう。あるキーワードに対してどのような検索結果が上位に提示される"べき"かということについて、通常のWeb検索は比較的に一致を見やすいです。では、blog検索ではどうでしょう。"ソニー"で検索したとき、どんなページがトップに表示されるのが適切と思いますか?
そんなわけで、blog検索においては、パーソナライゼーションが特に有効に働くのではないかと考えることができます。しかし、これも具体的にどうやるんだというと難しいところではありますが。
他にもアプローチはあると思うのだけど、僕の考えるのはこんなところです。blog検索には確かに可能性はあるとは思うのですが、現状を見るとblog検索がどれだけ進歩して、どれだけ普及していくのかということには疑問を感じています。長くなりましたが、最後まで読んでくれてどうもありがとうございます。ではでは。
11 24, 2005
DBWeb2005へ行ってきたよ (二日目)
で、DBWeb2005の二日目。前日とは違って遅刻せずに会場へ。おれ偉い。二日目は情報検索関連のセッションが催されるため、聞き逃すわけにはいかない。
DBWebは1セッション当たりの参加者がやたら少ない。全体で100人くらいしか参加者がいないところを、3つの部屋で平行にセッションを走らせているため。「情報検索セッション」など、部屋にはたったの10人しか居なかった。そのうち半分は座長と発表者なので純粋な聴講者は5人とかそれくらいである。全国大会ではなく査読付きのカンファレンスなのに。おもしろい発表もあったのに。普通こんなものなのかしら。
二日間を通じてさまざまな発表を聞いたが、特に興味深かったのは、日本IBMの人による「IBMの知識マネジメント」と題した発表だった。IBMのナレッジマネジメント製品の解説……ではなく、IBM社内でどのようなナレッジマネジメントがなされているか、その概略を解説するという内容である。これは本当に面白かった。これを聞けただけで参加費5千円を払った価値があったというくらいだ。
IBMには、90年代の初めごろ、経営が傾いた時期があった。この時期、状況を打破するために数々の試みが為されたのだが、その中の一つが全社的なナレッジマネジメントシステムを導入することだった。しかし、これは失敗に終わったという。
それは何故か。まず、情報を共有するための動機付けが無かった。そのとき導入されたシステムとは、とにかくでかいデータベースとそこにアクセスするインタフェースを作って、「さあ、お前らの抱える知識を文書化してここにうpしろや!」というようなものだったらしいのだが、仕組みだけを作っても人は動かない。ナレッジマネジメントにはこういう目的と利点があるのでみなさんぜひ協力してくださいと説明すると、なるほど分かったと言ってはくれるのだが、それが行動に結びつかなかったとのこと。
次に、社員たちが知識を文書化するための時間を思うように取れなかった。文書化のための時間が全く与えられなかったというわけではなかったのだが、 どうも文書化に掛かる時間をかなり過小に見積る傾向が強かったらしい。どういうことかというと、知識を……とりわけ会社組織の中で何となく共有されてきたような曖昧模糊とした知識を文書化するというのは、実は非常に大変な、手間の掛かる作業であり、たとえば書くべき内容をまとめたり、資料を集めたり、全体の構成を練ったりと、そういった下準備に大きな時間が掛かるものだ。
しかし、このとき、管理者たちはそういったことを考えず、文章を書く時間だけを考えて作業時間を見積もることが多かった。「たった8000文字くらいの文章なら、1日あれば書けるでしょ。書いてね」などと言ったらしいが、それでは上手く行かなかった由。
それで、このとき導入されたシステムは、導入当初こそ物珍しさからそれなりに使われたのだが、18ヶ月後にはアクセスが激減するという結果となってしまった。
しかし、それで終わらなかったのがIBMの偉いところである。
最初のシステムが失敗に終わった後、95年頃になって、IBM社内のコンサルティング部門が、独自にナレッジマネジメントシステムを導入し、運用を始めた。
(こんがらがらないように、ここからは、 90年代始めに全社的に導入して失敗したのを「最初のシステム」、95年頃にコンサルティング部門が導入したのを「2番目のシステム」と呼び分けることにしよう。)
この2番目のシステムについては、あまり発表の中で詳細な説明がなかったのだが、Webブラウザでアクセスし柔軟に情報の共有を行えるという、今で言うグループウェアに近いものだったそうで、まあとにかく最初のシステムとは違って上手くいった。
それで、コンサルティング部門では、その成果をまとめ、我々が導入したナレッジマネジメントシステムによってこれだけの成果があったと、経営陣の前でプレゼンをした。それを聴いた経営陣は、なるほど、それならもう一度全社的なナレッジマネジメントシステムに取り組んでみようと考え、それまでの経験を活かした新たなシステムの導入が行われた。
(この新たなシステムは「三番目のシステム」と呼ぼう)
うー、ここからが肝心なところなのだが書くのが面倒になってきたな。以下は手短にまとめるよ。
結論から言うと、そうして導入された三番目のシステムが現在IBMで使われているナレッジマネジメントシステムであり、これは概ね上手く運用されている。
では、なぜ最初のシステムで失敗したものが、現在の三番目のシステムでは上手くいっているのか。 運用面とシステム面の2つに分けて述べる。まずは運用面である。
第一に、ナレッジマネジメントへの貢献に対してインセンティブを与える仕組みを整えた。三番目のシステムには、知識へのアクセス数を把握し、人気のある(頻繁にアクセスされる)知識がどれか明らかにする仕組みや、知識を利用した社員に、利用後にその知識がどれくらい有用だったかを評価させる仕組みがある。そして、人気のある知識、有用と評価された知識をシステムに入力した社員にはインセンティブが与えられる。インセンティブってのは、要するに金銭的な報酬ね。
また、部門ごとにノルマを課し、「貴方の部門は、今年度はこれだけの知識をシステムに入力して下さいね」ってのを義務づける。さらには、部門ごとにナレッジマネジメントの担当者を置き、啓蒙活動を行わせる。
このインセンティブとノルマの両立をIBMの人は「飴と鞭」と表現していたがなるほどとおもう。
他には、毎年キャッチフレーズを作って社内に広報するなど、ナレッジマネジメントへの関心を高める努力もしているらしい。 質を維持するための仕組みとしては、社員が文書化した知識をシステムのデータベースに登録する際に、担当者がチェックし、分かりにくい表現等の修正を求めているとのこと。
次に、システム面である。
システム面では、検索機能にもっとも力を入れているという印象である。IBMの人は、「検索機能がしょぼかったら、誰もシステムを使わないでしょう」と言っていたが、これはまさにその通りだ。検索機能は超重要。
三番目のシステムはWebベースのシステムとなっており、Webブラウザを用いてアクセスする。トップページはポータルサイトのような作りになっており、キーワード検索とカテゴリ検索の2つの方法で検索が可能となっている。
キーワード検索機能としては、基本的には、データベースに登録された知識に対して、キーワードを入力して全文検索を行うというものになっている。その際に、知識はジャンルごと(?)に複数のデータベースに分けて格納されてるのだが、検索するデータベースを指定したり、利用実績等によって絞り込みを行ったりと、多彩な検索オプションを使える。また、(日本IBMの中だけでなく)世界中のIBMグループのデータベースに対して検索が可能である。
カテゴリ検索では、日本独自のカスタマイズをするなどしている。
これらの検索機能は、学術的・技術的にはあまり目新しいものはないかと思うが、利用者のことを考えて丁寧に作り込まれているという印象である。
講演全体として、組織としてナレッジマネジメントに取り組むとはどういうことなのかを知ることが出来て有意義だった。講演者の方に感謝したい。
他にも面白い講演がいくつもあったが、詳しい内容は割愛する。書くのがめんどいし。Yahooの岡本真氏のプレゼン技術が圧倒的に素晴らしかったのが印象に残っている。NTTレゾナントの竹野浩氏は「MultiMedia Meister」の実装や運用について述べたがこれも非常に面白かった。
また、研究発表では、中央大学の加藤俊一先生のグループが、3次元オブジェクトを「エレガント」「シック」等の印象語と結びつけるという研究について発表していた。尾内研究室でもメンバーの1人が近しいことをやっている(やっていた?)のでふうん、こんなのもあるのかと面白く聴いた次第。
(で、ここからですます調で書くよ)全体として、DBWebはなかなか面白いイベントでした。特に、今回のDBWebでは、学会の主催するシンポジウムでありながら、オープンソース・コミュニティの人たちを招いたり、Googleやyahooの人たちを招いたりと、データベース+Webという枠の中で魅力的なプログラムを作ろうという意欲が見えて非常に良かったと思います。学会主催ということもあってお堅いイメージのシンポジウムですが、データベース技術や情報検索、Web周りの先端技術等に興味のある人ならおそらく楽しめると思います。ただ、なんせ平日の昼間に開催されるため、学生やニート、あるいは本職の研究者でないとなかなか参加するのは難しいかも知れませんが。
DBWeb2005へ行ってきたよ (初日)
今週の月曜日と火曜日はDBWeb2005という楽しいシンポジウムに行っていたのだけど、それについて書くよ。実はmixi日記からの転載だというのは内緒です。まずは初日のことから。
朝どうしてもお布団から出られなかったため、会場に着いたのは1時過ぎ。今日のお目当てだったはずの、「特別セッション OSSコミュニティとの連携」を聞き逃す。
まあ、今日は前菜、メインディッシュの情報検索関連のセッションが開催されるのは明日だ。明日こそ寝坊しないようにしよう。
それにしても未来科学館は遠い。調布駅から70分も掛かるし、途中の乗り換えも面倒。お台場おそるべしって感じです。
DBWebは今回が初めてだけど、今まで出た学会の中でもっとも硬い雰囲気でした。発表者が全員スーツなのは良いとして、聴講者まで半分以上がスーツというのはちょっと吃驚。僕の聴講したセッションだけがそうだったのかな。データベース・コミュニティの人たちの会合はいつもあんな感じなのだろうか。
閑話休題になるけど、情報検索を研究している人は国内にも沢山いるのだけど、彼らは決して一枚岩というわけではなく、いくつかのコミュニティに分かれて活動しています。それらは大きくデータベース・コミュニティと自然言語処理・コミュニティに分けられ、画像検索や映像検索の分野になるとさらに画像工学やコンピュータ・ビジョンのコミュニティが加わります。
(もちろん、それぞれのコミュニティ間で交流はあるし、何だかんだで影響しあっているので、まったく独立して仕事をしているわけではありませんが)
それで、DBWebはデータベース・コミュニティの人たちの会合なのですね。僕の所属する電気通信大学尾内研究室は上の分類でいうと「画像工学やコンピュータ・ビジョンのコミュニティ」に属すると思われますが、現状、他のコミュニティとの交流はあまりなく、他のコミュニティの会合にも顔を出していないので、どんな感じが覗いてみようと思って今回のDBWebに参加した次第。まあそれはいいや。
諸々の発表内容については明日まとめて書きます。
11 22, 2005
はてなブックマークにおけるブックマーク数の推移
表題の件について、気になったのでデータを出してみました。はてなブックマークがすでに定常状態に入っているのか、新たなユーザを獲得し拡大を続けているのかに興味があったからです。単純にブックマーク数を指標とすることには疑問を挟む余地が大いにありますが、データの取得のし易さ等のために取り敢えずこうしてみました。
で、結果を示しましょう。下の2つのグラフがそれです。
これらのデータについて何らかの考察をしたいところなのですが、明日は朝早いし超眠いので寝ます。僕よりも賢くて文章の上手い人たちが何か書いてくれると良いなとおもいます。生データをCSV形式で転がしておくので宜しければ持っていって遊んでみてください。データ取得のプログラムも置いておきますがインタフェースが適当すぎて激しくアレです。C#で書かれています。
それではおやすみなさい。ぐう。
ブックマーク数の生データ(累積)
http://blog.windy.ac/hateb1.csv
ブックマーク数の生データ(日付ごと)
http://blog.windy.ac/hateb2.csv