先日受けたリクルートでの取材がTech総研の記事になっている。
私が「世界を驚かせているか」というとかなり疑問なのだが、 まあ、それはそれ、あおり文句であるということで。
三人のインタビューがあり、私と、あとは奥さんと新井さん。 まあ、それなりに面白い記事かも。
ただなあ、私の言いたいことは本当はちょっと違ったような気がする。 あ、つまり、インタビューではそう語ったのは確かなので、 記者の人の責任ではなく、私が自分の思いを適切な言葉にするのに失敗したという意味なんだけど。
じゃあ、なにが言いたかったのかというと「8割/2割で2割のほうに入れ」ということなのかなあ。でも、「どうやって入るか」には統一的な答えはない(人によって方法は違う)ので、 全然役に立つアドバイスじゃないな。
とても高速なテーブル。十分高速なので、疎配列やハッシュとして使える。
これがあればRubyのハッシュとか置換できるよなあ。 ただ、中身が難しいのと、実装がLGPLなのでRubyに取り込むのはいろいろ面倒そう。
中身についての簡単な説明(10分版)を読むと、わくわくするのだが、完全には理解できなかった。3時間版はまだ読んでない。
あらいです。いやー、まつもとさんと一緒に載るなんて光栄です。祖父母に報告します。やはりインタビューというのは難しいですね。散漫に喋っていたのをまとめるのですから。
Judy Arrays 読みました
設計方針は データアクセスの局所性の向上を目指す。
1.木の階層を減らす、そのためにノード一段の分岐数を 256と大きく設定。
( メモリ内で飛び飛びのノードを辿るたびに、キャッシュ・フィル発生)
2.1ノードのインデックス項目数は256と多いので、有効エントリ数に
従って、表圧縮した格納形態をとる。
ここら辺のきめ細かさがポイントらしい、 データ圧縮の規格を読むような雰囲気。
有効エントリが多いとき、ビットマップで管理
少ないとき、カウント+ベタ詰め、など数種類。