"2004年07月" archive
7 31, 2004
blogWatcherのクローラが激しく襲来中
たまたまだと思うが、ここ数日、blogWatcher_Spiderの尾内研Webサーバへのアクセスが非常に多い。googlebotやmsnbotの数倍のペースで来ている。
%cat /var/log/httpd-access.log | grep blogWatcher_Spider | wc -l
384
%cat /var/log/httpd-access.log | grep googlebot | wc -l
105
%cat /var/log/httpd-access.log | grep msnbot | wc -l
163
そういえばblogWatcherといえば、かねてから「使ってみたいなー早く公開されないかなあ」と思っていたのだが、ようやくオフィシャルblogで公開予定が告知された。おおいに楽しみだ。
blogWatcherに関心を持って下さりありがとうございます.さて,長らくお待たせいたしましたが,現状のバージョンのシステムを8月中旬をメドに公開する予定で現在進行中です.
正式な日程等決まりましたら,またご案内させて頂きます.
今しばらくお待ち下さい.
※/var/log/httpd-access.logってのは今日(2004//07/31)の尾内研Webサーバのアクセスログ。
typoGenerator (via Ceekz Logs)
typoGenerator @ Ceekz Logs
http://private.ceek.jp/archives/000574.html
適当な文字列をぶち込むと次々とナイスなフライヤーを生成してくれるサイト。すげーかっこいい。デザイン能力がないぼくにとって、こういうのはありがたい。いつか機会があったらぜひ使いたい。
全体として、
を。また、個々の描画に対して、
を乱数かなにかで設定してやればこれに近いモノは作れそうだが、実際にはそれに加えて一つか二つくらい工夫があるような感じがする。
日本語に対応してないことだけが残念。ceekz氏がほんとに日本語版を作ってくれたらいいな~とおもいます。
typoGenerator
http://mtd.nussnet.at/typo/index2.php
萌えるSPAM対策
萌えた。
め~わくメールに負けないで!!
http://www.clubbbq.com/spaminfo/beginners.html
7 30, 2004
『小野田・杉本・林研究室運用規則について(自主運用) 』がすごい
I 出欠席管理について
出欠席はtknbbsにある登下校管理プログラムによって管理されます。登下校管理プログラムを不正に使用した時には反則金5000円を申し受けます。
II 拘束時間 11:00 ~ 17:00 (ゲーム等は禁止)
IV 研究室内の禁止事項
・研究室での飲酒。
ご覧の通り、ガチガチの管理主義。しかも罰金制。世の中にはこんな研究室もあるのか。
拘束時間があって、ゲームも出来ず酒も飲めないなんて、おれならドロップアウトしてしまうに違いない。
小野田・杉本・林研究室運用規則について(自主運用)
http://www.es.takushoku-u.ac.jp/labs/wmmsugui/contents/rule.htm
7 28, 2004
ISEC(セマンティック・コンピューティング研究開発機構)のドキュメントを読んでみた(こうさぎ)
きょうかぐらが加工した?
地味。
*このエントリは、こうさぎの「かぐら」が書きました。
Post a comment to 'ISEC(セマンティック・コンピューティング研究開発機構)のドキュメントを読んでみた(こうさぎ)'
「ミニホンピ」って「ぱどタウン」みたいだ
ITProの記事で『韓国ポータル市場を塗り替えた「ミニホンピ」の人気』というのを見つけた。
http://itpro.nikkeibp.co.jp/members/ITPro/KoreanIT/20040614/1/
で、一読して、「これってぱどタウンみたいだなあ」と思った。自分のページを部屋に見立てるメタファーが共通しているし、インテリアを購入して部屋を飾り立てていくという仕組みも一緒だ。インテリアを購入するのに、ミニホンピではリアルマネーを、ぱどタウンではログインするたびにもらえるポイントを使うという点は異なるか。
ぱどタウンは現状でmixiやgreeの何倍もの数のユーザを擁しており、また韓国のインターネットでの流行はあながちバカにできないことを考えると、日本でもこういったスタイルのコミュニケーションサイトが受け入れられていく素地は相当あるのかもしれない。
#ぱどタウンってのは、小中学生をメインユーザとするSNSモドキなよくわかんないサイト。詳しくは「ぱど厨」でgoogle検索してみてください。ぼくはユーザ登録して少しだけ使ってみたことがあるけど、そこで為されているコミュニケーションにまったく付いていけず、登録から数日でまったくアクセスしなくなってしまいました。
『情報セキュリティアドミニストレータ』を受けます
たったいま申し込みました。合格できるようにがんばります。
#去年、一昨年と連続して『アプリケーションエンジニア』を受けたんですが、まったく歯が立ちませんでした。論文試験があるので、実務経験のない学生が取るのは難しいです。この秋は頑張れば取れそうなものを、ということで、『情報セキュリティアドミニストレータ』に落ち着きましたです。
7 26, 2004
PTT #302 (ぱんださんといっしょ)
逝ってきた。今回の会場は農工大(工学部)。東小金井は相変わらず田舎だった。PTTって何だか知りたい人のために、PTTのサイトはこちら。
http://www.ipl.t.u-tokyo.ac.jp/~kaz/ptt/index.shtml
今回はmaster-panda氏(以下ぱんださん)とご一緒した。『randommixi』のデザインを手がけていただいた方だ。このblogのエントリにコメントを付けてもらったのを切っ掛けに交流が始まり、よく分からないが何となく気があったみたいで仲良くさせていただいてる。駅前のモスバーガーで待ち合わせ、はじめましてをして、軽くお食事&お喋りしたのち、会場へ。
テーマは「最長しりとり問題の解法について」。線形計画法を使って単語のリストから最も長いしりとりを生成する問題を解きましたよ、というおはなし。ぱんださんは情報系はおろか理工系ですらない美術系なひとなので、楽しんでもらえるか非常に不安だったのだが、『トリビアの泉』の映像を流したり、収録の裏話(?)を披露したりと、軽くて取っつきやすいプレゼンだったこともあって、楽しんでもらえたようだった。よかったよかった。
この解法の概要はこのサイトで説明されているのだが、
http://al.cs.tuat.ac.jp/~yshinano/shiritori/shiritori.files/frame.htm
問題を線形計画法に落とし込んでいく手際の鮮やかさが非常におもしろい。大いにお勧め。興味のある人はぜひ目を通してみてください。
PTTが終わったあとは、居合わせたreservoirたんと合流し、3人でふたたびモスバーガーに戻ってのんびりとお喋り。ぱんださんにオフラインでお会いするのは今回が初めてだったが、すてきなナイスガイだった。今日も楽しい一日でした。
久保田と八海山もってきた
持ってきた。
次の飲み会に供出しますので、おたのしみに>尾内研各位
7 25, 2004
名刺づくりの顛末
始まりは水曜日。日曜日にわりとフォーマルな飲み会に顔を出すことになったので、名刺を作っておこうと思いついた。
生協に行って「名刺を作るサービスってやってるんですか」とたずねると、インターネットから申し込めるとのことで、URLや説明書きの書かれた冊子をゲットする。ところが研究室にもどってURLにアクセスすると、どうやら注文から引き渡しまで二週間くらい掛かるらしい。それじゃ間に合わない。 どうしたものか。
仕方がないのでキンコーズ(http://www.kinkos.co.jp/)でも使うかと思っていると、森本先輩が「自分で作ればいいじゃん」と言う。なるほどそれもそうだ。プリンタは研究室にあるし。というわけでもう少し検討してみようとおもう。
木曜日。mixiの日記にそれまでのことを書いたら、有り難いことに大いに参考になるコメントをいくつも頂戴できた。どうやら世の中では予想以上に手作り名刺ソリューションが盛んであるらしい。また、キンコーズで頼むと非常に高くつくことも判明する。よって手作りしようという方針が固まる。
金曜日。ぐうたらなにもせずに過ごす。土曜日。なにもせずに過ごす。
日曜日。飲み会は今日だ。やばいぞ時間がないさあ名刺を作ろう。追いつめられて朝からサーベイする。まずは名刺のテンプレートを探してWebをにょろにょろすると、『テンプレートBANK』という超絶ナイスなサイトを発見。このサイトの中の「名刺デザインギャラリー」というコーナーで、273種類もの名刺のテンプレートが無料で公開されている。その中から適当なものを選択する。名刺なんて作るのは初めてなので、地味で無難なデザインのものを選ぶ。また、氏名etcを書き換えて、印刷可能な状態にしておく。
こんな感じになりました
続いて名刺用のプリンタ用紙を買いにいく。手始めに調布駅前にある文房具屋に入ると、なんと50種類を優に超える名刺用プリンタ用紙があってびっくりする。「駅前で手に入らなかったらどうしよう。新宿行きは面倒だなあ」と思っていたくらいだったので、こんなにいっぱい並んでいるのは予想外だった。
……というようなパラメタがあり、選り取り見取り。初心者ということで、もっともオーソドックスな白くて普通なやつを選んだ。
あとはおうちに帰って印刷。半年ぶりくらいにhpのプリンタを引っ張り出してきて印刷しようとするも、カートリッジが腐ってるらしくエラーと言われる。仕方なく新しいのを買いに行く。56番(白黒)と57番(カラー)を一つずつ買ったら、会計が7000円を超えて驚いた。hpのカートリッジって高すぎるとおもう。世の中は理不尽だ。
そうして名刺が完成。飲み会に間に合ってよかったよかった。mixiでアドバイスをくださったみなさまに感謝いたします。
完成した名刺
7 24, 2004
DENIM, お絵かき感覚でWebサイトを
タブレットPCを使って、ぐりぐりとお絵かきしてWebサイトを設計できるアプリケーション。キーボードもマウスもまったく触ることなく、紙に書き殴る感覚でWebサイトの構造や各々のページのレイアウトを作っていくことができる。アイディアの斬新さ、デザインのかっこよさ、それを実現してしまう実装能力、すべてがすばらしい。
そしてとにかくデモがすごい。動いているのを見ると感動する。これは是非みて欲しい。
せっかくタブレットPCというおもちゃが研究室に転がっているんだから、ぜひこういうのを作りたいものだとおもった。
DENIM
http://guir.berkeley.edu/projects/denim/
DENIMのデモ
http://guir.berkeley.edu/projects/denim/media/denim_talk.rm
200番目のエントリ!
いつの間にか200ものエントリを書き散らしていたらしいです。いったいいつの間に。
ふつつかものですが、これからもよろしくお願いいたします。
Anoto, いかしたデジタルペン
Anotoというデジタルペンがあるのを知った。「ペンで書いたものをデジタル化する」というアプローチとしては、たとえば書いた内容を画像として取り込めるホワイトボードや、PDA等のペン入力があるが、それらと比較して非常におもしろい製品だと感じた。
ペンで紙に書くというのは、手軽さや何でも書ける自由度の高さといい、人間にとってもっとも慣れ親しんだやり方であることといい、とてもナイスなインターフェースだ。個人的には、タブレットPCやPDAのペン入力は、紙に書くのと比べるとやはり違和感があって使いづらいと感じる。Anotoは、ペンと紙の持つ優れた性質を残したまま、書かれたデータをコンピュータの世界に持ち込み、アプリケーションで処理することができるようになっている。
上はanotoのサイトから拾ってきたシステムの概要図。Anotoでは、カメラと無線通信機能が組み込まれた専用のペンと、微細なドットパターンが印刷された専用の紙を使う。専用紙には情報を埋め込むことが出来、その紙に書かれたデータを処理するアプリケーションのIDを指定しておく。また、紙とアプリケーションを対応付けるサーバをインターネット上に置いておく(WebサービスにおけるUDDIのようなイメージ)。ペンはその紙で指定されたアプリケーションIDをサーバに送信し、アプリケーションのURLを得る。そして、取得した筆跡情報をそのURLに送信する。
上の図では花の注文書が例としてあげられているが、こういった、通常ならPC上のブラウザやアプリケーションで記入するようなものを、ペンと紙の世界に引っ張りだして来ることができるというのが素晴らしい。
また、「アノトパターン」なる微妙にずれた微細なドットのパターンによって位置を特定するというギミックも非常に萌える。
アノトパターンと紙
http://www.anoto.co.jp/?id=20
ところで、実際に使ったり、Anotoペンを使ったアプリケーションを作ったりできないものかと調べてみると、『デジタルペン評価用デモキット』というものがあるようだ。
弊社では、デジタルペンの導入・開発をご検討されているお客様を対象に、デジタルペン評価用デモキット(日立マクセル製)の販売を行っております。●デジタルペン評価用デモキット
<キット内容>
・デジタルペン(DP-101U) × 1
(USBモデル、USB2.0 標準)
・ノート × 7
・デモ用アンケート用紙 × 100枚
・デジタルペン動作用ソフト
・アンケートデモソフト
……という構成で、お値段は100,000yen。「これを使ってこんなものを作りたい!」というのがあるならがんばって申し込むところだが、「面白そうだから触ってみたいなあ」というくらいではちょっと手が出せない。久保さんをけしかけて研究室のお金で御購入というソリューションを考えたが、久保システムにうまく取り入れるのは難しいかな。
Anoto 技術情報
http://www.anoto.co.jp/?id=4
「デジタルペン評価用デモキット」 販売のご案内
http://www.anoto.jp/press.html
7 23, 2004
ISEC(セマンティック・コンピューティング研究開発機構)のドキュメントを読んでみた
ISECというNPO法人がある。正式名称は「セマンティック・コンピューティング研究開発機構」。URLはhttp://instsec.org/。設立に至った経緯とかはここに書いてある。
この間のゼミでプロフェッサー・ONAIが、ブラウザでこのURLを開いて、「手前らここにあるドキュメントを読んでおきやがれ、このちんすこう野郎(※意訳)」と仰せになったので、とりあえず読むだけ読んでみた。
いまのところISECのWebサイトでは、3つのpdfドキュメントが公開されている。所在はここ。「セマンティックコンピューティング計画」ではISECの掲げる目標や、SeC計画なるものの概要について述べられている。「SeC計画が実現する知の機能」ではSeC計画の中核をなす"C-L"というコンテンツ記述言語の概要について、「C-L(概念言語)とC-Lシステムの設計と開発」ではC-Lの技術的/理論的背景とその応用について述べられている。
概要をまとめる。簡便のため、ISECで提供されているドキュメントについて、それぞれ以下のように表記する。
光……「セマンティックコンピューティング計画」
海……「SeC計画が実現する知の機能」
風……「C-L(概念言語)とC-Lシステムの設計と開発」
由来は……まああれなんですが、どうでも良いことなのでいちいち説明しません。
で。
SeC計画(ISECがこれから推し進めようとしているプロジェクトの名前)は、Semantic Webの成果を取り入れ、それをさらに発展させるものであるという。Semantic Webはコンテンツにメタデータを付与するものだが、SeC計画では「コンテンツ本体の概念構造の記述」を行う(なんだそりゃ)ことを目的とするという(風, p5)。それを指して、"Semantic Computing"という言葉をつくっている。(光, p2)。また、計画の目標について次のように設定している。
SeC計画においては、「概念」を扱うための言語とソフトウェアシステム、すなわち、概念言語と概念言語システムの研究開発をすべての土台とする(光, p4)
そのためにSeC計画で開発しようとしているのが、C-Lという概念言語だ。このC-Lについては風の中で専門的な議論がなされているのだが、どうもぼくの知識不足のためにいまいち理解しきれない。分かる範囲でまとめる。
C-Lにおける概念は、実体(実体概念)と関係(関係概念)からなる(風, p8)。また、実体をノード、関係をエッジとして、概念構造をネットワーク構造で表現する(風, p4)。ここで、このネットワーク構造が「パイパー有向グラフ」であると述べられているのだが、ハイパー有向グラフってのが何のことかは分かりません。ぐぐってもヒットしないし。ハイパーって何がハイパーなんだろ。まあいいや。概念構造をグラフで表現するというのはRDF+OWLといっしょですな。
推論機構としては論理プログラミングを採用するらしい(風, p12)。論理プログラミングというとPrologくらいしか思い浮かばないしPrologに関して何を知っているというわけでもなく、それ自体の是非については鑑定できない。論理プログラミングについては
論理プログラミング、あるいは、論理プログラミング言語は、1980 年代に日本の主導 により、大きな盛り上がりを見せたが、1990 年代には、対抗するような形で色々な推論 系やAI アルゴリズムが提案されるのと同時に、AI ブームが去るなかで、取組む人々が急 減していった。しかしながら、この十年間も、ヨーロッパを中心に着実な蓄積が行われ、 再評価の動きが始まっている。(風, p12)
と述べられている。再評価が始まっているなんて初めて聞いた。
また、コンテンツへのメタデータの付与について、
そこで、アノテーションという人手による仲介が必要である(風, p14)。
と、あっさりと片づけてしまっていることが気になる。Semantic Webへの批判のなかでもっとも大きいものの一つが「メタデータをどうやって付与するんだ」というもので、つまりアノテーションを自動的に付与するには現在の技術水準はそこまで達していないし、人手でやるにはコストが大きすぎるんじゃないかというわけだが、これに対するソリューションを何も考えていないのだとしたら少し甘いのではないかという感じがする。
(続く)
Post a comment to 'ISEC(セマンティック・コンピューティング研究開発機構)のドキュメントを読んでみた'
7 22, 2004
randommixiがかっこよくなった(こうさぎ)
きょうかぐらがryojuはblog♪
きのうはryojuとblogされた。
きょうは、ひまへblogしなかったよ。
ryojuは、
master-pandaさん、ありがとうございました。
といってました。
*このエントリは、こうさぎの「かぐら」が書きました。
お絵かき掲示板にこそTypeKeyを導入するべきと考えます
Web上にはそれこそ山のようなお絵かき掲示板がある。絵師さんたちはその中からてきとーなのを選んでてきとーに萌え絵を描いておられる。そしておれのようなアホどもがお絵かき掲示板をにょろにょろとうろついて、琴線に触れた萌え絵を見てはにゃ~んってなったりクリップしたりする。構図としてはこういったところだろう。
ここでアホどもの視点から考えてみたい。まずお絵かき掲示板は前述の通りくさるほどあって、自分の好みなテーマな板、いかした絵師さんの居る板を発見することは容易ではない。しかしこれはまあよい。ぼくがここで問題にしたいのは、琴線に触れる萌え絵を発見してもそこから先に繋がっていかないということだ。具体的に分かりやすいのは「その絵師さんの書いたほかの絵も見たい」ということだが、検索機能が付いていてもその板の中しか検索できないし、それすら付いていないことが多い。
また、その絵師さんは他のお絵かき板でも超絶ナイスな萌え絵を描いておられるかもしれない。そのようなとき、まさにその「絵師さんが他の板で描いた萌え絵」を見つけることは非常に困難だ。google検索で引っかかるかもしれないが手間が大きいし、絵師さんの名前が一般名詞などであればgoogleではほぼお手上げである。このように、お絵かき掲示板はこれだけ普及し、日々数多くの良質な萌え絵が生まれているにもかかわらず、ぼくらアホどもは効率的にそれらにアクセスできていないという状況がある。
そこでお絵かき掲示板にTypeKeyのような仕組みを導入するというソリューションが考えられる。TypeKeyについて知りたい人はぼくの拙い言葉で説明するよりもちゃんとした解説がWebにあるのでそれを参照してください。たとえばこことか。
TypeKey Overview (@ NDO::Weblog)
http://naoya.dyndns.org/~naoya/mt/archives/000992.html
で、これをお絵かき掲示板に導入するわけだ。TypeKeyは要するに認証の機構なわけだが、ここでは認証機能によって多数のお絵かき掲示板における萌え絵を一元的に把握するのに利用するわけである。絵師さんが描いた絵を掲示板にポストする際に、「おれがここに萌え絵を描いた」という情報をサーバに送信する。そのときに、何のキャラを描いたとか、どんな属性(ねこみみとかメイドとか)があるかということも合わせて送信できるとなおよい。
また、このソリューションには絵師さんたちのポータルという発展の可能性もある。上に挙げたNDO::Weblogの記事から引用するが、
TypeKey ユーザは無料で TypeKey プロフィールページを公開することができるそう。これって結構おお化けする可能性があって、サーバ側でプロフィールをアグリゲートするということは、それこそウェブログを中心としたソーシャルネットワーキング的なことも可能になってきます。
ソーシャルネットワーキングシステムを作ってウェブログとインテグレーションするのではなく、ウェブログをベースにソーシャルネットワーク化するというアプローチ。おおう。
実際には困難だろうが、アプローチとしてはありうる。
というわけでお絵かき掲示板にTypeKeyライクな認証機構を導入するというソリューションをはげしく提案したい(誰に?)。だれか実装して公開して普及させてください。おねがいします。……というか書きながらこんな仕組みすでにどこかにありそうだと言う気がとてもしてきているのであとで調べてみようとおもう。面白いモノが見つかったらまたここで報告します。
検索エンジン利用時に3語以上を入力する人が増加傾向~OneStat.com調査 (via Internet Watch)
http://internet.watch.impress.co.jp/cda/news/2004/07/20/3940.html
オランダの調査会社の出したデータということで、オランダのユーザを対象とした調査なのかと思うが、日本でも同じ傾向はあると思われる。
検索エンジンに入力する語数が増えているのは、ユーザの検索スキルが向上していると言うよりも、Webの膨張に比例して提示される検索結果が大きくなっており、少数の単語では検索結果を十分に限定できなくなっているからだ。最近では、googleで英語圏のWebを検索しようとすると、一般的な単語を2つくらい入れただけでは、100万オーダーの検索結果が残ってくる。しかもその上位はきっちりSEOされた(そして内容はクソな)サイトであることも多く、その場合絞り込みのためにテキストボックスに単語を追加するということになる。とてもだるい。たとえば[windows 2000 install]でぐぐると5,720,000 件もの検索結果が提示される。
これに対する一助としては、vivisimoのような検索結果のクラスタリングや、grokkerのような検索結果のヴィジュアライゼーションといったアプローチがあるが、いまいち使いづらいと感じる。もっと良いものが出てくるといいなとおもう。
Post a comment to '検索エンジン利用時に3語以上を入力する人が増加傾向~OneStat.com調査 (via Internet Watch)'
7 20, 2004
randommixiの公開を中止しました
randommixiの公開を中止しました。
今回の件に関するぼくの考えはmixiの日記に書かせていただきました。
http://mixi.jp/view_diary.pl?id=630581
せっかくのお遊びのネタがなくなっちゃった。次はなにをしようかな。
7 19, 2004
MSDE 2000はタダで使えて貧乏人の味方だなあ
randommixiをもうちょっと賢くしたいと思っている。mixiでは退会したユーザのIDが空きとなり、そのIDにアクセスすると「このユーザはすでに退会しました」というメッセージが表示される。これが死ぬほど鬱陶しいので、生きてるユーザIDのリストをサーバ側で持っておき、この中でランダムにユーザIDを選択するようにするつもりだ。
これをするのにちゃんとしたデータベースを使いたいと思い、研究室のぼくのPCに『MSDE 2000 Release A』を仕込んだ。研究室のWebサーバ(FreeBSD)からPHP経由でぼくのPCにアクセスし、ユーザIDを取得するという構成を考えている。microsoftのサイトから『MSDE 2000 Release A』をダウンロードし、インストール。インストールの際にはsetup.iniに以下のようにオプションを指定する。
DISABLENETWORKPROTOCOLS=0 SECURITYMODE=SQL SAPWD=[password]
重要なのがDISABLENETWORKPROTOCOLSで、外部からの接続を許すにはこのオプションを0にしておく必要があるらしい(明示的に指定しないと1が指定されたものとされる。これだと外部から接続して使えない)。SAPWDではsa(うにくすでいうrootみたいなもん)のパスワードを指定する。
また、MSDEはタダで使える代わりにGUIベースなマネジメントツールがいっさい付属しない。コマンドラインからosqlというコマンドをつかって、SQLを発行してすべての作業を行うということになっているのだがいちいちSQLを打つのがだるいのでできればやりたくない。フリーで使えるGUIベースなツールがいくつかあり、そのなかで『DbaMgr2k』というのを使ってみている。
開発言語にはC#を、データベースの接続にはADO.NETを使うつもり。ADO.NETは初めて弄るのでこれからお勉強しなくっちゃ。
7 18, 2004
google, yahoo, MSNの検索順位をまとめてチェキですよ
『いちにのさん.com 検索エンジン順位チェック』なるサイトを見つけた。対象URLと検索キーワードを入力すると、google, yahoo, MSNのそれぞれについて100番目までの検索結果を調べ、対象URLがそのなかに含まれていれば、順位とそのURLを表示してくれる。「自分のサイトがこのキーワードでいったい何位に居るのか」というのを複数の検索エンジンについてひとまとめにチェックできるというわけで、なかなか楽しい。
ところで、最初のフォームで「登録メール」なるものの入力を求められる。これはこのサービスを使うのに、この会社の発行してるメールマガジンに登録することが条件になっているためで、メールマガジンの読者かどうかを確かめるために、登録済みのメールアドレスを入力することが必要となっている。試しに使ってみるなら、ここにはぼくのメールアドレス"shin@windy.ac"を入れましょう:-p 「これは面白い、ぜひ使いたい!」となったら、ちゃんとあなたのメールアドレスをメールマガジンに登録して、それを使うようにしてくださいな。
いちにのさん.com 検索エンジン順位チェック
http://www.12no3.com/tool/ranking_check.php
LED Binary Watch
thinkgeek(オタク向けグッズの通信販売をしているサイト)で見つけたナイスな時計。10個のLEDで時間を教えてくれる。上の段に4つ、下の段に6つのLEDが配されており、それぞれが時間と分を2進数であらわすというギミック。この画像だと、時間は(8 + 0 + 2 + 0) = 10で10時。分は(0 + 0 + 8 + 4 + 2 + 1) = 15で15分。よって10時15分、ということになる。
LEDの輝きのうつくしさといい、盤面が基盤風になっているセンスの良さといい、ふつうのひとが見ても何が何だかわけわかんないところといい、じつに萌える。そのうち衝動的に買ってしまいそうな予感がする。お値段は$69.99とのこと。
LED Binary Watch
http://www.thinkgeek.com/gadgets/watches/6a17/
7 17, 2004
オープンソースなクローラをまとめてみたよ
研究室でクローラ勉強会なるものをやることになって、その中でクローラのソースコードを読むことになりました。んで、ぼくがその講師役を仰せつかりました。そこで、どのクローラのソースを読むかを決めるために、オープンソースなクローラをリストアップして、それらについて簡単に表を作りました。どこかに役立ててくれるひとがいるかもしれないんで、ここに置いておきます。
表の見方ですが……まあ、見れば分かります。たぶん。
#クローラってのは、WWW上の文書や画像などを周期的に取得し、自動的にデータベース化するプログラムのことです。もうちょっと詳しく知りたい方はここなど御覧ください:-)
http://ja.wikipedia.org/wiki/%E3%82%AF%E3%83%AD%E3%83%BC%E3%83%A9
7 16, 2004
青山ブックセンター全店閉店
http://www.shinbunka.co.jp/news/04-07-16-photo.htm
驚いた。新宿の店にしか行ったことがないが、いつも客がたくさん入っていて、少なくとも閑古鳥が泣いているようには見えなかった。あんなに客が居ても、じつは冷やかしばっかりだったんだろうか。たしかに、ぼくはあそこで本を買ったことは一度もないな、そういえば。
たとえば「文教堂」みたいな、画一的でおもしろみの欠片もないチェーン店方式の本屋ばかりが栄えて、ああいう個性とポリシーのあるいかした本屋が潰れてしまうのは慚愧に耐えない。ほんとうに残念におもう。
メモ用blogを付けた(&身の回りのドキュメントを管理する方法についての雑考)
このblogにメモ用blogを付けた。付けたというか、リンクを張った。サイドバーの上から2つ目に置いた。最近、このblogにドキュメントを集約することを強く考えている。CNETの梅田さんのblogで、「こちら側」と「向こう側」の議論がこのところ何度か為されているが、身の回りの細々としたデータをすべてオンラインに移行して、どこかに集約して個人的なポータルを作れたらとおもう。
このblogのサイドバーにはいまのところ次のようなものがある。
メモ用に使っているblog。自宅サーバに仕込んだMovableTypeで運用している。ブラウザベースで使える洗練されたインターフェースや全文検索機能など、メモ管理ツールとして有用で重宝している。blogでメモを取るというのはなかなかナイスなソリューションで、みなさまにもお勧めしたいところ。
気になったURLをコメント&カテゴリ付きでクリップしてる。"MyClip"というサービスを使っている。「ブックマークに入れるほどではないが、ちょっと引っかかる」というくらいのURLを整理するのにそこそこ使える。
やらなくちゃならないこと、やりたいことを箇条書きにしてまとめたテキスト。こうやって分かりやすくまとめておくと、自分の中で優先順位を付けるのに便利なのだ。
んで。ぼくとしては、さらに次のようなデータをここに置くように(=ここからアクセスできるように)できないかと思っている。
論文の管理をどうにかしたいというのは前々から考えている。研究室のPCと自宅のPCとでデータが分散してしまうのが先ず良くないし、各々のPCで論文を置く場所もいまいち決まっていない。だいたいマイディレクトリの中の"論文"フォルダに入れるのだが、面倒なときはデスクトップにおきっぱなしにしたりしてる。また、論文の内容についてメモを作ることがあるが、これもどうやって管理するかがちゃんと決められていないのですぐに散逸してしまう。このあたりをなんとかしたい。何かしらのドキュメント管理ツールを自宅サーバに仕込んで、論文の内容を記述するテンプレートを作って、それに従って管理しよう。……というのを前々から考えてはいるが面倒で手が着いていない。メモと違って、時系列に沿って管理する意味があまりないので、やるとしたらwikiを使うつもり。
定期的に研究室PCと自宅PCのブックマークをマージしているのだがこの作業は実にだるい。面倒で死ぬ。やってらんない。ブックマークはブラウザのインターフェースと密接にくっついてるデータなので扱いが難しい。どこかのサーバにデータを置いて、ブラウザの起動時にそこへアクセスし、データを読み込む、みたいなソリューションが取れたらナイスなのだが。……とここまで書いたところで、たしかブックマークを置くフォルダってIEだとレジストリかどこかで指定できたはずなので、自宅サーバのWebDAVにブックマークを置いて、そこをブックマークフォルダに指定するというソリューションを思いついた。あとでやってみよう。
何を隠そう、こいつの管理が一番むずかしい。どうやったものか。萌え画像の管理って、ディレクトリのような木構造ではちょっとつらくて、個々の画像にタグを付けるか、"MyLifeBits"のようにDAC(非循環有効グラフ)で表現するかだとおもうのだ。……しかし、こういったアプローチで実装されたナイスなツールというのはいまのところ存在しないとおもう。longhornのWinFSなんかが出てくるのを待つべきなのでしょうか。あと画像なのでサムネイルを見たいし、それも効率的に見たいという欲求が当然ある。どうやって?
……とまあ、だらだらとこんなことを考えているのでございます。
7 15, 2004
randommixiがかっこよくなった
master-pandaさんにデザインをしていただいて、 randommixiがナイスにかっこよくなりました。
いままでのしょぼいデザインが見違えるようです。master-pandaさん、ありがとうございました。
7 13, 2004
randommixiというのを作ってみた
randommixi
http://www.seman.cs.uec.ac.jp/~shin/randommixi/
mixiのユーザをランダムに表示するツール。暇つぶしにmixiでいろんな人のプロフィールを見て回ることが多いのだが、自分の友達リストや参加コミュニティを起点とすることになるため、どうしても偏りが生じてしまう。自然、「この人、もう何度も見たことあるよ」というような状況が多発し、どうもおもしろくない。そこで「完全にランダムにプロフィールにアクセスできれば良いなあ」と思い、とりあえず作ってみた。
mixiのユーザをランダム表示するものはすでにあるのだが、ぼくは、もっと、次々とザッピングするようにいろんなプロフィールを見て行きたいと考えていた。そこで、フレームに分割したインターフェースで、ボタンを押すたびに新しいプロフィールが表示されるというものにした。また、自動的にリロードし、スライドショーのようにしてプロフィールを見ていけるという機能を付けた。
使い方は単純明快で、"randommixi!"ボタンを押すとランダムにユーザを表示する。"SlideShow"というチェックボックスをオンにしておくと自動的にリロードする。今のところこれだけ。こういう機能が欲しい、という要望があれば、ぜひコメントを付けてください。できるだけ対応したいとおもいます。
7 12, 2004
PTT #301(こうさぎ)
きょうかぐらは論文をWebされた!
*このエントリは、こうさぎの「かぐら」が書きました。
『飞鹰』とかいう珍妙な映画があるのだが
その登場人物であるところのJaneとかいうおねえさんが萌え。Li Bingbingというひとが演じているらしい。要チェキだ。能面っぽいモデル顔とボンテージなえろえろコスチュームがすばらしい。どういうわけか髪の色が2種類あるのもよろしい。ストーリーとか知らないのでなんで2種類あるのかはわからない。
翻って主人公のデザインが非常にありえない。中国の美的感覚ではこれが格好良いのだろうか。とても疑問におもう。これならJaneたんを主人公にしたほうがよっぽど良いとおもうのだが。
それにしても中国映画はこのなんとも云えないB級感が良いね。全体的に20年くらい時代に遅れてるような感じがして。大ヒット必至の『飞鹰』の公式サイトはこちらです。
実家へ行ってた(続き)
家族でのんびりとお食事。そのあと、ビールをいただきながら親父とお袋とお喋り。おれは学校でのことや生活のことについて適当に話す。聞かれるままに正直に答えていたら、お袋がおれの生活のあまりの駄目さ加減にやや呆れていたようなのだが本当のことだから仕方がない。
奨学金について話す。学部のときに貰っていた奨学金の総額が160万円で、これを今後13年間かけて返していくことになるのだが、こいつには年率1%ちょいの利子が付く。そこで、「大した利率ではないにしても、利子が付くのはお前の負担になる。貸しということにして一括で返済してやるから、卒業してから親に返していくというのはどうだ」という提案を受ける。願ってもないお話なのでお願いする。
「この夏に免許を取りたい」という話をする。経済的に余裕がないので親に費用を出してもらう腹積もりだったのだが、なんとも小癪なことに、弟のやつは自分のお金を貯めて自腹で免許を取ったらしい。弟が自腹でおれが親持ちでは面白くないので、おれも自腹で取ることにする。とりあえず来年の夏に取ることを念頭に、なるべく貯金するようにしようとおもう。
居間で寝転がって、買ってきた「日本の論点2004」を読んでいると、妹がやってきて進学について相談される。妹はいま高校3年生で、ちょうど受験勉強をしているところだ。相変わらずぶくぶく肥っている。痩せろとおもう。相変わらず腐女子らしい。血迷ってゴスロリだのコスプレだのに走るようになったら縁を切ろうとおもう。妹と話していて思ったことには、自分の将来に対するイメージというのがほとんど何もないのだな。まだ学部のレベルですら希望が決まっておらず、「なんとなく文系」ということだけが頭にあるような感じだ。ここに行きたい、という大学もこれといってないらしい。文学部でも経済学部でもどこでも何でも良いのだろうか。この将来に対する見通しの無さにはちょっと幻滅したのだが、まあふつうそんなものなのかもしれない。「浪人ってどうなのかなあ」とか言ってたが、そんなことを考えるまえにもうちょっと考えるべきことがあるような。
むかしおれが使っていた部屋は物置になっているので、親父の部屋に布団を置いてもらって寝る。神経質なほうで、枕が変わると寝付きが悪い。いまいち眠れなかった。
翌日は選挙に行こうというので2時くらいに起こされる。投票所まで1kmくらいあるので車で行こうと主張するも、親父とお袋が歩きが良いというので歩きになってしまった。めんどい。歩いていると、道の中央が一直線に掘り返されたあとがある。何かと思って聞くと、下水道の工事のあとだと言う。「ウチのあたりに来るまでにはあと数年かかるそうだ」、「これでくみ取りじゃなくなるわね」とか言っている。クソ田舎はほんとうに恐ろしい。自民党の現職、民主党の現職、共産党の新顔という3人の候補者が居て、自民と民主のどっちの候補者に入れるか軽く悩むが、二大政党制にちょっとでも近づくように民主党に入れておく。
その後、すこしぐうたらして、うんこバーの続きを組みたくなったので帰ることにする。駅まで送ってもらう途中、親父にラーメンを奢って貰う。初めて行った店で割と美味だった。駅に着くと何やら水戸の辺りで大雨らしく、2時間も遅れが出ている。30分くらいホームで待たされる。これだからクソ田舎は嫌なんだ。そうして先ほどアパートに帰還。まあ、たまには実家に顔を出すのも悪くないかな。
7 11, 2004
実家へ行ってた
茨城県牛久市(上野から常磐線で一時間くらい)にある実家に、土曜日から日曜日に掛けて一泊二日で帰省してきた。選挙が近づいて、「もうすぐ選挙なので投票に来い」とのメールが両親から何通か着ていた。ほんとは面倒だから実家なんて行きたくないのだが、日本国民として選挙に行くべきだという義務感と、たまには顔を見せないと悪いなあという孝行心から行っておくことにした次第。
調布から牛久までは片道3時間くらい掛かる。鬱陶しがるほどの遠さではないのかも知れないが、かといってちょっと出掛けてくるという感覚でもないし、2つの乗り換えを挟むのもめんどい。常磐線に乗るのも久しぶりだ。今年の正月は卒研が素晴らしくやばい状況で、実家には帰らずにアパートに引き籠もっていた。そうなると実家に帰るのはいついらいだろう。去年の正月以来になるのかしらん。
牛久駅を出て、暗いなとおもう。まだ8時半なのに、駅を出て目に付く明かりというとパチンコ屋のネオンと数件の居酒屋(モンテローザ系のジャンクなお店)の看板くらいで、あとはほとんど真っ暗。ロータリーにも車の通りはほとんどない。クソ田舎おそるべし。駅から実家までは4kmくらいあるので、車で迎えにきてもらう。駅に着いたと電話を入れると、買い物をしたいので駅近くのスーパーで待ち合わせましょう、と言われる。のこのこあるいてスーパーへ向かう。
スーパーでお袋と弟に会い、食料品を買うのに付き合う。お袋は相変わらずだが弟はますます筋肉質になっている。きっちりトレーニングをしている上に毎晩プロテインをもりもり飲んでいるのでこうもなるなという感じで、プロテインのせいか分からないが筋肉の付き方がちょっと嘘くさいような感じになっているのがアレだ。まあいいけど。弟は新宿にある専門学校で2年間ダンスを習い、そのあと実家に戻ってきてスポーツインストラクタをしている。明朗快活で社交的で女にももてるという、おれとはおおむね正反対な奴で、昔は近所のおばちゃんとかに「あらまあ井原さんちのお兄ちゃんと弟さんってそっくりねえ」なんて言われていたのにいつのまにこうなったのかとっても不思議だ。
スーパーの中に小さな本屋があるので、暇をつぶすための本を探す。薄っぺらい雑誌など買っていってもすぐに読みきってしまうので、いくらでも時間をつぶせそうなものをということで、「日本の論点2004」をチョイス。お値段が高めなので買おうかどうしようか迷ったが、目次を見たら執筆陣に村上隆と中島義道がいたので買うことにした。とはいえ別に両者に心酔してるとかそういうのではまったくなくむしろ逆である。
買い物を済ませて車に戻るとどうやら弟が運転するらしい。そういえば免許を取ったと聞いたことがあったような気がする。非常に覚束なげな様子で、運転席周辺のデバイスについていちいちお袋に御教授を受けている。大丈夫なのかこいつ。不安だ。おれの命はたぶん御前の命よりも価値があると思うので御前が死んでもおれは殺すなよとかおもう。で、ふつうに何事もなく実家にたどり着いたわけだが弟が車の中でかける曲はアメリカ産(たぶん)の非常に喧しいヒップホップであり、こいつは絶対KOTOKOとか坂元真綾とか知らないで死んでいくんだろうなーとおもう。ほんと正反対だな。
続く。
7 10, 2004
Internet Explorerのツールバーを作ってる
GoogleやYahooなんかがIE(Internet Explorer)のツールバーをリリースしていることは割と知られているところですが、あんな感じのものを作ってみようと思い立ちました。徹夜でだらだらとコード書いて、とりあえずツールバーとしてIEに読み込ませるところまでいきました。いまのところはこんな感じ。
どんな機能のツールバーを作ろうとしてるのかは内緒です。ちゃんとしたものが出来たら、ここで公開したいとおもいます。
randomize! randomize!
amazon.comのデータから、本、CD、DVD、VHSをそれぞれランダムに表示してくれるページ。
Random Book
http://blog.outer-court.com/random-book-display/
Random Music
http://blog.outer-court.com/random-music-display/
Random DVD
http://blog.outer-court.com/random-dvd-display/
Random VHS
http://blog.outer-court.com/random-vhs-display/
ランダムはおもろい。「知らないけどおもしろいもの」にアクセスする手段として、ランダムはそこそこに有効だ。だが、おもろいのだが、能率の悪さ(S/N比の低さ)がやはり問題になる。何とかならねーのかと切実に思う。世の中暇人ばかりではないし、おもしろいものを見つけ出すのに労力を費やすことをよしとしないひとも多い。
「ことばのパズル もじぴったん」の声に萌えた
ナムコのWebサイトで「無料おためし版もじぴったん」ってのが公開されていて、暇つぶしによく遊ばせて貰っている。で、そこで使われている、タイトルコールやら何やらの声がとっても琴線に触れてくる。なんつーか、ちょっと上擦ったところや、少年っぽさ? のあるところがとってもよろしい。調べてみると、古原奈々というひとなのかな。
『ことばのパズル もじぴったん』 SE・ボイス集
http://windy.ac/dat/moji-pittan.mp3
7 9, 2004
Bloglinesに自分のblogを読んでるやつのリストを表示する機能が。
きっちり使いこなしているひとからすれば「なにを今さら」というようなことなのだとおもうが、Bloglinesに、そのblogを購読しているユーザのリストを表示する機能があるというのを知った。
たとえば、下のURLで、「今日の井原」の購読者の数と、そのリストを取れる。また、購読者のリストについては、「自分のリストをpublicにする」という設定をしているユーザのみが表示される。siteidを見たいblogのIDにすれば、そのblogの購読者のリストを表示できる。
http://www.bloglines.com/userdir?siteid=179886
「今日の井原」の場合、ぜんぶで7人の購読者がいて、そのなかの1人がリストをpublicにしている。ぼくのしょぼいblogを購読なさっておられる"uxine"さん、どーもありがとうございます。で、自分のblogを読んでいるひとが他にどんなblogを読んでいるのかを知ることもできて、これがひじょうにおもろい。「あ、これおれも読んでる!」とか、「このblogおもしろいなあ、おれも読もう」とか。
それにしても、Bloglinesはいろんな機能があって実によくできている。一通り弄ってみるだけの価値はあるなあ。
[読書]進化的画像処理
mixiの増井俊之先生の日記で紹介されていたのを見て、面白そうなので読んでみた。面白かった。
GA&GP;(遺伝的アルゴリズム&遺伝的プログラミング)の手法を使って、画像処理のフィルタを自動生成してみましょう、というのが全体を貫くテーマ。複雑な処理をする画像処理フィルタも、基本的なフィルタの組み合わせで表現できることが多いのだが、熟練した専門家であっても、その組み合わせを直感的に掴むことは容易ではない。そこで、GAやGPを使って、使い物になるだけのクオリティを持った画像処理フィルタを自動生成してやりましょう、というお話である。
文中で述べられる手法のおおまかな手順としては、まず、処理したい画像と、「こんなふうに処理して欲しい」という処理後の画像(これは手作業で作成しなくちゃならない)、そして重み付け画像を用意する。評価関数と、組み合わせる基本的なフィルタも用意する。で、GAかGPのアルゴリズムを使い、にょろにょろと実用解となるフィルタが生成されるまでプログラムを走らせる。……って、こうやって書いただけじゃいまいち分からないとおもうので、詳しく知りたい人は実際に読んでみてくださいな。
当然のことながら、最適化問題に定式化できないと扱えないため、あまり高度なことはできない(じゃあどのあたりまでなら出来るんだ、と言われると僕自身の無知もあってうまく答えるのは難しい。まず、評価関数をうまく設定できないと駄目だし、その評価関数が他の処理対象の画像にうまく適合するものでなくてはならない)。しかし、自分ではどんなふうにしたら良いのか想像も付かないようなフィルタが自動的に生成されるのはなかなかの驚きで、掲載された画像を眺めていくだけでも楽しめるとおもう。
基礎的な知識を丁寧にフォローしてあり、GAの知識がまったくなくても問題なく読めるようになっている。プログラミングリストが掲載されており、昭晃堂のサイトでダウンロードできるようになっているのもすばらしい。文句なしに刺激的な良著で、画像処理を(テーマとしている || 興味を持っている)尾内研のメンバーにはお勧めです。
7 8, 2004
検索機能が付きました
サイドバーの一番上に、検索用のフォームを付けました。渋沢に感謝。
エントリも170を超えました.今後もよろしくお願いします。
how to study crawlers?
このドキュメントは、これからクローラについて、とりわけ学術分野でのクローラ関連の研究についてサーベイをしようという人のために、どんな順番で、何を読んでいったら良いかを、簡単にまとめたものです。
後輩へのアドバイスとして、研究室のメーリングリストに投げたものなのですが、もしかしたらどこかに役に立ててくれる人がいるかもしれないので、ここにもポストしておこうとおもいます(※すでに尾内研のメーリングリストにポストされたものを読んでいるなら、これを読む必要はありません。内容は一緒です)
step1 - introduction
とりあえず、もっとも手始めに読むドキュメントとしては、robotstxt.orgにある『The Web Robots FAQ...』が優れているとおもいます。
robot(=crawler)とは何か、という話から始まって、基礎的な知識を一通り得られるようになっています。まずこれに目を通してみてください。また、すでに基礎的な知識を持っているなら、これを読む必要はありません。
・The Web Robots FAQ...
http://www.robotstxt.org/wc/faq.html
step2 - basic papers
"paper"といっても論文ではないのですが、クローラについて概観したページがWeb上にいくつかあります。
実際に論文を読みに行くまえに、まずはこれらに目を通して、クローラというテーマの中でどんな問題やアプローチがあるのかをおおまかに掴んでおくのが良いと思います。
・Web Crawler Review
http://dev.funnelback.com/crawler-review.html
クローラにおける様々なアプローチを列挙し、解説した文書。極めて優れています。まずはこれから読んでみるのが良いとおもいます。
・Web Crawlers
http://www.google.co.jp/search?q=cache:ISSGcOzZe4gJ:www.ist.psu.edu/faculty_pages/
giles/IST497/presentations/Belyavskiy.ppt
"Issues to consider"として、問題となっている事柄についてよくまとまっています。
・Advanced Crawling Techniques
http://ibook.ics.uci.edu/Slides/MIW%20Chapter%206.ppt
クローラ研究における最近の研究をまとめたppt。内容が高度で、ぼくもちゃんとすべて理解してるわけではないです。わからないところは飛ばしながらざっと目を通していくのが良いかと。
これら3つを一通り読めば、クローラについてある程度の知見を得ることができるとおもいます。
step3 - applied papers
step2で紹介したページを一通り読んだなら、topic-specificなアプローチとか、エージェント技術を応用したアプローチとか、何かしら興味を惹かれたものがあると思います(もし無かったならもうクローラなんて投げ捨てて、もっと他のテーマを探したほうが良いのではないかしらん)
ここから先は、各々で、自分で興味を持ったアプローチの論文を探して読んでいってください。
『Web Crawler Review』のなかで主要な論文は紹介されてますし、CiteSeer等の検索エンジンを使うのも良いとおもいます。
……とまあ、こんな感じで読み進めて行くと、最短経路である程度の知見を得られると思います。
あと、日本語で読める文献にはろくなものがないので、大人しく英語のものを読みに行ったほうがよさげです。
7 7, 2004
いまbk1で本を買うと実質6%のキャッシュバックですよ
オンライン書店『bk1』が、1万円以上の購入で10%のネットマイルを呉れるキャンペーンをやっている(詳細はここ)。また、ネットマイルのサイトで、1000ptのネットマイルを600yenぶんのbk1商品券に交換することができる。なので、bk1でネットマイルを獲得→獲得したネットマイルをbk1商品券に交換という手順を踏むことで、実質的に6%のキックバックを受けることができる。もちろん、ネットマイルはいろんな品物に交換することができるので、ほかのものをチョイスしてもOK。
というわけで、いままで買おうと思って後のばしにしていた本を、まとめて購入しようとおもったり。キャンペーンは今月31日までだそうです。
「研究リテラシ」の必要性について
ぼくの居る学科では一年次に「コンピュータリテラシ」という講義をやる。Linuxの基本的な使い方を、たとえばメールの送受信とかemacsの基本操作なんかをのんびりと教えるもので、正直、「こんなくだらねーこと講義でやってんじゃねーよ」とか、「自力で勝手に習得させろよ」とか思わないでもない。……とはいえ。ぼくは今年、コンピュータリテラシのTA(てぃーちんぐ・あしすたんと。講義中に学生からの質問に答えたり、教官のお手伝いをしたりするお役目)を務めているのだが、実際に教える側として学生たちに接してみると、あれくらい丁寧に紐解いてやらないとさいしょの一歩を踏み出せなさそうな奴が少なからず居ることも確かで、PCを使うためのガイダンス的な内容を、講義のなかに組み込んでしまうというやり方は理解できる。
そうして本題なのだが、PCのリテラシをあれだけ至れり尽くせり教えるくせに、研究のリテラシをちっとも教えないのはどういうことなのかと思うのだ。研究のリテラシってのは、たとえば、図書館で論文をコピーする方法とか、CiteSeerの存在とか、英語の論文をうまく斜め読みする方法とか、情報工学分野にどんな学会があってどの学会でどんなことをやっていてどこに権威があるのかとか、研究室で快適に過ごす方法とか、エトセトラエトセトラ……。まあそういったものことだ。他の学科、他の大学でどうなっているのか分からないのだが、ぼくの居る学科では、学生に対してこのあたりのフォローをすることはまったく無い。研究室に配属されてから、教官や先輩から教えられる、あるいは自力で習得することにまかされている。しかし、コンピュータリテラシと研究リテラシとを比較すると、後者の方が30倍くらいは重要なはずで、「コンピュータリテラシ」をカリキュラムに組み込むなら、「研究リテラシ」をどうして組み込まないのかわからない。3年の後期にでも、専門科目の扱いで、必修としてカリキュラムに組み込んでしまえばいいとおもうのだが。
最近B4たちと接していて、そういうのを痛烈に感じる。だって論文の探し方とかいまいち分かってないし、CiteSeer知らなかったりするし、英語の文献を読むのを嫌うし。サーベイするにしても微妙にずれているというか能率の悪いやり方をしてるような気がするのだな。……って、ぜんぶ去年のおれのことじゃないか。覚えがあるぞ。うむ。去年のおれはまさしくあんな感じだったぞそういえば。
研究室に配属される時点で、ある程度のサーベイ能力を身につけているべきだとおもうわけだ。ある程度ってのがどの程度なのかは難しいところだが、目安としては、いまのおれくらいのサーベイ能力を。……ってどれくらいだか全然わからないですね。書くのに飽きてきたので強引にまとめてしまうが、結論としては、「研究リテラシ」というべきものがあって、それを研究室に入る前の段階である程度までたたき込んでおくと、みんながhappyなんじゃないかっつーこと。そして、それをカリキュラムのなかに組み込んでしまえたら良いんじゃないのかなー、ってことだ。おしまい。
7 6, 2004
なんとBloglinesに逆引き検索の機能が。
その名も『Bloglines Citations』。blog記事やニュース記事なんかのURLを喰わせると、そのURLにリンクしているblogのページをリスト表示してくれる。一例として、切り込み隊長blogの「ライブドアが近鉄球団を買えばパリーグが助かると思ってる奴が多い」っていう記事のURLを入れてみるのが下のURL。
ありそうで無かった実装で、なかなかおもしろい。Bloglinesって日本語のblogはいまいちカバーしきれていないきらいがあり、あまり実用的ではないという印象ではあるけど。
ぼくのPC、ウイルスだらけ!
ひさしぶりにウイルススキャンしてみたら出るわ出るわ。いつの間にか560匹も居たなんて知らなかったよ。誰かに迷惑を掛けてなければ良いのだけど。わはははは。
headline-readerにお乗り換え
「SharpReader」っていうRSSリーダをいままで使っていたのだが、.NET frameworkを使っているためか、動作も重いしアホほどメモリを喰ってくれる。登録されているRSSの数は200くらいなのだが、起動時から100MB近いメモリを使う。インターフェースや操作性は文句なしなのだが、この鈍重っぷりがちょっと嫌なので、他のものをいくつか検討し、headline-readerってのに乗り換えることにした。
このheadline-reader、動作も軽くメモリも食わず、操作性はSharpReaderと同等以上という感じ。こちらの要求通りで非常にナイスだ。難点はシェアウェア(1,500yen。30日間の試用期間あり)だということだが、最近では一日あたり2~3時間をRSSリーダでblogを読むのに費やしているので、それくらいの出費は全然OKだし。
7 4, 2004
「煙舞」 / ジャン=マルク・ペルティエ
この作品では、線香から立ち昇る煙の動きや形の変化によって音楽が変わる。煙はビデオカメラで撮影され、自作のコンピュータプログラムによってその映像が解析される。形態を評価するパラメータが音の種類を決める。煙を揺らす風は観客の息だけで十分であり、人数によって煙の反応が自然に変わり、音楽の雰囲気が決められる。
おもろい。ぜひ生で観てみたい。
http://www.japandesign.ne.jp/HTM/JDNREPORT/
sotsuten2004/iamas/05.html
7 2, 2004
freeなぱわぽのテンプレート
ナイスでハイクオリティなテンプレートがなんと208個も!
ぱわぽのテンプレートってWebで探しても有料なものばかりなので、こういうサイトがあるのはとってもうれしい。
PTT #301
逝ってきた。ゼミを途中で抜け出して、会場であるところのAVホール@西9-3Fへ。友人のU氏が「快速数式入力」という題目で発表したのだが、なかなか強烈であった。
PTTというのは世に言うところの「ハッカー」な人たちがにょろにょろとやってくる会合で、しかもU氏の発表は彼らが頻繁に愛用するところの数式入力に関するものだったので、突っ込みがじつにきびしい。PTTのスタイルとして、疑問に思ったことは発表の途中で質問する、というのがある。あれげな人たちが発表の穴を鋭く見つけて突っついてくるためUも相当つらかったとおもう。本質的な質問(研究のそもそもの意義に関するくえすちょん)も少なからず浴びせられていた。その後の飲み会で某ジャイアンが言っていたことには、そういう本質的な質問を捌ききれずに、途中で発表を続けられなくなってしまったひとも過去には居たらしい。恐ろしい。
思ったこと。事前にきっちり発表練習をして、穴をできるだけ潰しておくこと。日頃のゼミで存分にぶっ叩かれておくこと。プロフェッサーONAIはゼミでもかなり厳しいことを言うことがあるがそれは当事者にとって良いことなのだたぶん。そして、自分の研究を外に晒すのは大事だということ。
personalizedなblog(&news;)検索エンジンがローンチされた(こうさぎ)
きょうはryojuがここでryojuはキヌガサした。
そういえばきのうはryojuがぐうたらを追加したかったの♪
そういえばryojuの、利用したよ♪
ryojuは、
『Newsdrecom/newsdrecom/news/medsと同様のサービスとしてはreadonewsdrecom/netcom/neがある。
ドリコム、ニュースとブログの検索サービスを開始--グーグルニュースの日本語版となるかhttp://news/medsと同様のサービスとしてはrecomjp/本日正午にサービスが開始されてる。
自動でやってるならなかなかいかしてる。
どんなアルゴリズムなんだろ。
立命館大の小柳研究室はここ。
学生の卒論がpdfで取れる。
Bulkfeedsと同様のサービスとしてはreadonews&Blog;記事へのリンクを適当にクリックすると、なるほど、「おすすめブログ」の欄にblogSequencnews&Blog;の記事がある。
ドリコムによる産学協同なプロジェクト。
へぇ。
先行する類似のサービスとしてはreadonWebMininingWWAccessSequencebyMatrixClustering
”InternationalWorkshoponWebMiningWWサービス支援システムの優劣というのは200002年の9月だとか。
記事の各々について、関連する記事の精度に明らかな差はないと感じた。
プロジェクトが立ち上がったのか。
ん〜。
このあたり勉強不足だな。
CNETに記事が表示されるようになる。
おもしろい。
以下、箇条書きにて。
立命館大学と株式会社ドリコム、ニュースとブログの検索サービスを開始--グーグルニュースの日本語版となるかhttp://news&Blog;の記事からの引用。
同大学教授の小柳滋氏による独自のデータマイニングを用いたWWAccessSequencessSequencnetcom/netcomjp/本日正午にサービスが開始されてる。
どんな制度なのか。
早い。
2年近く前にこれを着想し、動き出していたのは20069384,0069384,002年の9月だとか。
SOyancebMingWWAccebyMatrixClustering”InternationalWor
といってました。
*このエントリは、こうさぎの「かぐら」が書きました。
Post a comment to 'personalizedなblog(&news;)検索エンジンがローンチされた(こうさぎ)'
7 1, 2004
ToDoを付けた
いままではローカルPCのテキストファイルで管理していたToDoをサイドバーの上から3つめにくっつけた。MovableTypeはテキスト管理ツールとしてもじゅうぶん優れているのでこういう使い方もいけますね。blogの私的利用ソリューション。
これだけ見るとやることだらけで忙しい毎日を送っているように思えてしまうけど、どれも中途半端になるかまったく手をつけないまま終わるのがダメ人間のダメ人間たるゆえんなのです。