Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
今日の井原 - 2005年09月 Archives
[go: Go Back, main page]

"2005年09月" archive

9 30, 2005

ピカチュー語変換(ただし英語)

Posted at 3:52 in . | 0 Trackbacks, 8 Comments

 うわ。バカだなー。ほんとにバカだなー。よくこんなの作るよなー。(褒め言葉)

 日本語だと良い感じに化けるのが残念。


ピカチュー語変換(Pikachizer)
http://pikachize.eye-of-newt.com/

yahoo.comをピカチュー語変換
http://pikachize.eye-of-newt.com/pika.cgi?url=http://www.yahoo.com/

Post a comment to 'ピカチュー語変換(ただし英語)'



9 28, 2005

RSSフィードを複数のフォーマットで提供するのは悪いことだから、止めた方が良いよっていうお話。

Posted at 0:02 in . | 0 Trackbacks, 10 Comments

 今日の今日まで、このblogでは、RSSを3つのフォーマットで提供していた。RSS1.0、RSS2.0、それからAtom0.3。自分ではそれはとても良いことなのだと思っていたのね。ひょっとしたらどれか一つのフォーマットにしか対応していないRSSリーダを使っている人が居るかもしれない。3つのフォーマットを提供しておけば、そういう人もhappyだ、そんな考えで。

 ところが、Microsoft Team RSS Blogの「Windows RSS Publisher's Guide, Part 1: Feed Auto-discovery」という記事に下のように書いてあったのだ。

Unless you have a really good reason, it’s not a good idea to have two links (or three!) that provide the same feed in different formats. It just makes the user have to pick between two things that they are not capable of distinguishing between. Pick your favorite format, and just support that.

試訳:
特にそうすべき理由が無いなら、同じフィードをいくつものフォーマットで提供するのは良くありません。見分けの付かないものの中からどれか一つ選ぶことをユーザに強いるからです。あなたの好きなフォーマットを選んで、それだけを提供するようにしましょう。

 僕はこれを読んではっとしたのだけど、確かにRSSのフォーマットはいくつもあるけれど、それぞれの違いなんてほとんどの人は意識していないだろう。RSSにいくつもフォーマットがあるということ自体を知らない人だって多そうだ。それに、考えてみると、RSSリーダは複数のフォーマットに対応しているのが普通で、どれか一つのフォーマットにしか対応していないRSSリーダなんて見たことがない。

 だから、実際、RSSを複数のフォーマットで提供する必要なんて無かったのだ。提供されているRSSがたった一つだけなら、何も考えずにそれを選んで、RSSリーダに追加すれば良い。しかし、複数フォーマットへのリンクが並んでいると、その中から一つを選ばなくちゃならない。その「選ぶ」こと自体が無駄な手間だし、あまり詳しくない人だったら、どれを選んだら良いのか戸惑ってしまうだろう。

 それで、ユーザ(このblogを読んでくれる人)の利便を考えてやったはずのことが、むしろユーザにとって害になっていたということを知って、僕は吃驚したというわけ。これは、何というか、blogのRSSをどうこうというだけの話ではなくて、より一般的な話に繋がることなのだという気がする。「何でもできるのは何もできないのと同じ」というフレーズがあったけど、それを思い出した。無暗に選択肢を増やして、「なんでもできる」を追求すれば良いというわけではないのだな。

 そんなわけで、このblogでは、RSS1.0フォーマットのRSSだけを提供するようにした次第。件の記事の存在を教えてくれたkokepi氏(の日記)に感謝します。

Post a comment to 'RSSフィードを複数のフォーマットで提供するのは悪いことだから、止めた方が良いよっていうお話。'



9 27, 2005

タイトル付けるのが面倒だから何とかして欲しい

Posted at 22:54 in . | 0 Trackbacks, 12 Comments

 blogって新しいエントリを投稿するのにタイトルが必須じゃないですか。というか少なくともこのblogで使っているMovableTypeっていうツールだと必須なんですよ。でもタイトルってそのエントリの文章にぴったりなやつが一瞬にしてズバーンって思いつくわけじゃないじゃないですか必ずしも。タイトルを最初に決めちゃうような人だとそんな悩み自体ないのかな。僕は文章から書いて最後にタイトル決めるんでタイトルが上手く決まらなくてうーむってなることがすごいあるんですよ。これが超うざいです。

 なので、タイトルを空白のままにしてエントリを作成しようとすると、文章をあれこれと解析して、勝手にそこそこのタイトルを付けてくれるような機能が欲しいです。誰かMovableTypeのプラグインで作ってください。作ってくれたらみんなが幸せになれると思います!

Post a comment to 'タイトル付けるのが面倒だから何とかして欲しい'



ニュースサイトはデザインを統一すれば良いのに

Posted at 22:46 in . | 0 Trackbacks, 13 Comments

 スポーツ新聞のWebサイトをいくつか見ていて、各社で激しくデザインが違うのにうんざりし、「この野郎、デザインを規格化して統一しろよアホ」と思うと同時に「広告のflashがうねうね動いてきもいなあ。これ外してくれないかな」とも思ったんだけど、その要求を概ね満たすモノがgoogle newsだったことに気付いて「やっぱりgoogle先生はすごいや!」と改めて感動した。そんな夜更け。

Post a comment to 'ニュースサイトはデザインを統一すれば良いのに'



9 26, 2005

amazonへ大量のリンクを張るだけのアフィリエイトな自動生成サイト

Posted at 21:51 in . | 0 Trackbacks, 11 Comments

 マイナーなソフトウェアの名前で検索していたら、これらの自動作成と思しきWebサイトが大量に引っ掛かってきて閉口した。何だ、これは。

http://www.o08.com/
http://dvd.pupu.jp/
http://music-cd.ciao.jp/
http://amazon.sub.jp/
http://buy.sub.jp/

 以前「アフィリエイト収入を目的としたスパムblogが急増してる件」というエントリを書いたけど、目論見としてはアレと一緒だろう。大量のWebページを自動生成して、検索エンジンからユーザを獲得して、アフィリエイト収入を得る。うまー。SEO的なチューニングを施しておけば効果も倍増ってところか。

 何の付加価値もない、ただリンクを並べただけのWebサイトを大量に作るのはSPAM行為だと思う。Webにゴミをばらまくだけの意味のない行為だ。この手のSPAM行為は、可能ならば、アフィリエイトを提供する側でどうにかして排除して欲しい。SPAM行為にはアフィリエイト報酬を支払わないと宣言するだけでも違うだろう。SPAM行為とそれ以外との境界線を明確に引くことは難しいだろうが。それにしても、amazon.co.jpの側ではこういうWebサイトを容認してるんだろうか。そもそも存在を把握しているのかな。

Post a comment to 'amazonへ大量のリンクを張るだけのアフィリエイトな自動生成サイト'



9 25, 2005

文章要約プログラムのデモを再起動しました

Posted at 15:05 in . | 0 Trackbacks, 11 Comments

makesummary.PNG

 

 2年くらい前に書いた「文章要約プログラムを書いてみよう!」というカテゴリがあるんですが、そこで公開していた文章要約プログラムのデモが止まった状態だったことに気付き、サーバを移して再起動しました。試してみようとしたらnot foundで、残念に思ったひとが居たとおもうと申し訳ないです。ついでに、簡単なreadmeを書いて、ソースコードのアーカイブに添付しておきました。

 

今日の井原 - 文章要約プログラムを書いてみよう! Archives
http://blog.windy.ac/archives/cat_eieiioieaonsse.html

文章要約プログラムのデモ
http://130.153.152.16/SummaryMaker/

文章要約プログラムのソースコード
http://blog.windy.ac/archives/SummaryMaker.lzh

Post a comment to '文章要約プログラムのデモを再起動しました'



Adsense開始から一週間たった

Posted at 13:21 in . | 0 Trackbacks, 20 Comments

adsense.PNG

 

 一週間くらい前から、このblogの個別エントリのページにGoogle Adsenseを貼っている。これまでの成績は、2,894回表示されて、6回クリックされて、それによる報酬が1.07ドル(120円くらい)。クリック率はだいたい0.2%。

 仮にこれくらいのペースをずっと維持すると、一月あたり400~500円くらいの収入になるのか。一年で5千円くらい? 一度blogのテンプレートにリンクを貼ってしまえば、あとはまったく手間が掛からないことを考えると、これでも悪くないとも思えるんだが、そう思わせるところがAdsenseの上手いところなんだよな、たぶん。

 googleであれこれ調べた結果であって全く信頼できる数字ではないのだが、僕がやっているみたいに、普通のblogに普通にAdsenseを貼るというケースでは、クリック率は概ね0.2~0.5%程度に落ち着くという。1%はよほど上手くやらないと越えないらしい。このblog程度のアクセス数では、「副業」と言えるくらいの収入には、なかなかならないみたいだ。

Post a comment to 'Adsense開始から一週間たった'



9 23, 2005

[読書]研究者人生双六講義

Posted at 16:24 in アホの子だけど読んだ本を紹介しちゃうぞ . | 0 Trackbacks, 15 Comments

4000065963.09.LZZZZZZZ.jpg

 

 研究者人生双六講義
 http://www.amazon.co.jp/exec/obidos/ASIN/4000065963/250-2473531-2226663

 これは良い本だ。

 学部生や大学院生が読むことを想定して、研究/研究者とはどのようなものか書いた本なのだが、研究活動をする上で知っておくべきあれこれの知識を、要点をまとめて書いてあってなかなか有用と思う。

 たとえば、full paperとproceedingsの違いとか、投稿した論文が採録されるまでの査読プロセスがどんなふうなのか、とか。このあたりのことって、研究室に入った時点では知らなくて、そこから人に聞いたり人の話すのを聞いたりして次第に知っていくものなんだと思うんだけど、それがこうやってパッケージ化されて、書籍という形になっているのが偉い。

 とりわけ、大学院への進学を考えている理工系の学部生にお勧めしたい。

Post a comment to '[読書]研究者人生双六講義'



9 22, 2005

「* *」で検索するとgoogleのインデックス済みページ数を取れるらしいよ

Posted at 7:44 in . | 0 Trackbacks, 9 Comments

ggg.bmp

 

真偽のほどは不明。数字を見ると確かにそれっぽい。

 

* * - Google 検索
http://www.google.co.jp/search?q=%2A+%2A

Searching for Double-Wildcard
http://blog.outer-court.com/archive/2005-09-20.html#n87

Post a comment to '「* *」で検索するとgoogleのインデックス済みページ数を取れるらしいよ'



mixiでコミュニティの参加者数を表示しないようにしたらどうなるのかな

Posted at 6:02 in . | 0 Trackbacks, 20 Comments

[SNS]Mixiのアンケート機能とコミュニティのサイズについて考察する (@ Tomo’s HotLine)
http://toremoro.tea-nifty.com/tomos_hotline/2005/09/snsmixi_2ad6.html

 を読みました。非常に面白いエントリなので、mixiマニアな貴方はぜひ一読を。

 

 主宰者になると、コミュニティの参加人数サイズによってコミュニティの質・内容が徐々に変わってくる事がわかり、大変面白い。
 一般論だが、コミュニティが小さい場合、参加者は自由に発言することができる雰囲気を持つ。

 (中略)

 小規模なサイズ(経験では20~30人程度)では、参加者が本当に言いたい事が言え、またそれを多くの他の参加者が迅速に(それもフレンドリーに)対処していく。1回でも発言した人の割合は50%を超えることがある。
 一種のアットホーム的な雰囲気を醸し出すことが多い。

 ところが、それ以上のサイズ、特に50人を越えた頃になると、コミュニティのウォッチはするが、発言をしない人の比率が急速に増えるような気がする。

 たしかにtomo氏の言うとおり、mixiのコミュニティというのは、参加者の数によってその性質(あるいは雰囲気)を変えて行くことが多々あります。単純に考えれば、コミュニティの参加人数が増えるにつれて、それに比例して発言数も増え、参加者同士の交流はより活発になっていくのではないかとも思えます。しかし実際にはそうはならないようです。逆に、小規模だったときには活発なやり取りがあったコミュニティが、参加者が増加し大規模になるに連れて、むしろ寂れていく例もたびたび見てきました。

 どうしてそうなるのかということなのですが、その原因は複合的で、単純に言えるようなものではないと思います(tomo氏のエントリでは、全部で6つの原因を挙げています)。その原因を精緻に検討するのは他の人に任せるとして、ここでの僕の興味は、「コミュニティの参加者に与えられる情報」が、コミュニティの参加者たちの振る舞いにどれくらい影響を与えるのかということです。

 mixiでは、コミュニティの名前の横に()で囲って参加者の数を表示しています。また、コミュニティのトップページには、9名の参加者がランダムに表示されます。そのコミュニティに参加しているメンバーの一覧を見ることも出来ます。コミュニティの管理人が誰かも分かります。こういった、コミュニティの規模や参加者に関する情報をまとめて、「コミュニティの参加者に与えられる情報」としましょう。感覚的なもので根拠はまったく無いんですが、これがコミュニティの参加者の振る舞いに少なからず影響を与えているように感じます。

 おそらく多くのmixiユーザにとって、mixiで一番よく見るページは自分のトップページ(ログインすると表示されるページ。home.plってやつ)でしょう。ここには自分の所属する9個のコミュニティがランダムに表示されており、その参加者の数も見ることができます。所属するコミュニティの数があまり多くなってくるとまた別でしょうが、自分の所属するコミュニティの参加者数をだいたい把握しているユーザは多いと思います。それが意識的にしろ無意識的にしろ、ユーザの各コミュニティでの振る舞いに影響しているのでは。他にも、たとえば、コミュニティのトップページに友達のアイコンがあれば、そのコミュニティで発言をしようという意欲も増すということがあるかも知れません。

 それで、やっとこのエントリのタイトルに近づいてくるんですが、「コミュニティの参加者に与えられる情報」を、最低限にしたらどうなるんでしょう。参加者の数をコミュニティ名と一緒に表示するのは止める。コミュニティのページでも、参加者の数も参加者のリストも見られないようにする。管理人が誰かも分からないようにする。まあ、そこまで極端にはやれないにしても(そういうのはmixiの考え方に反するものでしょうから)、コミュニティの参加者数だけでも表示しないようにしたら、何かしらの変化があるのでしょうか。

Post a comment to 'mixiでコミュニティの参加者数を表示しないようにしたらどうなるのかな'



9 20, 2005

研究がうまくいかないパターン

Posted at 16:57 in . | 0 Trackbacks, 15 Comments

強い松尾ぐみのために:研究の指導とステップアップ
http://www.carc.aist.go.jp/~y.matsuo/homepage/matsuogumi_how_to_research.htm

 

 産総研の中の人が書いたらしい。すばらしい。

 情報系の学生は必読。学生からすると、教授の側の視点で自分たちのことを見るというのはなかなかできないもので、それを「ダメなパターン」と「良いパターン」に類型化して示してくれているのはとても良いとおもう。

 また、アイディアについて述べた次の一節が面白かった。

ここまで見てきて気づくのが、アイディアが出るとか出ないなどの要素が、うまくいくパターン、うまくいかないパターンのどちらにも関係ないことである。基本的に、たくさんの知識を得て、思いついたことを実装して、結果をいろんな人と議論すれば、自分自身のアイディアというのは重要ではない。アイディアは思いつくのではなく、そこまで進んでいけば自然に見えてくるものだし、多くの人がいろいろと面白いアイディアを提供してくれる。

 たしかに、良いアイディアというのは知識の絶対量をベースにしないとなかなか出てこないということと、思いついた時点ではしょぼいアイディアでも、ゼミで議論していくうちに洗練されて良いアイディアになって行くことが多々あるということは感じる。「良いアイディアさえ思いつけば業績大漁で一発逆転だ」とか思って努力を怠っていたら駄目ということですね :-p

 この一節も、改めて心に留めておきたい。

理論は現象の抽象化なので、現象を蓄積しないと理論はできない。

 理論寄りの研究ではまた別なのだろうけど、僕、あるいは僕の居る研究室のやっているような実践寄りの研究では、まず現象を蓄積した上で、そこから共通の性質を取り出していくという方法でモデルを作ったほうが上手くいくことが多い。ところが、この「現象の蓄積」というのはどうしても面倒だし、泥臭い仕事になってしまうため、それを飛び越えていきなりモデル作りを始めてしまう傾向がある(ぼく自身にもその傾向はある。良くないことだと思う)。

 それで、ゼミの発表のときなど、学生がそういう風にしていると見ると、教授や助手は「じゃあ、それにはどういう例があるんだ。挙げてみろ」と言う。そこで学生がうまく返せないと、「まず、その問題には具体的にどういうものがあるのか、実際に調べてみなさい」とアドバイスするのですね。研究室に入ったばかりの頃は、現象の蓄積ということにあまり意味があると思えなくて、どうしていちいち面倒くさいことをさせるんだろうと思っていたんだけど。

Post a comment to '研究がうまくいかないパターン'



9 18, 2005

遺跡を見つけるのにGoogle Maps & Google Earthを使ってる人たちが居るらしい

Posted at 4:16 in . | 0 Trackbacks, 11 Comments

villa.PNG

 

しかも実際にローマ時代の遺跡が見付かったりしてるらしい。面白いな。

Enthusiast uses Google to reveal Roman ruins (@ news@nature.com)
http://www.nature.com/news/2005/050912/full/050912-6.html

Post a comment to '遺跡を見つけるのにGoogle Maps & Google Earthを使ってる人たちが居るらしい'



9 16, 2005

IBMのWebFountainプロジェクトでは、たった48台のXeonマシンでクローリングをしてるらしい

Posted at 17:18 in . | 0 Trackbacks, 9 Comments

今月号の情報処理学会誌によると

IBMアルマデン研究所が実施しているWebFountainプロジェクトでは、48台の2.4GHz Intel Xeon 2CPUサーバを用いてWebページの収集(5000万ページ/日)を行っている

とのこと。

ということは、だ。48台で5000万ページ/日なんだから、

 約100万ページ/台日

になって、さらに1日=86400秒なので、

 約12ページ/台秒

ということになるのか。これは一見「Xeonを2つ積んだマシンを使って、1秒あたり12のHTMLをダウンロードするなんて、普通にプログラムを書けば達成できる、なんでもない数字じゃないか」と思ってしまうけど、これだけの規模のクローラになると、効率的にWebを巡回するための順序づけや、既に巡回済みのURLへの再巡回のスケジューリングなど、諸々の複雑な処理が入るため、この数字はかなり優秀だとおもう。何を使ってるんだろう。やはり1からフルスクラッチで書いてるのかな。オープンソースなクローラだと、分散処理に対応したもの自体ほとんどないし。後でちょっと調べてみよう。

Post a comment to 'IBMのWebFountainプロジェクトでは、たった48台のXeonマシンでクローリングをしてるらしい'



"failure"でぐぐるとブッシュ大統領のプロフィールがトップに表示される件

Posted at 7:36 in . | 0 Trackbacks, 7 Comments

failure.jpg

 

 あっはっは。面白い。

 ちなみに、"failure"には「失敗」という意味の他に、「落第者」「怠慢」などといった意味もあります。

 

failure - Google Search
http://www.google.com/search?hl=en&q;=failure&btnG;=Google+Search

Post a comment to '"failure"でぐぐるとブッシュ大統領のプロフィールがトップに表示される件'



googleの学生向けプロモーションページが公開された件

Posted at 7:25 in . | 0 Trackbacks, 5 Comments

 google先生が学生向けのプロモーション用に作ったWebページが、昨日くらいに公開されたらしいです。Gmail、Google Talk、Google Maps、SMS、Google Toolbar、 Google Scholar、Picasaをまとめて、「College life, powered by Google」っていうキャッチコピーを付けています。

 こういうプロモーションのやりかたは、今までのgoogleからすると違和感を感じるところがあります。こういう、複数のサービスをまとめてパッケージングして、ターゲットを絞って、「googleのサービスを使えば、あなたのキャンパスライフはバラ色!」みたいなメッセージを売り込むというやり方は、どうもgoogleらしくないように思えます。こういうのはMicrosoftあたりの得意なやり方でしょう。これからはgoogleもこうやって自社のサービスをアピールしていくようになるのかしら。

 

College life, powered by Google
http://services.google.com/university/

Post a comment to 'googleの学生向けプロモーションページが公開された件'



9 15, 2005

DELL祭り、再び。

Posted at 21:04 in . | 0 Trackbacks, 0 Comments

PowerEdge SC430 SATA構成 <W7 300台限定 CPU&HDD;アップグレードパッケージ>
http://jpstore.dell.com/store/newstore/soho/masterNormal.asp?iConfigID=1&iSegID;=2&c;_SegmName=soho&c;_ConfigType=Normal&BrandId;=13390&FamilyId;=12

 

クーポン 「DOC-2994-YLDCJT-M-0」で19,029円になる(配送料や消費税まで入れると約23000円)。

こんなんで儲かるのかな。不思議だ。

Post a comment to 'DELL祭り、再び。'



9 13, 2005

『インターネットマガジン』今月号の松岡正剛のインタビューがすごい

Posted at 7:30 in . | 0 Trackbacks, 19 Comments

 『インターネットマガジン』今月号に松岡正剛のインタビューが載っていて、その中で情報検索について触れた部分があるのですが、これが非常にすばらしい。何ですかね、どうしてこのおっさんは60をもう越えているというのに理科系の研究者というわけでもないのに情報検索という若々しい技術分野に対してこれだけ鋭い言葉を吐けるんでしょうか。とっても不思議です。編集ということをずっと突き詰めてきた人が、その切り口から発言しているからでしょうか。それにしても氏の発言には、いま情報検索の分野で仕事をしている研究者・技術者たちの問題意識の根底に通ずるものが含まれているように思われます。いや、面白いな。基本的に文化系にバックグラウンドを持っているんだと思うんだけどな、この人。仏文科卒だし。でもGETAとか知ってるからなあ。どうして知ってるんだろ。まあいいや。氏のインタビューの中から、もっとも惹かれた部分を勝手に引用して御紹介します。ちょっと長いけど。読んでみて「これは!」と思ったら、本屋に出掛けて『インターネットマガジン』今月号を立ち読みするなり買うなりしてくださいな。

 

 結論からいえば、編集なき検索は検索ではないと思っています。編集検索にならなければだめです。検索と編集がどう折り合いを付けるかというと、技術開発やアルゴリズムでやっていく場合と、ビジュアライゼーションだけで、インタフェースを面白くしたり編集的な感覚が出来たり、非常に素早い物になったりする場合があると思います。

 一般に、編集というと手間を掛けているという印象があるようだけれど、僕がいってるエディティングは違います。たとえば、突然「ニューヨークに行きました?」といわれたとき、その瞬間にニューヨークのあれこれが頭の中に浮かびますね。「ええ、ちょっと住んでたこともあります」「どちらに住まれていたんですか」といったやりとりのうちに、それまでまったくニューヨークというボタンは開いていなかったのに、瞬間的にスポットライトが当たって次の文脈を想定するようになります。3つ4つの質問を交わした瞬間から、記憶データベースの側も編集の方へ起動を始めているし、自分の意志も探りたいものに対しての編集検索の起動を始めています。両側で同時に何かが始まっているときに、編集と編集がかけ算になっているというのが僕の理想で、人間はそうしています。

 現在の検索では、これがばらばらに提供されている。まず、たくさんのデータを格納したアーカイブを作ってそこにエンジンを付け、ピンポイントで高速にマッチングをする。マッチング速度を上げるために、レイヤーを付けたりツリーライクにしたりして、データベース側に検索しやすい工夫をする。しかしブラウザ側では、ソフトアイで俯瞰してそれから急激にフォーカスを絞るようなことは出来ていません。探索機はいつもピンポイントの穿孔性を持っていて、アーカイブ側に色々な構造で作ることでうまく入ったように見せかけています。そうではなく、探索機もアーカイブも検索機能が半分編集的になっていって、これが紙合わさって独自の発見ができるようになることが理想です。一方だけを完成させないで、両方で半分ずつ持ち寄らせて出会うことが、ヒューリスティックであり、人間の感動とか創造性に近いものだろうと思っています。

 

 いくらパターンマッチングが高度に出来るようになっても、人間的な検索をした感じにはならないでしょう。なぜなら、我々は思い違いとか、期待しないで行って予期せぬものに出会うとか、そういうものが混じって日常生活の検索をしているわけです。パターンマッチングは絶対に必要だけれど、高度になればなるほど、人間の感情とか間違いの余地を無くしていくので、シチュエーショナルなコンテキストを失っていくのです。だから、それ以外の何かを入れておかなければいけないと思います。パターンマッチングでメインの検索目標がピックアップされた周りに、夾雑物としてのサブな情報を残すようなことが出来れば可能かも知れません。

Post a comment to '『インターネットマガジン』今月号の松岡正剛のインタビューがすごい'



9 12, 2005

ページランク6のページからのリンクあげます

Posted at 17:15 in . | 2 Trackbacks, 42 Comments

pagernk.PNG

 

 昨日気付いたんだけど、はてブの僕のページ((http://b.hatena.ne.jp/ryoju/)のページランク(PR)が6になってる。原因はよく分からない。僕は別に、たとえばid:umedamochio氏のような人気のあるブックマーカーというわけではないのだけど。そもそも主に使っているソーシャルブックマークはdel.icio.usで、はてブはとりあえず作っただけでほとんど放置している。はてブのトップページにある「人気ブックマーク」の欄に入っているページをいくつか見てみるが、PRはどれも2~4というところだ。どうして僕のページがPR6になってるんだろう。

 ちなみに、PR6というのはそう簡単には得られない数字で、僕は今までいくつかのWebサイトを作ったけど、PR6なんて貰ったことがない。

 何はともあれ、折角のPR6なので、これは是非みなさまにお裾分けをしたいと思う。「PR6だってコノヤロウ、さっそく俺様のページをリンクしてくれYO!」という貴方は、このエントリのコメント欄に、リンクしてほしいURLをばしばし書き込んでください。ばしばしブックマークしますんで。ただし公序良俗に反するページはお断りさせていただくかもしれませんのでご了承を。どうぞよろしくお願い申し上げます :-)

 

 ……で、一応書いておくお断りその1。googleツールバーに表示されるPRは、時期的に数ヶ月程度前のものであると言われています。ですから、ツールバーの表示ではPR6になっていても、実際には既にそれ以下の数字に落ちている可能性が高いです。

 お断りその2。PRはgoogleの使っているランキング手法の一つに過ぎず、PRが上がったからといって、検索結果で上位に表示されるようになるとは限りません。


追記(2005/09/13)

 『あの頃のように…』さんからトラックバックを頂いたのだけど、素晴らしく面白い考察が書かれていたので引用して紹介させていただきます。

という訳で原因を調べてみたのですが、http://b.hatena.ne.jp/ryoju/をGoogle検索 し、更にリンクしているページの検索を試みようと思ったところ、なぜかhttp://www.google.co.jp/search?q=link:QED3HgloJB4J:b.hatena.ne.jp/ryoju/となる筈のところがhttp://www.google.co.jp/search?q=link:QED3HgloJB4J:b.hatena.ne.jp/となっていて最後のID(ディレクトリ)部分が抜け落ちていました。つまりGoogleは被リンク数がそのランクを決めるための一つの要因になっている訳ですが、ryojuのブックマーク の被リンク数が、はてなブックマーク の被リンク数と同様に扱われてしまっているようです。ですから はてなブックマーク のページランク6というのがそのまま ryojuのブックマーク に反映してしまっているようですね。ではなぜryoju/が抜け落ちているのか、http://www.google.co.jp/search?q=link%3Ahttp%3A%2F%2Fb.hatena.ne.jp%2Fryoju%2Fと直接アドレスに加えて検索してみても得られる結果が変わらないのかはわかりません。何か文字列が原因なのかと、似たような名前で 検索して見ました が再現できませんでした。

 ……とすると、googleのバグ、ということになるんでしょうか。

Post a comment to 'ページランク6のページからのリンクあげます'



9 11, 2005

MSNがもうすぐAPIを公開するらしいよ!

Posted at 3:41 in . | 0 Trackbacks, 5 Comments

New MSN APIs To Be Offered
http://blog.searchenginewatch.com/blog/050909-072415

 

 上の記事によると、MSNは
  ・MSN Search
  ・MSN Virtual Earth
  ・MSN Messenger
  ・MapPoint
の4製品について、もうじき開発者向けのAPIを公開するらしいです。わーい。

 個人的にはMSN Messenger向けAPIが気になるところです。上の記事を読む限りでは、プロトコル等の仕様や、メッセージ中継サーバを公開するというものではなく、MSN Messengerに機能を追加するためのプラグインの仕様と、そのためのライブラリを公開する、というものだと思われます。MSN Messengerは日本国内でも圧倒的なシェアを持つインスタントメッセンジャですから、その膨大なユーザを対象に、自分の作ったプラグインを公開できるのだとしたら、とても楽しいことになりそうな気がします。楽しみです。

 MSN SearchのAPIにも注目したいところ。googleやyahooのAPIは使用回数に制限があり、アプリケーションによっては足かせになります。使用回数に制限を設定しないか、先の2つに比べて条件を緩くしてくれるなら、多くの開発者にとって魅力的なものになるかも知れません。

 詳細は下のサイトで公開されるそうなので、geekでhackerな皆様におかれましては、チェックを怠りなく :-)

 

MSN Developer Center...Coming September 13th
http://msdn.microsoft.com/msn/

 

---追記(2005/09/11)

 使用回数の制限だけど、「MSN APIは一日に100,000件まで行けるらしい」という掲示板の書き込みを見た。オフィシャルなリリースでは無いので噂レベルだけど、もしそうだとしたらGoogle APIの100倍だ!

Post a comment to 'MSNがもうすぐAPIを公開するらしいよ!'



The Magic of 150 (@CommonSenseAdvice)

Posted at 3:18 in . | 0 Trackbacks, 16 Comments
Your brain is hard wired to pay attention to about 150 people. Try to have a relationship with any more than that, and your life will turn to pure crap.

試訳:
あなたの脳味噌はね、だいたい150人くらいの相手に注意を払うので精一杯なの。もしそれ以上の人数と人間関係を結ぼうと思ったら、あなたの人生はただのがらくたになっちゃうよ。

 

という書き出しで始まる一節。ここから始まって、"150人"ってのが、組織が上手く回るかどうかの境界線なんだよって結論に向かっていきます。面白いです。

The Magic of 150 (@CommonSenseAdvice)
http://www.commonsenseadvice.com/human_cortex_dunbar.html

Post a comment to 'The Magic of 150 (@CommonSenseAdvice)'



9 6, 2005

もぶろげっとAPIのご紹介

Posted at 19:34 in . | 0 Trackbacks, 12 Comments

「もぶろげっとAPI」とは

 画像付きblog検索エンジン「もぶろげっと」では、少し前から開発者向けのAPI「もぶろげっとAPI」を公開しています。APIはREST型のWebサービスとして提供されます。もぶろげっとAPIを利用することで、もぶろげっとから検索結果やサムネイル画像などを取得し、あなたのアプリケーションに取り入れることができます。

もぶろげっとAPI
http://api.mobloget.jp/

もぶろげっと
http://mobloget.jp/

 

もぶろげっとAPIで取得できるデータ

 もぶろげっとAPIを使うことによって、もぶろげっとから以下のようなデータを取得することが出来ます。

 1. もぶろげっとの検索結果

 もぶろげっとの検索結果を、RSS形式、TSV形式(タブ切りテキスト)のいずれかで取得することができます。

 例:キーワード"something"でRSSを取得
 例:キーワード"something"でTSVを取得

2. blog記事に含まれる画像のサムネイル

 blog記事に含まれる画像のサムネイル(縮小画像)を取得できます。

 例:http://blog.goo.ne.jp/shigyoh-t98/e/642c124e7ef8889257f2a5ae45d97e74に含まれる1つ目の画像のサムネイルを取得

 3. blog記事に含まれる画像のメタデータ

 もぶろげっとでは、blog記事に含まれる各画像について、XML形式のメタデータを作成しています。このメタデータを取得することが出来ます。

 メタデータの例を下に示します。

<?xml version="1.0" encoding="utf-8" ?>

<image>
  <add key="height" value="240" />
  <add key="post" value=" 長野にあるJR最高地点の線路 駅の名前はなんだっけな。。。 コメント ( 0 ) | Trackback ( 0 ) 前のペー" />
  <add key="pre" value="写真日和:JR最高地点 JR最高地点 写真 by rakabu / 2005-02-27 13:43:15 " />
  <add key="type" value="jpg" />
  <add key="url" value="http://blogimg.goo.ne.jp/user_image/0b/b9/
2098275773e59d55f6895ca745a5b83c.jpg" />
  <add key="width" value="159" />
</image>

 imageタグの下にaddタグで項目名とその値を追加しています。また、項目ごとの内容は、以下のようになっています。

type元画像の形式。jpg、gifなど。
width元画像の横幅。単位はピクセル。
height元画像の縦幅。同上。
pre元画像の前方のテキスト
post元画像の後方のテキスト
alt元画像に付されたalt属性のテキスト
url元画像のURL。

 メタデータを援用することによって、より高度な検索機能をつくることが可能になるかもしれません。

例:http://blog.goo.ne.jp/2smoking2/e/4a55128c83f09b9580524607f3d9e84bに含まれる1つ目の画像のメタデータを取得

 

もぶろげっとAPIを使うには

 もぶろげっとを使うには、ユーザ登録が必要です。下のページから登録してください。

 もぶろげっとAPI 開発者登録ページ

 

サンプルアプリケーション

 もぶろげっとAPIの使用例として、簡単なアプリケーションを作ってみました。

moblogetapi0.PNG

moblogetapi1.PNG

 キーワードを入力すると、そのキーワードからblog画像を検索し、サムネイルを並べて提示します。サムネイルを選択すると、元画像を表示したり、ブラウザを立ち上げて元のblog記事にアクセスしたりできます。

 もぶろげっとAPIを使えば、こんな感じの素敵アプリが作り放題! どうでしょうか、あなたも何かしら作ってみては。

 サンプルアプリケーションは下のURLからダウンロードできます。C#で書かれたソースコードもアーカイブに含めてあります。再利用はご随意に。

サンプルアプリケーション(ソースコード付き)
http://blog.windy.ac/archives/TestApplicationForMoblogetAPI_101.lzh

Post a comment to 'もぶろげっとAPIのご紹介'



9 5, 2005

アフィリエイト収入を目的としたスパムblogが急増してる件

Posted at 20:21 in . | 4 Trackbacks, 14 Comments

 スパム行為を目的として、プログラムによって自動的に作成されるblogを「スパムblog」などと言います。最近アホほど増えてみんなが迷惑しています。このblogでも以前ネタにしたことがあります。

 →fake blogs: spam行為のために機械的に作成されるblog


 

 で。

 通常、スパムblogは、リンクを集めることによって、対象URLを検索エンジンで上位に表示させることを目的として作られます。ところが、最近になって、スパムblogの中にアフィリエイト収入を目的としたものが見られるようになっています。僕はblog検索にライブドアの「未来検索」を使っているんですが、ここ一ヶ月くらいで、検索結果の中にかなりの割合でこの手のスパムblogが混じるようになったと感じています。

 目論見としては、

 1. 大量にblogを作る
 2. 様々なキーワードで、大量にエントリを投稿する
   エントリにはアフィリエイトのバナー広告を貼っておく
 3. アクセスを得る(おそらく、主に検索エンジンから)
 4. アクセスした閲覧者の一定割合がバナー広告をクリック
 5. アフィリエイト収入を得る。うまー。

というところでしょう。

 4. のところがちょい疑問で、広告をクリックするユーザが果たしてどれだけ居るのかと思いますが、仕込む側からすれば、最初にプログラムを作る手間があるだけだし、そのプログラムにしても、その辺の学生でも簡単に作れる程度のものなので、「駄目元でやってみるか」って感じなんでしょうか。

 実際に「アフィリエイト収入を目的としたスパムblog」の例を示すと、たとえば下のようなものがそうです。

http://set-482good.seesaa.net/
http://feapalw.seesaa.net/
http://inju-314amri.seesaa.net/

 タイトルの付け方など、全体的に定型的で、人が書いたものではないというのが直ぐに分かります。

 今のところ専らseesaa blogを使っているようなので、seesaa blogにはこのことをメールで伝えておこうと思います。自社のサービスがこういう使い方をされるのは、seesaa blogとしても本意ではないと思うので。もうとっくに認識してるかも知れないけど。

Post a comment to 'アフィリエイト収入を目的としたスパムblogが急増してる件'



9 1, 2005

SBCによるAT&T;の買収から何を学ぶか (@InfoComアイ)

Posted at 17:33 in . | 0 Trackbacks, 19 Comments

SBCによるAT&T;の買収から何を学ぶか (@InfoComアイ)
http://www.icr.co.jp/newsletter/eye/2005/e2005003.html

 

 SBC(アメリカの地域通信会社)によるAT&T;(同長距離通信会社)の買収について書かれた記事。ちょう面白い。

 かつて100万人の従業員を抱えアメリカの通信業界に栄華を誇ったAT&T;が、たったの160億ドルで買収されるに至るまでの軌跡が興味深い。「通信とコンピュータの融合」を目指して打った策が、ことごとく裏目に出て業績を落としていく様は感動的。

Post a comment to 'SBCによるAT&T;の買収から何を学ぶか (@InfoComアイ)'