Googleが、収集したウェブページの文字データを利用して、1兆語にも及ぶ単語を収めた巨大なコーパス(コンピュータによる検索が可能な言語データの集まり)を作ったそうです。近く、Linguistic Data ConsortiumからDVD6枚組みにて配布される予定だそうです。 All Our N-gram are Belong to You. Official Google Research Blog. http://googleresearch.blogspot.com/2006/08/all-our-n-gram-are-belong-to-you.html コーパスとは. はてな. http://d.hatena.ne.jp/keyword/%A5%B3%A1%BC%A5%D1%A5%B9
「CNET Japan Innovation Conference 2005 Autumn」で、米Googleのインターナショナルプロダクトマネージャーを務めるアンジェラ・リー氏が「グローバルな情報交換のこれから」と題する講演を行なった。 講演の冒頭でリー氏は、「世界中の情報をできるだけ体系化して有効に使ってもらう」というGoogleの企業理念を紹介。これを達成するために、Web検索やデスクトップ検索など数多くのプロダクトを開発してきたことを挙げた。しかし、「Googleの総従業員は5,000名に上るが、情報が作成されるスピードは速すぎる力不足を感じる」という。Googleのミッションを実現するには、ユーザーと一緒にプロダクトを作りあげることが重要として、「ベータサービス」「ボランティア」「APIの公開」「オープンソースプロジェクト」という4つのキーワードを挙げた。 ● 「BETA」はユー
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く