カテゴリ | Cmmi | Life | Sumibi | Webリーダー | tDiary | オープンソース | コンピュータ | デザインポリシー | 音楽 | 携帯 | 言語 | 社会問題 | 創作心理 | 日本語入力 | 本
いくら無料サイトでも、頻繁に止まっているサイトでは安心して使えないという評価になってしまいます。
そろそろ、そのようなレベルを脱却したいということで、Sumibi.orgサイトのハードウェアを二重化しました。
二重化というのは、1台目のハードウェアが故障しても2台目のハードウェアが自動的に引継ぎ、サイトダウンを防ぐ仕掛けです。
この自動引継ぎする仕組みをフェイルオーバーといいます。
今回は、vrrpdではなくucarpというソフトウェアを使用しました。Debianなら標準パッケージに入っているので設定は簡単です。(但し、同一の環境が2台あるのが前提です)
これまでの1台での運用に比べてサイトダウンがぐっと減るはずです。
また、運用側としては、スタンバイ中のマシンを使ってメンテナンスができるので心理的ストレスが減り、同時にミスが減るというメリットもあります。
Sumibi.orgのハードウェアがパワーアップした結果、瞬間的に発生する負荷に強くなりました。
下の画像を見ていただければわかる通りWeek 23(第23週)とWeek 24(第24週)の間の月曜日にアクセス集中しましたが、今までにない日本語変換処理性能が出ています。
(アンテナの様にグラフが飛び出ている所です。)
Week 22までは古いハードウェアだったので、このようなパフォーマンスは出ませんでしたが、Week 23からは新しいハードウェアになり、まだ余裕があります。
(新しいハードウェアはインフォテリア株式会社様より提供頂きました。本当にありがとうございます。)
今後はソフトウェアの処理内容を見なおし、演算量を減らして性能を上げる予定です。
0.6.0をリリースしました。(毎月14日なので石リリースです)
Linuxディストリビューション等にsumibi.elを採用していただく際は、本安定バージョンが相応しいと思います。
最近巷で流行っている、統計的機械翻訳の話題をブログや雑誌などで読むことが増えています。
どうも、統計的アプローチを使った翻訳エンジンでは対象言語のことをあまり知らなくても翻訳エンジンが作れてしまうようです。
なーんだ、だったらSumibiでもできるんじゃないかと思って、scim-pinyinやscim-hungleの辞書テーブルを見てみたのですが、最低限どれが単語を表わしているかがわからないと、形態素解析もできないことに気が付いて諦めました。
入力システムは、翻訳とは違って、最低限漢字の読みのテーブルが必要なんですよね。
それから形態素解析エンジンも必要ですね。
中国語とpinyinのサワリだけでも勉強してみようかな...
中国語や韓国語できるメンバーを募集するのが早いかな?