楽天テクノロジーカンファレンス2010続き

基調講演のあと「CassandraとHadoopによるNoSQL協奏曲」にも参加したので，自分的に重要そうと思ったこと
をメモっておく．

よってチューニングは，あんまり気にしなくてもOK．コミットログに記録してから，非同期でSStableに保存されるから．
メモリに余裕があれば，多めに確保しておくと吉．

キーのキャッシュを多くすること．
Bloomfilterを使っているので，データが格納されているノードを結構な確率で知ることができる．
原理は分からなかったので...勉強しよう．

一般的には3を使うことが多いそうな．

Cassandraとの連携機能もあるが，効果的な連携ができているとはいえない．現状は，HadoopからCassandraへの連携だけ．
0.7からCassandraからHadoopへの連携もできるかもしれない．

シンプルなクエリが大量に発生するところ．
もしくは，SPOFをなくして，運用負荷を軽減したいところ．

どのようなクエリでアクセスするか，クエリを先に考える．

そんなことすると遅くなるんじゃ?と心配になるが，そもそも書き込みが速いので問題ない．

複数のカラムをくっつける．もしくはハッシュにしてキーにする．
ディスクは消費するけど，安いからいいじゃん，と割り切る．

当日は半分で打ち切りになってしまいました．導入部がかなり丁寧だったので，仕方ないでしょう．
続きは別の機会で．