rsync に思うこと...

rsyncでバックアップして見たら非常に遅い。動いてるのかどうかわからないくらい遅くて気が狂いそうだ。orz

原因はいろいろあるとは思うがよく指摘されてるのはハッシュ値の計算に時間がかかることだ。これはしょうがないことでもあるがそもそもハッシュ値が必要なのはファイルのタイムスタンプの粒度や精度の問題だと思うのでそれをなんとかすれば良いはず。

と、口で言うのは簡単であるが...ひとつの解決策としては、ファイルのタイムスタンプの粒度や精度が足りないなら絶対に重複することがない更新時刻をファイル・ヘッダのどこかに格納すればいいのではないかと思う。

rsyncのハッシュ計算はファイル先頭のみ調べてみて同じなら一致していると判断すれば良い。と思ったが、そういう判断をしていいファイル形式かどうかを知る手段が必要になってくるので結局は無理か。(-_-;)

それはともかく、時刻を格納するための領域(ファイルヘッダ等)が確保できないファイルには対応できないがテキスト形式であってもコメントが書ける形式ならファイル先頭にテキストコメントとして時刻を追記しておけば良いだろう。

時刻を書いておくことで古いファイルシステムのタイムスタンプ問題や異なるファイルシステム間のタイムスタンプの非互換性などにも対処できるようになるので少しずつでもいいから時刻情報を含むファイル形式を全世界レベルで増やしていくべき。かな。

可能なら標準形式を決めた方が良いとは思うがバックアップ目的のみなら統一する必要もなくどんな形式でもOKだ。ちなみにシステム時刻の粒度が荒い場合は時刻の代わりにカウンターを使う方法もある。