1.9 NetCDFの制限
NetCDFデータモデルは名前付き属性を持つ名前付き配列変数の集合として系統だてられるデータに関しては広く応用が利きます。しかしながらこのモデルとソフトウェアの実装にはいくつかの重要な制限があります。この制限の一部はNetCDFが包含する要求の中で相反するものに対するトレードオフに内在するものであります。他の制限に関しては次のバージョンで対応していく予定です。
現在NetCDFで使用できる外部数値データ種は8、16、32ビットの整数、32もしくは64ビットの浮動小数点数に限られています。これらの限られたサイズはビットフィールドにデータを格納することに比べるとファイルスペースを無駄に使用する可能性があります。例えば、9ビットの数値の配列は16ビットの短い整数として格納しなければなりません。1、2ビット長の数値を8ビット長の値として格納するのは更に無駄が多くなります。
現行のNetCDFファイルフォーマットでは一つのNetCDFファイルに格納できるデータは2ギガバイトです。この制約は、ファイル内の位置を記録するために32ビットオフセットを使っているために生じています。
現行のモデルの制約の一つに各NetCDFファイルに対して無制限の(可変の)次元が一つしか使用できないことです。無制限の次元においては複数の変数を共有することが可能ですが、それらの変数は同時に発展しなければなりません。これによってNetCDFモデルでは同一ファイル内において複数の無制限次元を持つ変数を扱ったり異なる変数に複数の無制限次元を持たせることができません。つまり、NetCDFモデルは矩型でない変数(例えば不揃いな配列)の表現には不向きということになります。
データの完全な自己表現性にも限界があります。実際にデータを共有したり格納したりする際には必ずと言って良いほど既存の決まり事が存在します。NetCDFでは変数・次元・属性に意味のある名前、計算する際に使用可能な形態の単位、ファイル全体に関する属性値のテキスト文字列、簡単な座標系に関する情報を格納できます。しかし、より複雑なメタデータ(例えば一般的ではないグリッド上に正確に地球座標系のデータを投影したり衛星からの映像を正確に表現するために必要な情報等)に対応するためには規約を敷く必要がでてきます。
NetCDFデータモデルに適切な修正を加えることによりこれらの規約が不必要になったり、メタデータのいくつかの種類を統一的かつコンパクトな方法で表現できるようになるかもしれません。例えば、NetCDFデータモデルに明確な地球座標系を与えることによって複雑な地球座標系の規約を簡易化することは可能ですが、データモデルが複雑になるという弊害があります。ここで問題となるのはモデルの多様性と汎用性(多種多様なデータを扱える能力)との間に適切なトレードオフを見つけることです。ある特定の分野の研究者同士が共有する概念を表すためだけに作られたデータモデルは複数の分野でデータを共有したり統合したりすることには不向きかもしれません。
NetCDFデータモデルはツリー・ネスト配列・循環的なデータ等のネスト型配列構造をサポートしていません。その最も大きな理由は現行のFORTRANインターフェースによって任意のNetCDFファイルを書き込み読み取れなければならないからです。複雑な表現方法や規約によって、いくつかのネスト型構造を表現することは可能ですが、その結果、NetCDFの目標である自己記述的データではなくなってしまう可能性があります。
最後に、現行の実装ではNetCDFファイルへの同時アクセスは制限されています。一つのファイルは同時に複数の人が読み取ることができますが、書き込める人は一人に限られており、複数人による同時書き込みはサポートされていません。
Quadralay Corporation http://www.webworks.com Voice: (512) 719-3399 Fax: (512) 719-3606 sales@webworks.com |