第6回 「外部保存」のメリットとは?(#3 システムの更新/データ容量試算)
[Page 3/4]

今回のキーワード: bps、実効速度、ビット、バイト、ピクセル、増加率

イチロー:「たぶんだけど、半角英数字を表現するのに8ビットがちょうどいいからだと思う。8ビットということは、2の8乗なので、256の組み合わせを表現できるでしょ。アルファベットは26文字しかないし、小文字を入れても52文字だけ。これに0から9までの数字や、&や#などの記号を含めても8ビットあればだいたい表現できるんだよね。だから、8ビットという組み合わせを1バイトという単位で表すようになったんだと思う。」

くらら:「日本語はひらがな、カタカナ、漢字もあるから1バイトでは無理ですね。」

イチロー:「そうなんだ。中国語、日本語、韓国語は文字が多いので、2バイト使うんだ。2バイト=16ビットなので、2の16乗で65,536種類の文字を表現できるよ。文字の表現に2バイトを使う言語の代表として、各国の頭文字を取って、CJKと呼ぶことがあるよ。」

くらら: 「あれ?16ビットって、CT画像の奥行きと同じですね?」

イチロー: 「そうだよ。CT画像の1画素には、すべての日本語の文字を表現できるだけの情報量があるってことだね。」

くらら: 「すごーい!」

イチロー:「たしかに良く考えるとすごいことだね。さて、そのCT画像の容量計算に戻ろうか?16ビット=2バイトだから、1 画素あたりの大きさは2バイトだね。そして画素の数が縦横512 x 512だから、2 x 512 x 512 = 524,288バイトになるよね。CT画像1枚は、約524キロバイトになるんだ。」

くらら:「キロバイト?」

イチロー:「ごめんごめん。コンピュータでは大きな容量のデータを扱うので、桁が増えると人間にとってはわかりづらくなるで しょ?例えば、30,000,000,000バイトって書いてあっても、すぐにはピンと来ないよね?」

くらら:「えーと、いち、じゅう、ひゃく、せん、まん、、、、」

イチロー:「そう、そうなっちゃうから、千倍になるごとに区切って、呼び方を付けてるんだよ。1バイトの千倍がキロバイトで、KBと表すよ。さらにその千倍がメガバイト(MB)、さらに千倍されるごとに、ギガバイト(GB)、テラバイト(TB)、ペタバイト(PB)というように単位が変わるんだ。」



くらら:「じゃあ、さっきの大きな数字300億バイトは、30GBってことですね!」

イチロー:「そう!わかりやすいでしょ?」

くらら:「確かに。CT画像は524,288バイトなので、約524KB、または約0.5MBっていうことですね。ところで、1枚ごと じゃなくて、1検査ごとのデータ量を計算するには、どうすればいいんですか?」

イチロー:「1枚あたりの容量に、検査あたりの枚数をかければいいよ。CT1検査で300枚撮影したら、0.5MB x 300枚 = 150MBだね。」

くらら:「後は1日の検査数をかければ1日のデータ量が、年間の日数をかければ年間のデータ量が求められますね。」

イチロー:「そうだね。1年分のデータ量がわかれば、何年分のデータを入れるかで、必要なストレージ容量を試算することができるね。」

くらら:「簡単ですね!私にもすぐできそうだわ。」

イチロー: 「おっと待った!本当に大丈夫かな?ちゃんと『増加率』のことを考えてる?」
くらら: 「え?『増加率』ですか?」
イチロー: 「そうだよ。現在のデータ発生量をもとに、単 純計算してしまうと容量が足りなくなってしまう可能性があるんだ。データ発生量は基本的に徐々に増えているからね。」
くらら: 「具体的にはどの程度の『増加率』を見込めばいいんですか?」

データの『増加率』はどのくらい見込めばいいのか?