GCPストレージ概観

GCP で使えるローカルストレージと NFS ストレージを一通り試してみました。
AWS 編はこちら

About

ベンチマークは fio コマンドで取得した。
機械学習のワークロードで扱う機会が多い、CSV のような小さめのテキストファイルとマルチメディアファイルを想定して 4k と 32m のデータで測定した。

なお、ストレージタイプごとの傾向をざっくりと知りたかったので性能を引き出すような設定や調整は行なっていない。
また以下の理由で IaaS のストレージを厳密に測定してもあまり意味はないと考えている。

  • IaaS のリソースはシェアされているので他のユーザー(テナント)の影響を受ける
  • 非公開な仕様が特に告知なく更新される(バス幅や各種ストレージの物理仕様など)

試したストレージは以下。
Local SSDは存在を忘れていて試していない。。

Results

以下の通り Terraform による IaC で provisioning した。
https://github.com/mazgi/terraform-google-simple-vpc/tree/v2019.06.1/examples/multiple-volumes

結果はこちら。
https://gist.github.com/mazgi/21f85139e50fbce8e508adc0c4985f4f

結果をテーブルにまとめた。

Persistent disks

SSD が思ったより早くない。
Standard(HDD)は個人的には使えるシチュエーションがかなり限られそう。。

typer/wrand/seqIOPS 4k,32mBW/s 4k,32m
PD (standard)rrand2053822KiB116MiB
PD (standard)wrand153726152KiB71.4MiB
PD (standard)rseq4907319.2MiB116MiB
PD (standard)wseq250329.78MiB71.5MiB
PD (ssd)rrand3521713.8MiB242MiB
PD (ssd)wrand2666210.4MiB71.2MiB
PD (ssd)rseq4579717.9MiB242MiB
PD (ssd)wseq2808210.0MiB71.5MiB

Cloud Filestore

おかしい、ローカルストレージ(PD)より明らかに早い。
キャッシュか何かの設定を誤ったのだろうか、あるいはネットワークの先に何か得体の知れないものが存在している?

typer/wrand/seqIOPS 4k,32mBW/s 4k,32m
Filestore (standard)rrand15.9k4262.1MiB1362MiB
Filestore (standard)wrand91833673KiB107MiB
Filestore (standard)rseq16.2k4263.4MiB1352MiB
Filestore (standard)wseq93153725KiB170MiB
Filestore (premium)rrand14.1k4954.9MiB1575MiB
Filestore (premium)wrand82053283KiB167MiB
Filestore (premium)rseq13.6k5753.1MiB1843MiB
Filestore (premium)wseq84163366KiB199MiB

That’s all

雑に試したら頭抱える結果になったので改めてちゃんと測ります。

今回のベンチマークは「インターネットや AI を活用し、世の中にデライトを届けていく」dena.aiの提供で実行させていただきました。感謝 🙏