AWSストレージ概観
AWS で使えるローカルストレージと NFS ストレージを一通り試してみました。
GCP 編はこちら。
About
ベンチマークは fio コマンドで取得した。
機械学習のワークロードで扱う機会が多い、CSV のような小さめのテキストファイルとマルチメディアファイルを想定して 4k と 32m のデータで測定した。
AWS で使えるローカルストレージと NFS ストレージを一通り試してみました。
GCP 編はこちら。
ベンチマークは fio コマンドで取得した。
機械学習のワークロードで扱う機会が多い、CSV のような小さめのテキストファイルとマルチメディアファイルを想定して 4k と 32m のデータで測定した。
GCP で使えるローカルストレージと NFS ストレージを一通り試してみました。
AWS 編はこちら。
ベンチマークは fio コマンドで取得した。
機械学習のワークロードで扱う機会が多い、CSV のような小さめのテキストファイルとマルチメディアファイルを想定して 4k と 32m のデータで測定した。
普段、会社でやっている ML Ops 業務の振り返りを兼ねて最低限必要そうな Amazon VPC 構成用の Terraform Module を作りました。
そして Module には"最小構成"の機械学習環境を作るサンプルを同梱しています。
普段の仕事でやっている ML Ops 業務の振り返りを兼ねて最低限必要そうな VPC 構成用の Terraform Module for GCP です。
Module には"最小構成"の機械学習環境を作るサンプルを同梱しています。
私が所属しているDeNA AI システム部の部内勉強会で Docker と XaaS(ザース)の話をさせていただいたので資料を公開します。
XaaS(ザース)は IaaS, FaaS, SaaS などの総称です。
「Container Build Meetup」に参加してきました。
Container Build Meetup #2 - connpass
分刻みですね。
なお開始時点で「予定のタイトルでしゃべる人は 1 名」でした。
また順番の入れ替わりもあり、さすが皆さん普段からコンテナをビルドしているだけあって動きが軽量で柔軟ですね!
公式に以下の情報が出た。
Docker - Unauthorized access to Docker Hub database
会社の Slack で「Docker Hub、クラックされたって」と見かけて確認したらそんなメールが届いていた。
ここ何年か DeNA という会社で働かせていただいてます。
今月 4 月に異動したこともあり棚卸し的にやってきたことを振り返ってみました。
4 月からは「AI 本部」という組織が新設されすでにこちらで仕事をしています。
3 月末までは「システム本部」所属でした。
本業の傍ら会社の技術 Blog リニューアルに携わっており、概要を Advent Calendar で「DeNA Engineers’ Blog をリニューアルしている話」として書きました。
「DeNA Engineers’ Blog をリニューアルしている話」ではコンセプトや進め方を中心に書いたので、この記事でもう少しシステム面を書いておきます。
ついでに会社の引き継ぎ資料にしてしまおうという目論見があります。
最近、Mac などのローカルには極力 rbenv などをインストールせずにできる限り Docker コンテナ上に開発環境を作ろうとしています。
開発中はdocker-composeを使っているのですが、いろいろなリポジトリに似たような docker-compose.yml が増えてきたのでテンプレート代わりにまとめました。
リポジトリはこちら。
3/26 に開催された「Google Cloud Kubernetes Day」に当選したので参加してきました。
最前列でひたすらメモったので放出しておきます。
こんなプログラムでした。
このBlog用に作ったHugoテーマ「techlog-simple」をHugoのテーマサイトに載せていただきました。やったね 🎉
Techblog Simple is a Bootstrap-based blog theme for Hugo. Made by @mazgi.https://t.co/IZ4W1pSwnX
— GoHugo.io (@GoHugoIO) November 29, 2018
Hugo Theme Techlog Simple | Hugo Themes
載せてもらう方法はこの辺りをみてください。
sandbox 用の AWS アカウントと GCP プロジェクトを作ったついでにそれぞれの Web 管理画面をNativefierで専用アプリにした。
GCP プロジェクトは https://console.cloud.google.com/home/dashboard?project=YOUR_GCP_PROJECT_ID のように URL のクエリパラメタでタブごとに異なるプロジェクトを表示できるし、
AWS アカウントも switch role を使えば複数の AWS アカウント間を行き来できる。
自分用の ML 環境として Docker イメージを作っていたのだが、 FROM: nvidia/cuda:9.2-cudnn7-devel-ubuntu18.04 なので DockerHub で public にするのも憚られ、ECR/GCR に置くことにした。
ECR/GCR に置くついでに packer build だけで ECR と GCR に同じイメージが置かれてほしいと思ってやってみた。
tldr: Hugo 0.42 以降で Speaker Deck のスライドを貼り付けるときは Speaker Deck の embed code を使いましょう。
Hugo のバージョンを上げてこの blog の原稿を開いたらこんなエラーが発生してしまった。
この記事の Speaker Deck shortcode が問題あるらしい。
Terminal.app や SSH のような CUI で作業するときは tmux 使うと便利tmux 使うときはシェルを zsh にすると便利サーバーサイド開発をやってる人には今更な話ですけど最近何度かオススメする機会があったので記事を書くことにしました。
以下、私の使い方を説明しているだけで特に目新しい話はありません。
「PLAZMA Data Platform Day: TD Tech Talk 2018」というイベントにお招きいただいたので「2020 年代に向けた DeNA の分析基盤 」というお話しをさせていただきました。
補足とかは機会あったら書きたいです。
前回の記事に続いてマネージド Jupyter サービスAmazon SageMakerの Notebook インスタンスに EFS のボリュームを自動マウントする。
なおこの発言の真意ですが、Kaggle 社内ランク制度なるものができ部内に Kaggler な方が増える今日この頃、インフラ的な細かな作業に気持ちと時間を取られずにスコアを叩き出していただきたいという意図です。
SageMaker の Terminal すら開かずに使えてほしい。
おれは
kaggle masterに
sedとかmountとか
叩かせたくないんや!
Amazon SageMakerを使っていて Notebook インスタンスから以下を行いたくなったので構成を考えてみた。
AWS Machine Learning Blogに正解が書いてあった。
この Web サイト( https://mazgi.github.io/ )は専用の Hugo テーマで公開しているのだけど色々基本的なところが足りていなかったので直した。
Hugo テーマの場合、一覧ページのテンプレートは layouts/_default/list.html という PATH で作る。
なお TOP ページは layouts/index.html という PATH でテンプレートを作っておくとそちらが適用されるが、このサイトの場合は特に TOP ページだけに載せたいものがないので、TOP ページと一覧ページは同じテンプレートを使っている。
画像や音声を S3 にアップロードすると Lambda でいい感じに前処理をして SQS に通知くれるような仕組みを想定して作ってみる。
名前は仮に「media-processor」とした。
(が、今回はファイル名やファイルタイプを SQS に送るダミー機能まで)
AWS のマネージド Jupyter サービスである「Amazon SageMaker」を数十名規模で使う機会があったのでインフラ的に設定した内容などを書いておく。SageMaker で何をしたかなどはいずれちゃんとした情報が出ると思う。 出ました!
=> Amazon SageMaker ハンズオンレポート
タイトルの通り「AWS Key Management Service (AWS KMS) 」を使って暗号化した Amazon S3 バケットを s3fs で Ubuntu 16 上で mount した。
KMS については以下のドキュメントが詳しいが要は暗号化の際に煩雑な鍵の管理を AWS にお願いできる仕組み。
「Terraform で S3+CloudFront+SSL/TLS 証明書 w/ ACM を設定して Hugo で作った static な Web サイトを CircleCI で自動 deploy する」やつができた。
普通のいかにもHugoで作った Web サイトができた。
もう 2018 年なので手オペなどせず Infrastructure as Code で構築かつ CI でコンテンツ deploy です。
中身はまだない。
きっと酒とメシについての何かが書かれるのでしょう。