オブジェクトストレージのオンプレミス活用
2011年時点で1.8ゼタバイトだった世界の総データ量は、当時の10年後予測で約40ゼタバイトになると予想されていました。しかし2020年のIDC調査では、59ゼタバイトになっていたことから予想を超えるスピードで増加しています。その中で、40%以上を占めているデータがエンターテインメント分野に関連するデータと言われており、ビデオ会議の増加やSNSやIoTの進化による写真データの増加などによるものと考えられています。また、そのようなデータの通信にかかわる日本国内の流通量についてもコロナ前と比べ2倍以上になったことも総務省の推計でわかっています。
この増加している動画や写真データは非構造化データと呼ばれ、本来分析には活用しにくいデータとされていましたが、AIやビッグデータ分析の流れを受け、非常に注目されるデータとなりました。
そして、この非構造化データの保管に優れているのがオブジェクトストレージです。聞きなじみはあまりないかもしれませんが、AWSのS3やGoogle Cloud Platform(GCP)のGoogle Cloud Storage(GCS)で利用されており、意外と身近なところで活用されています。
そこで、今回はオブジェクトストレージについてその特徴や活用方法についてご紹介していきたいと思います。
目次[非表示]
1.オブジェクトストレージの特徴
①ファイル保存方法
一般的なファイルストレージでは、階層化されたディレクトリにデータを保管して、ユーザーは保存場所を覚えてアクセスを行います。一方でオブジェクトストレージでは、データをオブジェクトという単位で固有のIDを付けて保管します。階層化構造は行わないため、各データはストレージにフラットに保管され、データへは固有のIDを使用してアクセスします。
②スケールアウトが容易
固有のIDを使用してアクセスをする特性から、ユーザーはデータの保存場所を意識する必要がなく、格納場所が変わってもアクセスが可能となります。そのため、日々大量のデータが更新されるようなパブリッククラウドでもストレージリソースを容易にスケールアウトすることができます。
2.オンプレミスでのオブジェクトストレージ活用~SWARM~
冒頭でもお伝えした通り、オブジェクトストレージはパブリッククラウドで活用されていますが、パブリッククラウドの利用は従量課金制であり、データダウンロードの際の通信費用も発生する点や各企業とパブリッククラウドが設定しているセキュリティ要件の違いなどから、パブリッククラウド利用が進まない企業もあると思います。
このような企業ではプライベートクラウドやハイブリッドクラウド環境を構築することで、費用の圧縮やセキュリティ要件を達成することができます。今回はそんな環境構築の1例としてdatacore社の「SWARM」というオンプレミス環境に配置するS3互換のオブジェクトストレージについてご紹介します。
3.SWARMについて
SWARMはS3互換のオブジェクトストレージであり、HTTPやS3プロトコルだけでなくNFSやSMBでのデータアクセスも可能なマルチプロトコルとなっています。
ストレージノードは最小3台から構成することができるため、スモールスタートが可能となっています。
管理用のノードは物理マシンだけでなく、仮想マシンとしても構築することが可能で、管理コンソールからはクラスターのディスク使用量・クラスターの状態を確認することができ、故障したハードウェアの特定やリアルタイムアラートなど管理の自動化をすることもできます。
4.SWARMの特徴
①高速検索
SWARMにはElasticSearchという検索エンジンが使用されています。この検索エンジンにより、保存されているオブジェクトの属性とメタデータに対して検索を行うことができるため、高速なデータアクセスを実現します。また、堅牢なHTTP RESTfulインターフェースからAmazon S3と直接接続してのデータへのアクセスも可能となっているので、ハイブリッド環境でも高いパフォーマンスを実現できます。
②堅牢性
オブジェクトストレージはイレイジャーコーディングという冗長性が採用されており、RAIDより高速にディスクの復旧ができますが、アクセスのための固有IDを付与するため小さなオブジェクトが大量にある場合は、非効率的な保管方法になってしまうという欠点もあります。
SWARMでは、イレイジャーコーディングとレプリケーションでの保護を選択でき、同一クラスター内でもポリシーによってデータ保護方式を変更することができます。これによってデータ耐久性を担保したままフットプリントの最適化を実現します。
データへのアクセスもAES256による暗号化が行われ、すべてのコンテンツへのアクションを監査のために追跡することが可能となっています。
5.オブジェクトストレージのユースケース
最後にオンプレミス環境のオブジェクトストレージユースケースについて触れておきます。
①分析ストレージ
ビッグデータ分析では、IoT機器が作り出す膨大な非構造化データを活用しています。パブリッククラウドでは、通信費用などにより想定以上のコストになる可能性がありますが、オンプレミス環境での利用ではそのような問題は発生しません。また、目的のデータへの高速アクセスや社内外から柔軟にアクセスできる点もオブジェクトストレージの利用を拡大させてる要因です。
②バックアップ&アーカイブ
大容量のデータ保管に適しているため、バックアップやアーカイブデータの長期保管用のストレージとして活用されます。SWARMではデータ量が増えれば増えるほど保存容量当たりのコストは低下するので、費用対効果の高いストレージとして活用することが出来ます。またS3と連携してS3へのバックアップデータ保管もSWARMのコンソール上から実施することが出来ます。
③高度なセキュリティ要件を保持する企業
例えば医療業界の様に個人情報やレントゲン情報など個人情報を多く保持する企業では、セキュリティの観点から外部でのデータ保管を禁止している企業があります。そのような場合にSWARMを活用することで、オンプレミスでの柔軟なセキュリティを担保しつつ、クラウドストレージと同等のデータへのアクセスを実現することが出来ます。
6.まとめ
今回はオブジェクトストレージについてその特徴やオンプレミス環境での活用方法をご紹介しました。さらなるIoT機器の発展で、機会が作成する膨大なデータ増加に対応するために最適のストレージではないかと思います。また近年パブリッククラウドのコスト肥大化などにより、オンプレ回帰といったキーワードが流行していますが、オンプレとクラウドのいいとこどりができるハイブリッドクラウド環境の構築にも最適なソリューションであると感じています。
ご興味ございましたら、ぜひご連絡ください。