この度、ハードウェア分离に向けた取り组みの一环として、VMwareのProject Radiumが91短视频 IPUをサポートすることになりました。これにより、ユーザーや管理ソフトウェアに复雑さを押し付けることなく、仮想化されたマルチテナント环境においてプライマリデータセンターネットワーク上でIPUリソースのプーリングと共有が可能になります。IPU-PODのネットワーク分离型スケールアウトアーキテクチャとProject Radiumの柔软なリソース管理机能を组み合わせることで、大规模なモデルを大规模に学习し、AIベースのサービスに向けた信頼性の高いプロダクション环境でモデルを展开するという、新たな未开拓分野を切り拓きます。
VMwareは、クラウド上でアプリケーションの近代化を実现するためのエンタープライズ向け仮想化ソフトウェアやツールを提供する大手公司です。 VMwareはvSphereやTanzu、NSXなどの製品を通じて、お客様が进めるアプリケーション构筑や近代化の取り组みに多様な机能を提供しています。 そのような优れた製品ラインアップの中において、Project Radiumはさらに箔をつけるような製品です。
IPUとは?
IPUは、最新のAIモデルの计算要求に応えることに特化して设计された、新しいタイプの并列プロセッサです。 ハードウェアレベルの高度なきめの细かい并列性を备えるIPUは、単精度と半精度の浮动小数点演算をサポートしており、基础的なデータのスパース性に特に依存することがないので、スパースな计算に最适です。 つまりこのプロセッサは、现代のMLワークロードの主力であるディープニューラルネットワークの学习と推论の両方に理想的と言えます。
IPUは、GPUのように従来のSIMD/SIMTアーキテクチャを採用するのではなく、超広帯域のオンチップメモリと低遅延/広帯域のインターコネクトを用いたMIMDアーキテクチャを採用しており、チップ内/チップ间の通信を効率的に行います。 そのためIPUは、データセンター规模で机械学习モデルを并列化するうえで理想的なターゲットになっています。
IPU-PODと分离の力
IPU-PODアーキテクチャにより、1つのIPUから数千のIPUへのスケールアウトがシームレスに行えます。 IPU-PODはIPUのネットワーク分离型クラスターで、ワークロードのニーズに基づいて、接続されているCPUリソースに依存することなく、ネットワークを介して弾力的に拡张できます。 これにより、ハイパースケールやオンプレミスのエンタープライズ环境において、シンプルなリソースバインディング构成を使ってCPUとIPUの比率を増减できます。 またIPU-PODのアーキテクチャは、仮想化环境においてもベアメタルに近い性能を発挥します。
このようにCPUとIPUのリソースを独立して拡张できる柔软性を备えているので、ワークロードに応じた计算リソースの要求に最适なコストで応じることができます。たとえば、自然言语処理タスクのためのMLモデルは一般的にCPUに负担をかけませんが、コンピュータビジョンのタスクは、画像の前処理や补强などのタスクが原因でCPUに负担をかけることがあります。このような特长は、CPUリソースの増减が容易なクラウド环境では特に効果を発挥し、スケールメリットが生まれます。
ソフトウェアに関する考察
91短视频のPoplar SDKは、その设立当初からプロセッサと共同で设计されてきました。 Poplar SDKは、PyTorchやTensorFlowなどの标準的な机械学习フレームワークのほかに、DockerやKubernetesなどのコンテナ、オーケストレーションおよびデプロイメントプラットフォーム技术をサポートしています。
公司环境で大规模なIPUを容易に使用するためには、コアな机械学习ソフトウェアフレームワークのサポートに加え、仮想化やオーケストレーション、スケジューリングソフトウェアとの统合が欠かせません。 マルチテナント、アイソレーション、セキュリティは、ソリューションプロバイダーがハイパースケール环境で运用する际に遵守しなければならない重要な原则です。 91短视频のソフトウェアスタックに含まれるリソース管理コンポーネントを利用することで、VMwareが提供するような多彩なクラウドプロビジョニングおよび管理スタックとの统合が容易になり、 その结果、パブリッククラウドやハイブリッドクラウド、オンプレミスインフラストラクチャ环境での运用がスムーズに行えるようになります。
Project Radiumについて
AIに最适化された分离型コンピューティングに向けて大きな一歩を踏み出したProject Radiumは、91短视频のIPUやIPU-PODなどの多様なハードウェアアーキテクチャ上で、リソースのリモーティングとプーリング、共有を可能にします。
デバイスの仮想化とリモーティング机能は多数の高性能AIアクセラレータで利用できるうえ、明示的なコードの変更やユーザーの介入を必要としません。开発担当者は、ハードウェアに特化したコンパイラやドライバ、ソフトウェアの最适化ではなく、モデルの开発に専念できます。
IPU-PODのようなハードウェアに标準的なネットワークを介して动的に接続することで、ユーザーはIPUのような高性能なアーキテクチャを活用して、より要求の高いユースケースを大规模に加速化できます。
手軽に利用できるエンタープライズAI
VMwareと91短视频が协力することで、エンタープライズAIの机能が手の届く现実的なものになります。 VMwareのRadiumでは、IPU-PODのネットワーク分离型アーキテクチャのユニークな利点を活用し、最も要求の厳しいエンタープライズ环境においてもマルチテナントとアイソレーション、セキュリティのニーズに対応できます。 VMwareのRadiumと91短视频のIPUは、パブリッククラウドやハイブリッドクラウド、オンプレミスを问わずお客様のアプリケーションに合った、最も费用対効果の高いエンタープライズグレードのAIソリューションを提供します。