本番環境でAI・Rayワークロードをスケールさせるチームに選ばれています
数分で連携完了
APIトークン1つで、Rayクラスターを丸ごと可視化
読み取り専用のAPIトークンでAnyscale組織を接続するだけ。消費メトリクス、クラスター稼働状況、AWS・GCPの基盤クラウド支出までDoiTが自動で取り込みます。エージェント導入もRayジョブ側のコード変更も不要。接続から数時間で統合レポートをご利用いただけます。

提供する価値
Anyscale上でRayを回す現場のために
Anyscale組織を接続したFinOpsやMLプラットフォームのリーダーから、実際に寄せられる要望にそのまま応えます。

統合された消費レポート
Anyscaleの支出を、ワークスペース・プロジェクト・クラスター・チーム単位で、基盤クラウドのコストと並べて分析できます。

リアルタイムな異常検知
暴走したRayジョブやGPU支出の急騰を、数分以内にアラートでお知らせします。

クラスターのライトサイジング
サイズが過剰なヘッドノード・ワーカーノードを洗い出し、CPU・GPU・メモリの具体的な見直し案を提示します。

アイドルクラスターの検出
ジョブ完了後も稼働したままのRayクラスターを特定し、無駄な支出を取り戻します。

GPU・アクセラレーターの可視化
請求書の総額に埋もれがちな学習・チューニング・推論のworkloadsごとに、GPU・CPU・xPUの使用状況を切り分けて把握できます。

ガバナンスと予算管理
MLチーム・プロジェクト単位で予算を設定し、次の学習ジョブが走る前に超過を検知します。
Anyscale usage dashboardでわかるのは「何を消費したか」。Cloud Intelligence™は、そこから「次に何をすべきか」まで導きます。
Anyscale usage dashboardの、その先へ
マルチクラウドの統合ビュー
AWS・GCP・Kubernetes上で動くAnyscale支出を一画面に集約し、任意のクラスターまでドリルダウンできます。
リアルタイムの異常アラート
ワークスペース・クラスター・ジョブの各軸で機械学習による検知を行い、Slackやメールに通知します。
GPU commitmentsの計画
実際のRay使用実績をもとに、Savings Plans・CUD・リザベーションをシミュレーションしてから購入判断できます。
プロジェクト管理と配賦の徹底
タグ未設定のRay workloadsを洗い出し、配賦ルールを適用。財務部門が求める粒度で共通コストを按分します。
Kubernetesのコスト配賦
Kubernetes上のAnyscale支出を、追加のエクスポーターなしでネームスペース・workload・ラベル単位に分解します。
Forward Deployed Engineers
お客様のチームの一員として動き、最適化を実装まで伴走するワールドクラスのクラウドアーキテクト。
成長中の企業はDoiT Cloud Intelligence™で走っている
最初の90日間の平均削減率
平均導入期間
“DoiTの信頼性へのこだわりとシステムの柔軟性のおかげで、自社Engineersの手を煩わせることなく、Amazon EKSのworkloadsを安全に最適化できています。”
Oren Ashkenazy
Director of DevOps and Cloud, Fiverr
Anyscale組織を接続する準備はできていますか?
Rayクラスターの支出を、徹底的に見える化しましょう。
Frequently asked
questions
ワークスペースやプロジェクトを横断してAnyscaleコストをより深く把握するには?
Anyscale組織を一度つなぐだけで、Cloud Intelligence™がすべてのワークスペース・プロジェクトの消費データを取り込みます。クラスター・ジョブ・チーム・基盤クラウドなど、あらゆる切り口でのコスト分析を単一ビューで実現し、手作業での集計は不要になります。
Anyscaleの使用データとCloud Intelligence™を連携させるベストな方法は?
Anyscale組織の読み取り専用APIトークンと、AWSまたはGCPの請求連携を組み合わせるだけです。データ取り込み・正規化・時間単位のレポート生成はすべてDoiT側で処理します。ほとんどのチームが1日以内に稼働を開始しています。
支出の大半を占めるRayクラスターやジョブを特定するには?
Cost & Usageレポートなら、Anyscale全体の支出から特定のクラスター・ジョブ・ノードタイプまで一気にドリルダウンできます。SQLを書かなくても、ワークスペース・プロジェクト・リージョン・インスタンスファミリーで自在にフィルタリング可能です。
Anyscaleのコスト異常をリアルタイムで監視するには?
異常検知はワークスペース・クラスター・ジョブの各軸で常時稼働しています。夜通しGPU時間を使い続ける学習ジョブなど、通常と異なる挙動を検知すると、想定原因とともにSlackまたはメールで通知します。
アイドル状態や過剰サイズのRayクラスターによる無駄を減らすには?
Cloud Intelligence™は、利用率が目標を下回るクラスター、workloadに対して過剰なヘッドノード、ジョブ完了後も稼働し続けているクラスターを検出します。各推奨には削減見込み額が添えられます。
AnyscaleのコストをMLチームやモデル単位に配賦するには?
Anyscaleのワークスペース・プロジェクト・タグを、社内のコストセンターにマッピングできます。共有GPUプールも配賦ルールで按分できるため、手作業のスプレッドシートに頼ることなく、チーム別・モデル別のコストを財務部門に提示できます。
Cloud Intelligence™はAnyscale usage dashboardと何が違いますか?
Anyscale usage dashboardが示すのは、Anyscale内部での消費量の見積もりです。Cloud Intelligence™はそれを実際のクラウド支出と結びつけ、マルチクラウドの可視化、先回りの改善提案、異常検知、ガバナンス、さらにはForward Deployed Engineersの支援までを一体で提供します。
Anyscale組織を接続したときのデータは安全ですか?
Cloud Intelligence™は最小権限の読み取り専用APIトークンを使用します。お客様の承認なしにクラスターやジョブを変更することはなく、プラットフォームはSOC 2 Type II認証を取得しています。
