DoiT Cloud Intelligence™DoiT Cloud Intelligence™
Integrations

Controla el costo de cada cluster de Ray

Visibilidad en vivo del consumo de Anyscale, del uso de clusters de Ray y de las oportunidades de right-sizing en cada workspace y nube.

Mockup del dashboard de gasto por job para Anyscale

La eligen los equipos que escalan workloads de IA y Ray en producción

Square
FanDuel
PlanetScale
CircleCI
Canva
Rippling
HelloFresh
Starburst

Conéctate en minutos

Un solo token de API. Visibilidad total de tus clusters de Ray.

Conecta tu organización de Anyscale con un token de API de solo lectura. DoiT ingiere automáticamente las métricas de consumo, el uso de clusters y el gasto de nube subyacente en AWS o GCP, sin agentes ni cambios de código en tus jobs de Ray. Los reportes unificados están listos a las pocas horas de conectarte.

Ilustración de la integración con Anyscale

Lo que obtienes

Diseñado para la realidad de correr Ray sobre Anyscale

Lo que realmente nos piden los líderes de FinOps y de plataformas de ML cuando conectan su organización de Anyscale.

Reportes de consumo unificados

Reportes de consumo unificados

Segmenta el gasto de Anyscale por workspace, proyecto, cluster o equipo, junto con los costos de nube subyacentes.

Anomalías en tiempo real

Anomalías en tiempo real

Recibe alertas en minutos ante jobs de Ray descontrolados y picos de gasto en GPU.

Right-sizing de clusters

Right-sizing de clusters

Detecta head nodes y worker nodes sobredimensionados, con recomendaciones accionables de CPU, GPU y memoria.

Detección de clusters ociosos

Detección de clusters ociosos

Identifica clusters de Ray que siguieron corriendo tras finalizar los jobs y recupera ese gasto.

Visibilidad de GPU y aceleradores

Visibilidad de GPU y aceleradores

Ordena el uso de GPU, CPU y xPU en workloads de entrenamiento, tuning y serving que suelen quedar ocultos en las facturas agregadas.

Gobernanza y presupuestos

Gobernanza y presupuestos

Define presupuestos por equipo de ML o proyecto y detecta desvíos antes del siguiente entrenamiento.

El dashboard de uso de Anyscale te muestra lo que consumiste. Cloud Intelligence™ te ayuda a accionar sobre ello.

Más allá del dashboard de uso de Anyscale

  • Consolidación multicloud

    Vistas consolidadas del gasto de Anyscale sobre AWS, GCP o Kubernetes, con drilldown a cualquier cluster.

  • Alertas de anomalías en tiempo real

    Detección con machine learning a nivel de workspace, cluster y job, con alertas en Slack o por correo.

  • Planificación de commitments de GPU

    Modela Savings Plans, CUDs y reservas frente al uso real de Ray antes de comprometer un solo dólar.

  • Higiene de proyectos y asignaciones

    Detecta workloads de Ray sin etiquetar, aplica reglas de asignación y reparte los costos compartidos como finanzas lo espera.

  • Asignación de costos en Kubernetes

    Desglosa el gasto de Anyscale sobre Kubernetes por namespace, workload y label sin exporters adicionales.

  • Forward Deployed Engineers

    Arquitectos de nube de primer nivel que trabajan como una extensión de tu equipo para implementar las optimizaciones.


Las empresas de alto crecimiento operan sobre DoiT Cloud Intelligence™

21%

Ahorro promedio en los primeros 90 días

28 días

Tiempo promedio de implementación

Oren Ashkenazy

El enfoque de DoiT en la confiabilidad, sumado a la flexibilidad del sistema, nos permite optimizar con total seguridad nuestros workloads de Amazon EKS sin que nuestros Engineers tengan que intervenir.

Oren Ashkenazy

Director of DevOps and Cloud at Fiverr

¿Todo listo para conectar tu organización de Anyscale?

Pon el gasto de tus clusters de Ray bajo la lupa.

Frequently asked
questions

¿Cómo obtengo mejor visibilidad de los costos de Anyscale entre workspaces y proyectos?

Conecta tu organización de Anyscale una sola vez. Cloud Intelligence™ ingiere los datos de consumo de cada workspace y proyecto, para que segmentes los costos por cluster, job, equipo o nube subyacente desde una sola vista, sin consolidaciones manuales.

¿Cuál es la mejor manera de integrar los datos de uso de Anyscale con Cloud Intelligence™?

Usa un token de API de solo lectura desde tu organización de Anyscale junto con tu conexión de facturación de AWS o GCP. DoiT se encarga de la ingesta, la normalización y el reporte con granularidad horaria. La mayoría de los equipos quedan operativos en un día.

¿Cómo puedo ver qué clusters o jobs de Ray concentran la mayor parte de mi gasto?

Los reportes de Cost & Usage te permiten ir desde el gasto total de Anyscale hasta un cluster, job o tipo de nodo específico. Filtra por workspace, proyecto, región o familia de instancia sin escribir SQL.

¿Cómo monitoreo anomalías de costo en Anyscale en tiempo real?

La detección de anomalías corre de forma continua en workspaces, clusters y jobs. Cuando algo se sale de lo normal, por ejemplo un entrenamiento consumiendo horas de GPU durante la noche, recibes una alerta en Slack o por correo con la causa probable.

¿Cómo reduzco la pérdida de clusters de Ray ociosos o sobredimensionados?

Cloud Intelligence™ identifica clusters por debajo de los objetivos de utilización, head nodes sobredimensionados para su workload y clusters que quedan inactivos al terminar los jobs. Cada recomendación muestra el ahorro estimado.

¿Cómo asigno el gasto de Anyscale a los equipos de ML y a cada modelo?

Mapea los workspaces, proyectos y tags de Anyscale a tus centros de costo internos. Los pools de GPU compartidos se pueden repartir con reglas de asignación, para que finanzas vea el costo por equipo y por modelo sin hojas de cálculo manuales.

¿En qué se diferencia Cloud Intelligence™ del dashboard de uso de Anyscale?

El dashboard de uso de Anyscale muestra estimaciones de consumo dentro de Anyscale. Cloud Intelligence™ lo conecta con el gasto real de nube y suma visibilidad multicloud, recomendaciones proactivas, detección de anomalías, gobernanza y acceso a Forward Deployed Engineers.

¿Mis datos están seguros al conectar mi organización de Anyscale?

Cloud Intelligence™ usa un token de API de solo lectura con permisos mínimos. Nunca modificamos clusters ni jobs sin tu aprobación, y la plataforma cuenta con certificación SOC 2 Type II.