Über OVHcloud AI Endpoints
OVHcloud AI Endpoints ist die serverlose Inferenz-API des französischen Cloud-Anbieters OVHcloud mit Hauptsitz in Roubaix. Sie wurde im April 2025 eingeführt und ermöglicht Entwicklern, 40+ Open-Weight-Modelle (Llama, Qwen, DeepSeek und weitere) für Chat, Sprachverarbeitung, Dokumenten- und Bildanalyse aufzurufen, ohne GPUs oder ML-Stacks zu verwalten, und enthält eine Sandbox zum Testen vor der Skalierung. Die Modelle werden aus dem OVHcloud-Rechenzentrum Gravelines in Nordfrankreich unter EU-Jurisdiktion bereitgestellt und sind vor außereuropäischen Regulierungen geschützt. Die Abrechnung erfolgt pay-as-you-go pro Million Token je Modell, verfügbar in Europa, Kanada und APAC.

Replicate
Weights & Biases
RunPod