À propos de OVHcloud AI Endpoints
OVHcloud AI Endpoints est l'API d'inférence serverless du fournisseur cloud français OVHcloud, basé à Roubaix. Lancée en avril 2025, elle permet aux développeurs d'appeler 40+ modèles open weights (Llama, Qwen, DeepSeek et autres) pour le chat, le traitement vocal, l'analyse de documents et d'images sans gérer GPU ni stack ML, avec un sandbox pour tester avant la mise à l'échelle. Les modèles sont servis depuis le datacenter OVHcloud de Gravelines (nord de la France) sous juridiction UE, à l'abri des régulations non européennes. Tarification pay-as-you-go par million de tokens et par modèle, disponible en Europe, au Canada et en APAC.
En bref
Modèle tarifaire
Paid
Essai gratuit
—
Open source
—
Auto-hébergeable
Non
API publique
Non
Cible
B2B
Taille d'entreprise
All
DPA disponible
Oui
Données stockées dans l'UE
Oui

Replicate
Weights & Biases
RunPod