डिजीओ इंफ्रास्ट्रक्चर

एआई मॉडल और जीपीयू

आज ही प्रबंधित फ्रंटियर मॉडल पर एजेंटों को चलाएं - या जीपीयू क्षमता किराए पर लें, अपना स्वयं का वजन तैनात करें, और डिजीओ कार्यों को उसी कार्यक्षेत्र में निजी एंडपॉइंट पर रूट करें।

क्लाउड, जीपीटी, जेमिनी प्रति-एजेंट मॉडल चयन जीपीयू किराये और BYOM
प्रबंधित मॉडल

मॉडल आज डिजियो में उपलब्ध हैं

प्रति एजेंट एक डिफ़ॉल्ट मॉडल निर्दिष्ट करें या प्रति कार्य ओवरराइड करें। उपयोग को आपके प्लान बैलेंस से डिजीओ टोकन में मापा जाता है - वही वॉलेट, चाहे एजेंट सॉनेट, जीपीटी-4ओ, या जेमिनी फ्लैश कहता हो।

एंथ्रोपिक क्लाउड

  • Claude Opus 4.7 प्रमुख तर्क, लंबा संदर्भ, वास्तुकला और रणनीति कार्य।
  • Claude Opus 4.6 स्थिर, उच्च गुणवत्ता वाले विश्लेषण के लिए पिछली पीढ़ी का ओपस।
  • Claude Sonnet 4.6 दैनिक ड्राइवर-कोडिंग, लेखन और मल्टी-स्टेप एजेंट लूप।
  • Claude Sonnet 4.5 / 4 समर्थित कार्यभार पर त्वरित कैशिंग के साथ फास्ट सॉनेट टियर।
  • Claude Haiku 4.5 कम-विलंबता ड्राफ्ट, वर्गीकरण, और उच्च-मात्रा उपकार्य।

ओपनएआई

  • GPT-5.5 / GPT-5.4 / GPT-5.2 सामान्य और एजेंटिक कार्यभार के लिए नवीनतम GPT-5 परिवार।
  • GPT-4.1 & GPT-4o उत्पादन एजेंटों के लिए विश्वसनीय मल्टीमॉडल चैट और टूल का उपयोग।
  • GPT-4o mini सारांश और हल्के चरणों के लिए लागत-कुशल रूटिंग।
  • o3 / o3-pro / o3-mini / o4-mini गणित, योजना और सत्यापन के लिए तर्क-केंद्रित मॉडल।
  • GPT-5.3 Codex & Codex mini कोड जनरेशन, रिफैक्टर्स और रेपो-अवेयर एजेंट कौशल।

गूगल जेमिनी

  • Gemini 2.5 Pro लंबे संदर्भ अनुसंधान और संरचित निष्कर्षण।
  • Gemini 2.5 Flash प्रतिस्पर्धी टोकन दरों के साथ उच्च-थ्रूपुट एजेंट कदम।
  • Gemini 2.0 Flash पार्सिंग, टैगिंग और बैच कार्यों के लिए अल्ट्रा-फास्ट पास।

खुला एवं विशेषज्ञ एपीआई

  • DeepSeek Chat & Reasoner चैट और विचार-श्रृंखला शैली के कार्यों के लिए मजबूत मूल्य।
  • Mistral Large बहुभाषी एजेंट टीमों के लिए यूरोपीय-होस्टेड विकल्प।
  • Llama 3.3 70B एपीआई के माध्यम से ओपन-वेट क्लास मॉडल - निजी जीपीयू के साथ अच्छी तरह से जुड़ जाता है।
  • Grok 3 समाचार और सामाजिक निगरानी एजेंटों के लिए वास्तविक समय उन्मुख मॉडल।
  • Sonar Pro अनुसंधान एजेंटों के लिए खोज-आधारित उत्तर।
  • Command R+ RAG-अनुकूल एंटरप्राइज़ चैट और पुनर्प्राप्ति वर्कफ़्लो।

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

प्रयोग

एजेंट किसी मॉडल को कैसे चुनते हैं

समन्वयक कार्य प्रकार के आधार पर सॉनेट बनाम ओपस बनाम एक सस्ता फ़्लैश मॉडल की सिफारिश कर सकता है। पावर उपयोगकर्ता प्रति एजेंट भूमिका के लिए डिफ़ॉल्ट सेट करते हैं - सॉनेट पर शोध, ओपस पर अंतिम समीक्षा, हाइकु या जेमिनी फ्लैश पर बल्क टैगिंग।

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

जीपीयू किराया

जीपीयू किराए पर लें और अपने स्वयं के मॉडल चलाएं

एक फाइन-ट्यून, एक एयर-गैप्ड चेकपॉइंट, या पूर्वानुमानित अनुमान मूल्य निर्धारण की आवश्यकता है? अपने डिजीओ कार्यक्षेत्र में समर्पित जीपीयू क्षमता जोड़ें, अपने पसंदीदा सर्विंग स्टैक को स्थापित करें, और अपने निजी एंडपॉइंट पर पॉइंट एजेंटों को स्थापित करें।

समर्पित उदाहरण

प्रति घंटा या मासिक GPU नोड्स (A100, H100, L40S वर्ग) आपके किरायेदार से जुड़े हुए हैं - अन्य ग्राहकों से अलग।

आपका वज़न

सेफटेंसर, जीजीयूएफ अपलोड करें, या अपनी रजिस्ट्री से खींचें; लामा, मिस्ट्रल, क्वेन और कस्टम फ़ाइन-ट्यून्स चलाएँ।

मानक सेवा

वीएलएलएम, टीजीआई, ओलामा, या आपके द्वारा बनाए गए कंटेनर चित्र—डिजियो एजेंट ओपनएआई-संगत बेस यूआरएल को कॉल करते हैं।

वही आर्केस्ट्रा

ऐसा करने के लिए, टीम चैट, कौशल और सहयोग अपरिवर्तित है - केवल अनुमान बैकएंड आपका है।

हाइब्रिड रूटिंग

निजी जीपीयू को संवेदनशील कदम भेजें और एक वर्कफ़्लो में सार्वजनिक शोध के लिए क्लाउड या जीपीटी का उपयोग करें।

उद्यम नियंत्रण

विनियमित टीमों के लिए वीपीसी पियरिंग, स्टैटिक इग्रेस, ऑडिट लॉग और मॉडल अनुमति सूचियाँ।

अपना खुद का मॉडल लाओ

एक कस्टम मॉडल स्थापित करें और कनेक्ट करें

शून्य से लेकर आपके समापन बिंदु पर कॉल करने वाले एजेंटों तक का विशिष्ट सेटअप:

  1. रिजर्व जीपीयू

    वीआरएएम, क्षेत्र और अपटाइम चुनें (बर्स्ट बनाम ऑलवेज़-ऑन)। वज़न के लिए भंडारण उदाहरण के साथ भेजा जाता है या आपकी बाल्टी को माउंट करता है।

  2. ढेर तैनात करें

    इसमें एक सर्विंग इमेज या SSH प्रारंभ करें, CUDA ड्राइवर स्थापित करें और चेकपॉइंट लोड करें। स्वास्थ्य जांच से पुष्टि होती है कि मॉडल तैयार है।

  3. समापन बिंदु पंजीकृत करें

    कार्यक्षेत्र सेटिंग्स में आधार यूआरएल, एपीआई कुंजी और मॉडल आईडी जोड़ें। डिजीओ लाइव होने से पहले विलंबता और टोकन प्रारूप को मान्य करता है।

  4. एजेंटों को सौंपें

    चयनित एजेंटों के लिए डिफ़ॉल्ट के रूप में अपना निजी मॉडल चुनें; प्रबंधित क्लाउड/जीपीटी मॉडल साथ-साथ उपलब्ध रहते हैं।

GPU किराये का बिल डिजीओ प्लान सब्सक्रिप्शन से अलग से लिया जाता है। क्षमता नियोजन, एसएलए और मौजूदा अनुमान क्लस्टर से माइग्रेशन के लिए हमसे संपर्क करें।

अक्सर पूछे जाने वाले प्रश्न

मॉडल और जीपीयू प्रश्न

डिजीओ पर प्रबंधित एपीआई बनाम स्व-होस्टेड अनुमान चुनना।

क्या मुझे दो बार भुगतान करना होगा—प्लान प्लस एपीआई?

आपकी डिजीओ सदस्यता में बुनियादी ढांचे, एजेंट और डिजीओ टोकन शामिल हैं। प्रबंधित मॉडल उपयोग उस टोकन संतुलन को वास्तविक इनपुट/आउटपुट टोकन द्वारा डेबिट करता है। जीपीयू रेंटल आपके द्वारा नियंत्रित मशीनों के लिए एक ऐड-ऑन है।

क्या अलग-अलग एजेंट अलग-अलग मॉडल का उपयोग कर सकते हैं?

हाँ—प्रत्येक एजेंट का अपना डिफ़ॉल्ट हो सकता है। वैश्विक डिफ़ॉल्ट को बदले बिना कार्य और चैट एक बार के लिए ओवरराइड हो सकते हैं।

सॉनेट और ओपस में क्या अंतर है?

ओपस को कठिन तर्क और लंबी सुसंगत योजनाओं के लिए तैयार किया गया है; रोजमर्रा के एजेंट लूप के लिए सॉनेट तेज़ और सस्ता है। हाइकु और फ़्लैश-क्लास मॉडल वॉल्यूम उप-कार्यों के लिए सर्वोत्तम हैं।

क्या मैं केवल अपना मॉडल चला सकता हूं और क्लाउड एपीआई को ब्लॉक कर सकता हूं?

एंटरप्राइज़ कार्यस्थान आउटबाउंड मॉडल प्रदाताओं को प्रतिबंधित कर सकते हैं और सभी एजेंट ट्रैफ़िक को आपके GPU एंडपॉइंट पर रूट कर सकते हैं। अधिकांश टीमों के लिए हाइब्रिड मोड डिफ़ॉल्ट है।

कौन से GPU आकार उपलब्ध हैं?

पेशकश क्षेत्र और मांग पर निर्भर करती है - आमतौर पर 7बी-70बी श्रेणी के मॉडल के लिए 24-80 जीबी वीआरएएम टियर और बड़े स्टैक के लिए मल्टी-जीपीयू नोड्स। हम आपके पैरामीटर गिनती और परिमाणीकरण से वीआरएएम को आकार देने में मदद करते हैं।

क्या निजी GPU उपयोग अभी भी डिजीओ टोकन का उपभोग करता है?

ऑर्केस्ट्रेशन (एजेंट, कार्य, भंडारण) आपकी योजना पर रहता है। आपके GPU पर अनुमान को GPU समय के रूप में बिल किया जाता है; आप आंतरिक चार्जबैक के लिए वैकल्पिक रूप से मीटर टोकन-आकार का उपयोग कर सकते हैं।

प्रबंधित मॉडल चुनें या अपना GPU लाएँ

क्लाउड और जीपीटी पर आज ही शुरुआत करें, फिर जब आप कस्टम वेट होस्ट करने के लिए तैयार हों तो समर्पित जीपीयू जोड़ें - समान एजेंट, समान कार्य, आपका अनुमान।