ಡಿಜಿಯೊ ಮೂಲಸೌಕರ್ಯ

AI ಮಾದರಿಗಳು ಮತ್ತು GPU

ಇಂದು ನಿರ್ವಹಿಸಲಾದ ಗಡಿನಾಡು ಮಾದರಿಗಳಲ್ಲಿ ಏಜೆಂಟ್‌ಗಳನ್ನು ರನ್ ಮಾಡಿ-ಅಥವಾ GPU ಸಾಮರ್ಥ್ಯವನ್ನು ಬಾಡಿಗೆಗೆ ನೀಡಿ, ನಿಮ್ಮ ಸ್ವಂತ ತೂಕವನ್ನು ನಿಯೋಜಿಸಿ ಮತ್ತು ಅದೇ ಕಾರ್ಯಸ್ಥಳದಲ್ಲಿ ಖಾಸಗಿ ಎಂಡ್‌ಪಾಯಿಂಟ್‌ಗಳಿಗೆ ಡಿಜಿಯೊ ಕಾರ್ಯಗಳನ್ನು ರೂಟ್ ಮಾಡಿ.

ಕ್ಲೌಡ್, ಜಿಪಿಟಿ, ಜೆಮಿನಿ ಪ್ರತಿ ಏಜೆಂಟ್ ಮಾದರಿ ಆಯ್ಕೆ GPU ಬಾಡಿಗೆ ಮತ್ತು BYOM
ನಿರ್ವಹಿಸಿದ ಮಾದರಿಗಳು

ಇಂದು ಡಿಜಿಯೊದಲ್ಲಿ ಮಾದರಿಗಳು ಲಭ್ಯವಿವೆ

ಪ್ರತಿ ಏಜೆಂಟ್‌ಗೆ ಡೀಫಾಲ್ಟ್ ಮಾದರಿಯನ್ನು ನಿಯೋಜಿಸಿ ಅಥವಾ ಪ್ರತಿ ಕಾರ್ಯವನ್ನು ಅತಿಕ್ರಮಿಸಿ. ನಿಮ್ಮ ಪ್ಲಾನ್ ಬ್ಯಾಲೆನ್ಸ್‌ನಿಂದ ಡಿಜಿಯೋ ಟೋಕನ್‌ಗಳಲ್ಲಿ ಬಳಕೆಯನ್ನು ಮಾಪನ ಮಾಡಲಾಗುತ್ತದೆ-ಏಜೆಂಟ್ ಸಾನೆಟ್, GPT-4o ಅಥವಾ ಜೆಮಿನಿ ಫ್ಲ್ಯಾಶ್‌ಗೆ ಕರೆ ಮಾಡಿದರೂ ಅದೇ ವ್ಯಾಲೆಟ್.

ಆಂಥ್ರೊಪಿಕ್ ಕ್ಲೌಡ್

  • Claude Opus 4.7 ಪ್ರಮುಖ ತಾರ್ಕಿಕತೆ, ದೀರ್ಘ ಸಂದರ್ಭ, ವಾಸ್ತುಶಿಲ್ಪ ಮತ್ತು ಕಾರ್ಯತಂತ್ರದ ಕೆಲಸ.
  • Claude Opus 4.6 ಸ್ಥಿರ, ಉತ್ತಮ ಗುಣಮಟ್ಟದ ವಿಶ್ಲೇಷಣೆಗಾಗಿ ಹಿಂದಿನ ಪೀಳಿಗೆಯ ಓಪಸ್.
  • Claude Sonnet 4.6 ದೈನಂದಿನ ಚಾಲಕ-ಕೋಡಿಂಗ್, ಬರವಣಿಗೆ ಮತ್ತು ಬಹು-ಹಂತದ ಏಜೆಂಟ್ ಲೂಪ್‌ಗಳು.
  • Claude Sonnet 4.5 / 4 ಬೆಂಬಲಿತ ಕೆಲಸದ ಹೊರೆಗಳಲ್ಲಿ ಪ್ರಾಂಪ್ಟ್ ಕ್ಯಾಶಿಂಗ್‌ನೊಂದಿಗೆ ವೇಗದ ಸಾನೆಟ್ ಶ್ರೇಣಿಗಳು.
  • Claude Haiku 4.5 ಕಡಿಮೆ ಲೇಟೆನ್ಸಿ ಡ್ರಾಫ್ಟ್‌ಗಳು, ವರ್ಗೀಕರಣ ಮತ್ತು ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಉಪಕಾರ್ಯಗಳು.

ಅಕ್ಷರಶಃ ಅನುವಾದಿಸಿ: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 ಸಾಮಾನ್ಯ ಮತ್ತು ಏಜೆಂಟ್ ಕೆಲಸದ ಹೊರೆಗಳಿಗಾಗಿ ಇತ್ತೀಚಿನ GPT-5 ಕುಟುಂಬ.
  • GPT-4.1 & GPT-4o ಪ್ರೊಡಕ್ಷನ್ ಏಜೆಂಟ್‌ಗಳಿಗೆ ವಿಶ್ವಾಸಾರ್ಹ ಮಲ್ಟಿಮೋಡಲ್ ಚಾಟ್ ಮತ್ತು ಟೂಲ್ ಬಳಕೆ.
  • GPT-4o mini ಸಾರಾಂಶಗಳು ಮತ್ತು ಹಗುರವಾದ ಹಂತಗಳಿಗಾಗಿ ವೆಚ್ಚ-ಪರಿಣಾಮಕಾರಿ ರೂಟಿಂಗ್.
  • o3 / o3-pro / o3-mini / o4-mini ಗಣಿತ, ಯೋಜನೆ ಮತ್ತು ಪರಿಶೀಲನೆಗಾಗಿ ತಾರ್ಕಿಕ-ಕೇಂದ್ರಿತ ಮಾದರಿಗಳು.
  • GPT-5.3 Codex & Codex mini ಕೋಡ್ ಉತ್ಪಾದನೆ, ರಿಫ್ಯಾಕ್ಟರ್‌ಗಳು ಮತ್ತು ರೆಪೊ-ಅವೇರ್ ಏಜೆಂಟ್ ಕೌಶಲ್ಯಗಳು.

ಗೂಗಲ್ ಜೆಮಿನಿ

  • Gemini 2.5 Pro ದೀರ್ಘ-ಸಂದರ್ಭದ ಸಂಶೋಧನೆ ಮತ್ತು ರಚನಾತ್ಮಕ ಹೊರತೆಗೆಯುವಿಕೆ.
  • Gemini 2.5 Flash ಸ್ಪರ್ಧಾತ್ಮಕ ಟೋಕನ್ ದರಗಳೊಂದಿಗೆ ಹೈ-ಥ್ರೋಪುಟ್ ಏಜೆಂಟ್ ಹಂತಗಳು.
  • Gemini 2.0 Flash ಪಾರ್ಸಿಂಗ್, ಟ್ಯಾಗಿಂಗ್ ಮತ್ತು ಬ್ಯಾಚ್ ಕೆಲಸಗಳಿಗಾಗಿ ಅಲ್ಟ್ರಾ-ಫಾಸ್ಟ್ ಪಾಸ್‌ಗಳು.

ತೆರೆದ ಮತ್ತು ವಿಶೇಷ API ಗಳು

  • DeepSeek Chat & Reasoner ಚಾಟ್ ಮತ್ತು ಚೈನ್-ಆಫ್-ಥಾಟ್ ಶೈಲಿಯ ಕಾರ್ಯಗಳಿಗೆ ಬಲವಾದ ಮೌಲ್ಯ.
  • Mistral Large ಬಹುಭಾಷಾ ಏಜೆಂಟ್ ತಂಡಗಳಿಗೆ ಯುರೋಪಿಯನ್ ಹೋಸ್ಟ್ ಮಾಡಿದ ಆಯ್ಕೆ.
  • Llama 3.3 70B API ಮೂಲಕ ಮುಕ್ತ-ತೂಕದ ವರ್ಗ ಮಾದರಿ-ಖಾಸಗಿ GPU ನೊಂದಿಗೆ ಚೆನ್ನಾಗಿ ಜೋಡಿಸುತ್ತದೆ.
  • Grok 3 ಸುದ್ದಿ ಮತ್ತು ಸಾಮಾಜಿಕ ಮೇಲ್ವಿಚಾರಣಾ ಏಜೆಂಟ್‌ಗಳಿಗಾಗಿ ನೈಜ-ಸಮಯದ ಆಧಾರಿತ ಮಾದರಿ.
  • Sonar Pro ಸಂಶೋಧನಾ ಏಜೆಂಟ್‌ಗಳಿಗಾಗಿ ಹುಡುಕಾಟ-ಆಧಾರಿತ ಉತ್ತರಗಳು.
  • Command R+ RAG-ಸ್ನೇಹಿ ಎಂಟರ್‌ಪ್ರೈಸ್ ಚಾಟ್ ಮತ್ತು ಮರುಪಡೆಯುವಿಕೆ ವರ್ಕ್‌ಫ್ಲೋಗಳು.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

ಬಳಕೆ

ಏಜೆಂಟರು ಮಾದರಿಯನ್ನು ಹೇಗೆ ಆರಿಸುತ್ತಾರೆ

ಕಾರ್ಯ ಪ್ರಕಾರದ ಆಧಾರದ ಮೇಲೆ ಸಂಯೋಜಕರು ಸಾನೆಟ್ ವಿರುದ್ಧ ಓಪಸ್ ವಿರುದ್ಧ ಅಗ್ಗದ ಫ್ಲಾಶ್ ಮಾದರಿಯನ್ನು ಶಿಫಾರಸು ಮಾಡಬಹುದು. ಪವರ್ ಬಳಕೆದಾರರು ಪ್ರತಿ ಏಜೆಂಟ್ ಪಾತ್ರಕ್ಕೆ ಡಿಫಾಲ್ಟ್‌ಗಳನ್ನು ಹೊಂದಿಸುತ್ತಾರೆ-ಸಾನೆಟ್‌ನಲ್ಲಿ ಸಂಶೋಧನೆ, ಓಪಸ್‌ನಲ್ಲಿ ಅಂತಿಮ ವಿಮರ್ಶೆ, ಹೈಕು ಅಥವಾ ಜೆಮಿನಿ ಫ್ಲ್ಯಾಶ್‌ನಲ್ಲಿ ಬೃಹತ್ ಟ್ಯಾಗಿಂಗ್.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU ಬಾಡಿಗೆ

GPU ಅನ್ನು ಬಾಡಿಗೆಗೆ ನೀಡಿ ಮತ್ತು ನಿಮ್ಮ ಸ್ವಂತ ಮಾದರಿಗಳನ್ನು ಚಲಾಯಿಸಿ

ಫೈನ್-ಟ್ಯೂನ್, ಏರ್-ಗ್ಯಾಪ್ಡ್ ಚೆಕ್‌ಪಾಯಿಂಟ್ ಅಥವಾ ಊಹಿಸಬಹುದಾದ ತೀರ್ಮಾನದ ಬೆಲೆ ಬೇಕೇ? ನಿಮ್ಮ ಡಿಜಿಯೊ ಕಾರ್ಯಸ್ಥಳಕ್ಕೆ ಮೀಸಲಾದ GPU ಸಾಮರ್ಥ್ಯವನ್ನು ಸೇರಿಸಿ, ನೀವು ಆದ್ಯತೆ ನೀಡುವ ಸರ್ವಿಂಗ್ ಸ್ಟಾಕ್ ಅನ್ನು ಸ್ಥಾಪಿಸಿ ಮತ್ತು ನಿಮ್ಮ ಖಾಸಗಿ ಎಂಡ್‌ಪಾಯಿಂಟ್‌ನಲ್ಲಿ ಪಾಯಿಂಟ್ ಏಜೆಂಟ್‌ಗಳನ್ನು ಸೇರಿಸಿ.

ಮೀಸಲಾದ ನಿದರ್ಶನಗಳು

ಗಂಟೆಯ ಅಥವಾ ಮಾಸಿಕ GPU ನೋಡ್‌ಗಳು (A100, H100, L40S ವರ್ಗ) ನಿಮ್ಮ ಬಾಡಿಗೆದಾರರಿಗೆ ಲಗತ್ತಿಸಲಾಗಿದೆ-ಇತರ ಗ್ರಾಹಕರಿಂದ ಪ್ರತ್ಯೇಕಿಸಲಾಗಿದೆ.

ನಿಮ್ಮ ತೂಕ

ಸೇಫ್ಟೆನ್ಸರ್‌ಗಳು, GGUF ಅನ್ನು ಅಪ್‌ಲೋಡ್ ಮಾಡಿ ಅಥವಾ ನಿಮ್ಮ ರಿಜಿಸ್ಟ್ರಿಯಿಂದ ಎಳೆಯಿರಿ; ಲಾಮಾ, ಮಿಸ್ಟ್ರಲ್, ಕ್ವೆನ್ ಮತ್ತು ಕಸ್ಟಮ್ ಫೈನ್-ಟ್ಯೂನ್‌ಗಳನ್ನು ರನ್ ಮಾಡಿ.

ಪ್ರಮಾಣಿತ ಸೇವೆ

vLLM, TGI, Ollama, ಅಥವಾ ನೀವು ನಿರ್ವಹಿಸುವ ಕಂಟೈನರ್ ಚಿತ್ರಗಳು-Digio ಏಜೆಂಟ್‌ಗಳು OpenAI-ಹೊಂದಾಣಿಕೆಯ ಮೂಲ URL ಅನ್ನು ಕರೆಯುತ್ತಾರೆ.

ಅದೇ ಆರ್ಕೆಸ್ಟ್ರೇಶನ್

ಮಾಡಲು, ಟೀಮ್ ಚಾಟ್, ಕೌಶಲ್ಯಗಳು ಮತ್ತು ಸಹಯೋಗವು ಬದಲಾಗದೆ-ಊಹೆಯ ಬ್ಯಾಕೆಂಡ್ ಮಾತ್ರ ನಿಮ್ಮದಾಗಿದೆ.

ಹೈಬ್ರಿಡ್ ರೂಟಿಂಗ್

ಖಾಸಗಿ GPU ಗೆ ಸೂಕ್ಷ್ಮ ಹಂತಗಳನ್ನು ಕಳುಹಿಸಿ ಮತ್ತು ಒಂದು ಕೆಲಸದ ಹರಿವಿನಲ್ಲಿ ಸಾರ್ವಜನಿಕ ಸಂಶೋಧನೆಗಾಗಿ Claude ಅಥವಾ GPT ಅನ್ನು ಬಳಸಿ.

ಎಂಟರ್ಪ್ರೈಸ್ ನಿಯಂತ್ರಣಗಳು

VPC ಪೀರಿಂಗ್, ಸ್ಟ್ಯಾಟಿಕ್ ಎಗ್ರೆಸ್, ಆಡಿಟ್ ಲಾಗ್‌ಗಳು ಮತ್ತು ನಿಯಂತ್ರಿತ ತಂಡಗಳಿಗೆ ಮಾದರಿ ಅನುಮತಿ ಪಟ್ಟಿಗಳು.

ನಿಮ್ಮ ಸ್ವಂತ ಮಾದರಿಯನ್ನು ತನ್ನಿ

ಕಸ್ಟಮ್ ಮಾದರಿಯನ್ನು ಸ್ಥಾಪಿಸಿ ಮತ್ತು ಸಂಪರ್ಕಪಡಿಸಿ

ಶೂನ್ಯದಿಂದ ನಿಮ್ಮ ಅಂತಿಮ ಬಿಂದುವನ್ನು ಕರೆಯುವ ಏಜೆಂಟ್‌ಗಳಿಗೆ ವಿಶಿಷ್ಟವಾದ ಸೆಟಪ್:

  1. ಜಿಪಿಯು ಕಾಯ್ದಿರಿಸಿ

    VRAM, ಪ್ರದೇಶ ಮತ್ತು ಅಪ್‌ಟೈಮ್ ಆಯ್ಕೆಮಾಡಿ (ಬರ್ಸ್ಟ್ ವಿರುದ್ಧ ಯಾವಾಗಲೂ ಆನ್). ತೂಕದ ಸಂಗ್ರಹಣೆಯು ನಿದರ್ಶನದೊಂದಿಗೆ ಸಾಗಿಸುತ್ತದೆ ಅಥವಾ ನಿಮ್ಮ ಬಕೆಟ್ ಅನ್ನು ಆರೋಹಿಸುತ್ತದೆ.

  2. ಸ್ಟಾಕ್ ಅನ್ನು ನಿಯೋಜಿಸಿ

    ಸರ್ವಿಂಗ್ ಇಮೇಜ್ ಅಥವಾ SSH ಅನ್ನು ಪ್ರಾರಂಭಿಸಿ, CUDA ಡ್ರೈವರ್‌ಗಳನ್ನು ಸ್ಥಾಪಿಸಿ ಮತ್ತು ಚೆಕ್‌ಪಾಯಿಂಟ್‌ಗಳನ್ನು ಲೋಡ್ ಮಾಡಿ. ಮಾದರಿ ಸಿದ್ಧವಾಗಿದೆ ಎಂದು ಆರೋಗ್ಯ ತಪಾಸಣೆಗಳು ಖಚಿತಪಡಿಸುತ್ತವೆ.

  3. ಅಂತಿಮ ಬಿಂದುವನ್ನು ನೋಂದಾಯಿಸಿ

    ಕಾರ್ಯಸ್ಥಳ ಸೆಟ್ಟಿಂಗ್‌ಗಳಲ್ಲಿ ಮೂಲ URL, API ಕೀ ಮತ್ತು ಮಾದರಿ ಐಡಿ ಸೇರಿಸಿ. ಲೈವ್ ಆಗುವ ಮೊದಲು ಡಿಜಿಯೊ ಲೇಟೆನ್ಸಿ ಮತ್ತು ಟೋಕನ್ ಫಾರ್ಮ್ಯಾಟ್ ಅನ್ನು ಮೌಲ್ಯೀಕರಿಸುತ್ತದೆ.

  4. ಏಜೆಂಟರಿಗೆ ನಿಯೋಜಿಸಿ

    ಆಯ್ಕೆಮಾಡಿದ ಏಜೆಂಟ್‌ಗಳಿಗಾಗಿ ನಿಮ್ಮ ಖಾಸಗಿ ಮಾದರಿಯನ್ನು ಡೀಫಾಲ್ಟ್ ಆಗಿ ಆರಿಸಿಕೊಳ್ಳಿ; ನಿರ್ವಹಿಸಿದ ಕ್ಲೌಡ್/ಜಿಪಿಟಿ ಮಾದರಿಗಳು ಅಕ್ಕಪಕ್ಕದಲ್ಲಿ ಲಭ್ಯವಿವೆ.

ಜಿಪಿಯು ಬಾಡಿಗೆಯನ್ನು ಡಿಜಿಯೊ ಪ್ಲಾನ್ ಚಂದಾದಾರಿಕೆಗಳಿಂದ ಪ್ರತ್ಯೇಕವಾಗಿ ಬಿಲ್ ಮಾಡಲಾಗುತ್ತದೆ. ಸಾಮರ್ಥ್ಯ ಯೋಜನೆ, SLA ಗಳು ಮತ್ತು ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ನಿರ್ಣಯ ಕ್ಲಸ್ಟರ್‌ನಿಂದ ವಲಸೆಗಾಗಿ ನಮ್ಮನ್ನು ಸಂಪರ್ಕಿಸಿ.

B2B SaaS ವೆಬ್‌ಸೈಟ್ UI ಲೇಬಲ್. ನೈಸರ್ಗಿಕ kn ಗೆ ಅನುವಾದಿಸಿ: FAQ

ಮಾದರಿಗಳು ಮತ್ತು GPU ಪ್ರಶ್ನೆಗಳು

ಡಿಜಿಯೊದಲ್ಲಿ ನಿರ್ವಹಿಸಲಾದ API ಗಳ ವಿರುದ್ಧ ಸ್ವಯಂ-ಹೋಸ್ಟ್ ಮಾಡಲಾದ ತೀರ್ಮಾನವನ್ನು ಆರಿಸುವುದು.

ನಾನು ಎರಡು ಬಾರಿ ಪಾವತಿಸಬೇಕೇ-ಯೋಜನೆ ಜೊತೆಗೆ API?

ನಿಮ್ಮ ಡಿಜಿಯೊ ಚಂದಾದಾರಿಕೆಯು ಮೂಲಸೌಕರ್ಯ, ಏಜೆಂಟ್‌ಗಳು ಮತ್ತು ಡಿಜಿಯೊ ಟೋಕನ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ನಿಜವಾದ ಇನ್‌ಪುಟ್/ಔಟ್‌ಪುಟ್ ಟೋಕನ್‌ಗಳ ಮೂಲಕ ಟೋಕನ್ ಸಮತೋಲನವನ್ನು ನಿರ್ವಹಿಸಿದ ಮಾದರಿ ಬಳಕೆಯ ಡೆಬಿಟ್‌ಗಳು. GPU ಬಾಡಿಗೆಯು ನೀವು ನಿಯಂತ್ರಿಸುವ ಯಂತ್ರಗಳಿಗೆ ಆಡ್-ಆನ್ ಆಗಿದೆ.

ವಿಭಿನ್ನ ಏಜೆಂಟ್‌ಗಳು ವಿಭಿನ್ನ ಮಾದರಿಗಳನ್ನು ಬಳಸಬಹುದೇ?

ಹೌದು-ಪ್ರತಿ ಏಜೆಂಟ್ ತನ್ನದೇ ಆದ ಡೀಫಾಲ್ಟ್ ಅನ್ನು ಹೊಂದಬಹುದು. ಜಾಗತಿಕ ಡೀಫಾಲ್ಟ್ ಅನ್ನು ಬದಲಾಯಿಸದೆಯೇ ಕಾರ್ಯಗಳು ಮತ್ತು ಚಾಟ್‌ಗಳು ಒಂದೇ ರನ್‌ಗೆ ಅತಿಕ್ರಮಿಸಬಹುದು.

ಸಾನೆಟ್ ಮತ್ತು ಓಪಸ್ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು?

ಓಪಸ್ ಅನ್ನು ಗಟ್ಟಿಯಾದ ತಾರ್ಕಿಕ ಮತ್ತು ದೀರ್ಘವಾದ ಸುಸಂಬದ್ಧ ಯೋಜನೆಗಳಿಗಾಗಿ ಟ್ಯೂನ್ ಮಾಡಲಾಗಿದೆ; ದೈನಂದಿನ ಏಜೆಂಟ್ ಲೂಪ್‌ಗಳಿಗೆ ಸಾನೆಟ್ ವೇಗವಾಗಿ ಮತ್ತು ಅಗ್ಗವಾಗಿದೆ. ಹೈಕು ಮತ್ತು ಫ್ಲ್ಯಾಶ್-ಕ್ಲಾಸ್ ಮಾದರಿಗಳು ವಾಲ್ಯೂಮ್ ಸಬ್‌ಟಾಸ್ಕ್‌ಗಳಿಗೆ ಉತ್ತಮವಾಗಿವೆ.

ನಾನು ನನ್ನ ಸ್ವಂತ ಮಾದರಿಯನ್ನು ಮಾತ್ರ ಚಲಾಯಿಸಬಹುದೇ ಮತ್ತು ಕ್ಲೌಡ್ API ಗಳನ್ನು ನಿರ್ಬಂಧಿಸಬಹುದೇ?

ಎಂಟರ್‌ಪ್ರೈಸ್ ಕಾರ್ಯಸ್ಥಳಗಳು ಹೊರಹೋಗುವ ಮಾದರಿ ಪೂರೈಕೆದಾರರನ್ನು ನಿರ್ಬಂಧಿಸಬಹುದು ಮತ್ತು ಎಲ್ಲಾ ಏಜೆಂಟ್ ದಟ್ಟಣೆಯನ್ನು ನಿಮ್ಮ GPU ಎಂಡ್‌ಪಾಯಿಂಟ್‌ಗೆ ರವಾನಿಸಬಹುದು. ಹೆಚ್ಚಿನ ತಂಡಗಳಿಗೆ ಹೈಬ್ರಿಡ್ ಮೋಡ್ ಡೀಫಾಲ್ಟ್ ಆಗಿದೆ.

ಯಾವ GPU ಗಾತ್ರಗಳು ಲಭ್ಯವಿದೆ?

ಕೊಡುಗೆಗಳು ಪ್ರದೇಶ ಮತ್ತು ಬೇಡಿಕೆಯ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿದೆ-ಸಾಮಾನ್ಯವಾಗಿ 7B-70B ವರ್ಗದ ಮಾದರಿಗಳಿಗೆ 24-80 GB VRAM ಶ್ರೇಣಿಗಳು ಮತ್ತು ದೊಡ್ಡ ಸ್ಟ್ಯಾಕ್‌ಗಳಿಗಾಗಿ ಬಹು-GPU ನೋಡ್‌ಗಳು. ನಿಮ್ಮ ಪ್ಯಾರಾಮೀಟರ್ ಎಣಿಕೆ ಮತ್ತು ಪ್ರಮಾಣೀಕರಣದಿಂದ ನಾವು ಗಾತ್ರ VRAM ಗೆ ಸಹಾಯ ಮಾಡುತ್ತೇವೆ.

ಖಾಸಗಿ GPU ಬಳಕೆಯು ಇನ್ನೂ ಡಿಜಿಯೋ ಟೋಕನ್‌ಗಳನ್ನು ಬಳಸುತ್ತದೆಯೇ?

ಆರ್ಕೆಸ್ಟ್ರೇಶನ್ (ಏಜೆಂಟ್‌ಗಳು, ಕಾರ್ಯಗಳು, ಸಂಗ್ರಹಣೆ) ನಿಮ್ಮ ಯೋಜನೆಯಲ್ಲಿ ಉಳಿಯುತ್ತದೆ. ನಿಮ್ಮ GPU ಮೇಲಿನ ತೀರ್ಮಾನವನ್ನು GPU ಸಮಯ ಎಂದು ಬಿಲ್ ಮಾಡಲಾಗುತ್ತದೆ; ಆಂತರಿಕ ಚಾರ್ಜ್‌ಬ್ಯಾಕ್‌ಗಾಗಿ ನೀವು ಐಚ್ಛಿಕವಾಗಿ ಟೋಕನ್-ಆಕಾರದ ಬಳಕೆಯನ್ನು ಮೀಟರ್ ಮಾಡಬಹುದು.

ನಿರ್ವಹಿಸಿದ ಮಾದರಿಗಳನ್ನು ಆಯ್ಕೆಮಾಡಿ ಅಥವಾ ನಿಮ್ಮ GPU ಅನ್ನು ತನ್ನಿ

ಇಂದು ಕ್ಲೌಡ್ ಮತ್ತು GPT ನಲ್ಲಿ ಪ್ರಾರಂಭಿಸಿ, ನಂತರ ನೀವು ಕಸ್ಟಮ್ ತೂಕವನ್ನು ಹೋಸ್ಟ್ ಮಾಡಲು ಸಿದ್ಧರಾದಾಗ ಮೀಸಲಾದ GPU ಅನ್ನು ಸೇರಿಸಿ-ಅದೇ ಏಜೆಂಟ್‌ಗಳು, ಅದೇ ಕಾರ್ಯಗಳು, ನಿಮ್ಮ ತೀರ್ಮಾನ.