Infrastruttura Digio

Mudelli AI & GPU

Mexxi l-aġenti fuq mudelli ta' fruntiera ġestiti llum—jew tikri l-kapaċità tal-GPU, uża l-piżijiet tiegħek stess, u rrotta l-kompiti Digio lejn endpoints privati ​​fl-istess spazju tax-xogħol.

Tikketta tal-UI tal-websajt B2B SaaS. Ittraduċi għal naturali mt: Claude, GPT, Gemini Agħżel mudell għal kull aġent Kiri tal-GPU & BYOM
Mudelli ġestiti

Mudelli disponibbli f'Digio illum

Assenja mudell default għal kull aġent jew override għal kull kompitu. L-użu jitkejjel f'Digio Tokens mill-bilanċ tal-pjan tiegħek—l-istess kartiera kemm jekk l-aġent isejjaħ lil Sonnet, GPT-4o, jew Gemini Flash.

Claude Antropiku

  • Claude Opus 4.7 Raġunar ewlieni, kuntest twil, arkitettura u xogħol ta' strateġija.
  • Claude Opus 4.6 Opus tal-ġenerazzjoni ta 'qabel għal analiżi stabbli u ta' kwalità għolja.
  • Claude Sonnet 4.6 Sewwieq ta 'kuljum—kodifikazzjoni, kitba, u loops ta' aġent f'diversi stadji.
  • Claude Sonnet 4.5 / 4 Saffi ta' Sonnet veloċi b'caching fil-pront fuq tagħbija ta' xogħol appoġġjata.
  • Claude Haiku 4.5 Abbozzi ta 'latenza baxxa, klassifikazzjoni, u sub-tasks ta' volum għoli.

Tikketta tal-UI tal-websajt B2B SaaS. Ittraduċi għal mt naturali: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 L-aħħar familja GPT-5 għal xogħolijiet ġenerali u aġenti.
  • GPT-4.1 & GPT-4o Chat multimodali affidabbli u użu ta 'għodda għall-aġenti tal-produzzjoni.
  • GPT-4o mini Rotot kosteffiċjenti għal sommarji u passi ħfief.
  • o3 / o3-pro / o3-mini / o4-mini Mudelli ffukati fuq ir-raġunament għall-matematika, l-ippjanar, u l-verifika.
  • GPT-5.3 Codex & Codex mini Ġenerazzjoni tal-kodiċi, refactors, u ħiliet ta 'aġenti repo-konxji.

Tikketta tal-UI tal-websajt B2B SaaS. Ittraduċi għal mt naturali: Google Gemini

  • Gemini 2.5 Pro Riċerka fit-tul u estrazzjoni strutturata.
  • Gemini 2.5 Flash Passi ta 'aġent b'rendiment għoli b'rati ta' tokens kompetittivi.
  • Gemini 2.0 Flash Passi ultra-veloċi għall-parsing, it-tikkettar, u l-impjiegi tal-lott.

APIs miftuħa u speċjalizzati

  • DeepSeek Chat & Reasoner Valur qawwi għaċ-chat u l-ħidmiet tal-istil tal-katina tal-ħsieb.
  • Mistral Large Għażla ospitata fl-Ewropa għal timijiet ta' aġenti multilingwi.
  • Llama 3.3 70B Mudell ta' klassi ta' piżijiet miftuħa permezz ta' l-API—jgħaqqad tajjeb ma' GPU privata.
  • Grok 3 Mudell orjentat fil-ħin reali għall-aħbarijiet u l-aġenti tal-monitoraġġ soċjali.
  • Sonar Pro Risposti bbażati fuq it-tfittxija għall-aġenti tar-riċerka.
  • Command R+ Flussi ta' xogħol ta' chat u ta' rkupru ta' intrapriża li huma favur ir-RAG.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Użu

Kif l-aġenti jagħżlu mudell

Il-Koordinatur jista 'jirrakkomanda Sonnet vs Opus vs mudell flash irħas ibbażat fuq it-tip ta' kompitu. Utenti setgħana jistabbilixxu defaults għal kull rwol ta 'aġent—riċerka fuq Sonnet, reviżjoni finali fuq Opus, tikkettar bl-ingrossa fuq Haiku jew Gemini Flash.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

Kiri tal-GPU

Kiri GPU u mexxi l-mudelli tiegħek

Għandek bżonn aġġustament fin, punt ta 'kontroll b'arja vojta, jew prezzijiet ta' inferenza prevedibbli? Żid il-kapaċità tal-GPU ddedikata mal-ispazju tax-xogħol Digio tiegħek, installa l-munzell li jservi li tippreferi, u poġġi l-aġenti fil-punt tat-tmiem privat tiegħek.

Każijiet dedikati

GPU kull siegħa jew kull xahar (klassi A100, H100, L40S) imwaħħla mal-kerrej tiegħek—iżolati minn klijenti oħra.

Il-piżijiet tiegħek

Ittella safetensors, GGUF, jew iġbed mir-reġistru tiegħek; run Llama, Mistral, Qwen, u custom fine-tunes.

Servizz standard

vLLM, TGI, Ollama, jew immaġini tal-kontenitur li żżomm—aġenti Digio jsejħu URL bażi kompatibbli mal-OpenAI.

L-istess orkestrazzjoni

Biex tagħmel, it-chat tat-tim, il-ħiliet, u l-kollaborazzjoni mhux mibdula—il-backend tal-inferenza biss huwa tiegħek.

Rotot ibridu

Ibgħat passi sensittivi lil GPU privata u uża Claude jew GPT għal riċerka pubblika fi fluss tax-xogħol wieħed.

Kontrolli tal-intrapriżi

Peering tal-VPC, ħruġ statiku, reġistri tal-awditjar, u listi ta' permessi tal-mudelli għal timijiet regolati.

Ġib il-mudell tiegħek

Installa u qabbad mudell tad-dwana

Setup tipiku minn żero għal aġenti li jċemplu l-endpoint tiegħek:

  1. Riżerva GPU

    Agħżel VRAM, reġjun, u uptime (fqigħ vs dejjem mixgħul). Ħażna għall-piżijiet vapuri bl-istanza jew muntatura barmil tiegħek.

  2. Użu l-munzell

    Ibda immaġni li sservi jew SSH, installa sewwieqa CUDA, u tagħbija punti ta 'kontroll. Il-kontrolli tas-saħħa jikkonfermaw li l-mudell huwa lest.

  3. Irreġistra l-endpoint

    Żid URL bażi, ċavetta API, u id tal-mudell fis-settings tal-ispazju tax-xogħol. Digio jivvalida l-latency u l-format tat-token qabel ma jibda jgħix.

  4. Assenja lill-aġenti

    Agħżel il-mudell privat tiegħek bħala default għall-aġenti magħżula; mudelli Claude/GPT ġestiti jibqgħu disponibbli ħdejn xulxin.

Il-kiri tal-GPU jiġi ffatturat separatament mill-abbonamenti tal-pjan Digio. Ikkuntattjana għall-ippjanar tal-kapaċità, SLAs, u migrazzjoni minn cluster ta' inferenza eżistenti.

Tikketta tal-UI tal-websajt B2B SaaS. Ittraduċi għal mt naturali: FAQ

Mudelli u mistoqsijiet GPU

Għażla ta' APIs ġestiti vs inferenza self-hosted fuq Digio.

Nħallas darbtejn—pjan flimkien mal-API?

L-abbonament tiegħek Digio jkopri l-infrastruttura, l-aġenti, u jinkludi Digio Tokens. Debiti ta 'użu ta' mudell immaniġġjat li token jibbilanċjaw minn tokens ta 'input/output attwali. Il-kiri tal-GPU huwa add-on għall-magni li tikkontrolla.

Jistgħu aġenti differenti jużaw mudelli differenti?

Iva—kull aġent jista' jkollu l-inadempjenza tiegħu. Il-kompiti u ċ-chats jistgħu jissuperaw għal ġirja waħda mingħajr ma jinbidlu l-inadempjenza globali.

X'inhi d-differenza bejn Sonnet u Opus?

Opus huwa sintonizzat għal raġunament aktar iebes u pjanijiet koerenti itwal; Is-sonnet huwa aktar mgħaġġel u orħos għal loops tal-aġent ta 'kuljum. Haiku u mudelli ta 'klassi flash huma l-aħjar għas-subtasks tal-volum.

Nista' nmexxi biss il-mudell tiegħi stess u nibblokka l-APIs tal-cloud?

L-ispazji tax-xogħol tal-intrapriżi jistgħu jirrestrinġu l-fornituri tal-mudelli 'l barra u jindirizzaw it-traffiku kollu tal-aġenti lejn l-endpoint tal-GPU tiegħek. Il-modalità ibrida hija d-default għal ħafna timijiet.

Liema daqsijiet tal-GPU huma disponibbli?

L-offerti jiddependu fuq ir-reġjun u d-domanda—komunement saffi VRAM ta '24–80 GB għal mudelli ta' klassi 7B–70B u nodi multi-GPU għal munzelli akbar. Aħna ngħinu d-daqs VRAM mill-għadd tal-parametri u l-kwantizzazzjoni tiegħek.

L-użu privat tal-GPU għadu jikkonsma Digio Tokens?

L-orkestrazzjoni (aġenti, kompiti, ħażna) tibqa' fuq il-pjan tiegħek. L-inferenza fuq il-GPU tiegħek hija ċċarġjata bħala ħin tal-GPU; tista' b'għażla tkejjel l-użu f'forma ta' token għal chargeback intern.

Agħżel mudelli ġestiti jew ġib il-GPU tiegħek

Ibda fuq Claude u GPT illum, imbagħad żid GPU dedikat meta tkun lest biex tospita piżijiet personalizzati—l-istess aġenti, l-istess kompiti, l-inferenza tiegħek.