Digio infrastrukturu

AI modelləri və GPU

Bu gün idarə olunan sərhəd modellərində agentləri işə salın və ya GPU tutumunu icarəyə götürün, öz çəkilərinizi yerləşdirin və Digio tapşırıqlarını eyni iş məkanında şəxsi son nöqtələrə yönləndirin.

Klod, GPT, Əkizlər Agent başına model seçimi GPU icarəsi və BYOM
İdarə olunan modellər

Modellər bu gün Digio-da mövcuddur

Hər agent üçün defolt model təyin edin və ya hər tapşırıq üçün ləğv edin. İstifadə plan balansınızdan Digio Tokens-də ölçülür - agentin Sonnet, GPT-4o və ya Gemini Flash-a zəng etməsindən asılı olmayaraq eyni pul kisəsi.

Antropik Klod

  • Claude Opus 4.7 Flaqman əsaslandırma, uzun kontekst, memarlıq və strategiya işi.
  • Claude Opus 4.6 Stabil, yüksək keyfiyyətli analiz üçün əvvəlki nəsil Opus.
  • Claude Sonnet 4.6 Gündəlik sürücü — kodlaşdırma, yazma və çox addımlı agent dövrələri.
  • Claude Sonnet 4.5 / 4 Dəstəklənən iş yüklərində operativ keşləmə ilə sürətli Sonnet səviyyələri.
  • Claude Haiku 4.5 Aşağı gecikməli qaralamalar, təsnifatlar və yüksək həcmli alt tapşırıqlar.

Hərfi tərcümə edin: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 Ümumi və agent iş yükləri üçün ən son GPT-5 ailəsi.
  • GPT-4.1 & GPT-4o İstehsal agentləri üçün etibarlı multimodal söhbət və alət istifadəsi.
  • GPT-4o mini Xülasələr və yüngül addımlar üçün sərfəli marşrutlaşdırma.
  • o3 / o3-pro / o3-mini / o4-mini Riyaziyyat, planlaşdırma və yoxlama üçün düşünməyə əsaslanan modellər.
  • GPT-5.3 Codex & Codex mini Kod yaratmaq, refaktorlar və repo-dan xəbərdar agent bacarıqları.

Google Əkizlər

  • Gemini 2.5 Pro Uzun kontekstli tədqiqat və strukturlaşdırılmış çıxarış.
  • Gemini 2.5 Flash Rəqabətli token dərəcələri ilə yüksək məhsuldarlıqlı agent addımları.
  • Gemini 2.0 Flash Təhlil, etiketləmə və toplu işlər üçün ultra sürətli keçidlər.

Açıq və mütəxəssis API-lər

  • DeepSeek Chat & Reasoner Söhbət və düşüncə zənciri üslublu tapşırıqlar üçün güclü dəyər.
  • Mistral Large Çoxdilli agent komandaları üçün Avropada yerləşən seçim.
  • Llama 3.3 70B API vasitəsilə açıq çəkilər sinfi modeli—şəxsi GPU ilə yaxşı birləşir.
  • Grok 3 Xəbərlər və sosial monitorinq agentləri üçün real vaxt yönümlü model.
  • Sonar Pro Tədqiqat agentləri üçün axtarışa əsaslanan cavablar.
  • Command R+ RAG dostu müəssisə söhbəti və axtarış iş axınları.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

İstifadəsi

Agentlər modeli necə seçirlər

Koordinator tapşırıq növünə əsasən Sonnet vs Opus vs daha ucuz flaş modelini tövsiyə edə bilər. Güclü istifadəçilər hər agent rolu üçün defoltları təyin edirlər - Sonnet-də araşdırma, Opus-da yekun baxış, Haiku və ya Gemini Flash-da toplu etiketləmə.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU icarəsi

GPU icarəyə götürün və öz modellərinizi idarə edin

İncə tənzimləmə, hava boşluqlu bir yoxlama nöqtəsi və ya proqnozlaşdırıla bilən nəticə qiymətinə ehtiyacınız varmı? Digio iş sahəsinə xüsusi GPU tutumu əlavə edin, üstünlük verdiyiniz xidmət yığınını quraşdırın və şəxsi son nöqtənizdə agentləri göstərin.

Xüsusi nümunələr

Digər müştərilərdən təcrid olunmuş saatlıq və ya aylıq GPU qovşaqları (A100, H100, L40S sinfi) icarəçinizə qoşulur.

Sizin çəkilər

Safetensorları, GGUF yükləyin və ya reyestrinizdən çıxarın; Llama, Mistral, Qwen və xüsusi incə melodiyaları idarə edin.

Standart xidmət

vLLM, TGI, Ollama və ya saxladığınız konteyner şəkilləri—Digio agentləri OpenAI-a uyğun əsas URL-i çağırır.

Eyni orkestr

Bunu etmək üçün komanda söhbəti, bacarıqlar və əməkdaşlıq dəyişməz - yalnız nəticənin arxa tərəfi sizindir.

Hibrid marşrutlaşdırma

Şəxsi GPU-ya həssas addımlar göndərin və bir iş prosesində ictimai araşdırma üçün Claude və ya GPT-dən istifadə edin.

Müəssisə nəzarəti

VPC nəzərdən keçirmə, statik çıxış, audit qeydləri və tənzimlənən komandalar üçün model icazə siyahıları.

Öz modelinizi gətirin

Fərdi modeli quraşdırın və birləşdirin

Son nöqtənizə zəng edən agentlərə sıfırdan tipik quraşdırma:

  1. Ehtiyat GPU

    VRAM, region və işləmə müddətini seçin (burst vs həmişə aktiv). Çəkilər üçün anbar nümunə ilə göndərilir və ya vedrənizi quraşdırır.

  2. Yığın yerləşdirin

    Xidmət şəklini və ya SSH-ni işə salın, CUDA sürücülərini quraşdırın və yoxlama nöqtələrini yükləyin. Sağlamlıq yoxlamaları modelin hazır olduğunu təsdiqləyir.

  3. Son nöqtəni qeyd edin

    İş sahəsi ayarlarında əsas URL, API açarı və model id əlavə edin. Digio canlı yayımdan əvvəl gecikmə və işarə formatını təsdiqləyir.

  4. Agentlərə təyin edin

    Seçilmiş agentlər üçün defolt olaraq şəxsi modelinizi seçin; idarə olunan Claude/GPT modelləri yan-yana mövcuddur.

GPU icarəsi Digio plan abunəliklərindən ayrıca hesablanır. Bacarıqların planlaşdırılması, SLA-lar və mövcud nəticə klasterindən miqrasiya üçün bizimlə əlaqə saxlayın.

Tez-tez verilən suallar

Modellər və GPU sualları

Digio-da idarə olunan API-lərin seçilməsi və öz-özünə qurulan nəticə.

Mən iki dəfə ödəniş edirəm - plan plus API?

Digio abunəliyiniz infrastrukturu, agentləri və daxil olan Digio Tokenləri əhatə edir. Faktiki giriş/çıxış nişanları ilə balansı təmin edən idarə olunan model istifadə debetləri. GPU icarəsi nəzarət etdiyiniz maşınlar üçün əlavədir.

Fərqli agentlər fərqli modellərdən istifadə edə bilərmi?

Bəli - hər bir agentin öz standartı ola bilər. Tapşırıqlar və söhbətlər qlobal standartı dəyişdirmədən bir qaçış üçün ləğv edilə bilər.

Sonnet və Opus arasındakı fərq nədir?

Opus daha sərt əsaslandırma və daha uzun ardıcıl planlar üçün tənzimlənir; Sonnet gündəlik agent döngələri üçün daha sürətli və daha ucuzdur. Haiku və flash sinif modelləri həcmli alt tapşırıqlar üçün ən yaxşısıdır.

Mən yalnız öz modelimi işlədə və bulud API-lərini bloklaya bilərəmmi?

Müəssisə iş yerləri gedən model təminatçılarını məhdudlaşdıra və bütün agent trafikini GPU son nöqtəsinə yönləndirə bilər. Hibrid rejimi əksər komandalar üçün standartdır.

Hansı GPU ölçüləri mövcuddur?

Təkliflər regiondan və tələbatdan asılıdır – adətən 7B–70B sinif modelləri üçün 24–80 GB VRAM səviyyələri və daha böyük yığınlar üçün çox GPU qovşaqları. Parametrlərin sayından və kvantlaşdırmadan VRAM-ı ölçməyə kömək edirik.

Şəxsi GPU istifadəsi hələ də Digio Tokens istehlak edirmi?

Orkestrasiya (agentlər, tapşırıqlar, yaddaş) planınızda qalır. GPU-nuzdakı nəticə GPU vaxtı kimi hesablanır; siz isteğe bağlı olaraq daxili geri ödəmə üçün token formalı istifadəni ölçə bilərsiniz.

İdarə olunan modelləri seçin və ya GPU-nu gətirin

Bu gün Claude və GPT-də başlayın, sonra xüsusi çəkiləri qəbul etməyə hazır olduğunuz zaman xüsusi GPU əlavə edin - eyni agentlər, eyni tapşırıqlar, nəticəniz.