Hvernig á að setja upp gervigreindarlíkön

Hvernig á að setja upp gervigreindarlíkön

Stutt svar: Að setja upp gervigreindarlíkan þýðir að velja þjónunarmynstur (rauntíma, hópa, streymi eða jaðar) og gera síðan alla leiðina endurtakanlega, sýnilega, örugga og afturkræfa. Þegar þú útgáfur allt og metur seinkunartíma p95/p99 á framleiðslulíkum gagnamagni, forðast þú flest mistök sem „virkar á fartölvunni minni“.

Lykilatriði:

Dreifingarmynstur: Veldu rauntíma, hópvinnslu, straumspilun eða brún kerfisins áður en þú skuldbindur þig til verkfæra.

Endurtekningarhæfni: Útgáfa líkansins, eiginleika, kóða og umhverfis til að koma í veg fyrir frávik.

Athugunarhæfni: Fylgist stöðugt með seinkunarhala, villum, mettun og gagna- eða úttaksdreifingu.

Öruggar útfærslur: Notið kanarífuglapróf, blágræna próf eða skuggapróf með sjálfvirkum afturköllunarþröskuldum.

Öryggi og friðhelgi: Notið heimildir, hraðatakmarkanir og leyndarmálastjórnun og lágmarkið persónuupplýsingar í skrám.

Hvernig á að setja upp gervigreindarlíkön? Upplýsingamynd

Greinar sem þú gætir viljað lesa eftir þessa: 

🔗 Hvernig á að mæla afköst gervigreindar
Lærðu mælikvarða, viðmið og raunverulegar athuganir til að fá áreiðanlegar niðurstöður úr gervigreind.

🔗 Hvernig á að sjálfvirknivæða verkefni með gervigreind
Breyttu endurteknu starfi í vinnuflæði með því að nota fyrirmæli, verkfæri og samþættingar.

🔗 Hvernig á að prófa gervigreindarlíkön
Hönnun mats, gagnasöfn og einkunnagjöf til að bera saman líkön á hlutlægan hátt.

🔗 Hvernig á að tala við gervigreind
Spyrðu betri spurninga, settu samhengi og fáðu skýrari svör hraðar.


1) Hvað „uppsetning“ þýðir í raun og veru (og hvers vegna það er ekki bara API) 🧩

Þegar fólk segir „setja upp líkanið“ gæti það átt við eitthvað af þessu:

Þannig að dreifing snýst minna um að „gera líkan aðgengilegt“ og frekar:

  • pökkun + framreiðslu + stigstærð + eftirlit + stjórnun + afturköllun ( Blágræn dreifing )

Þetta er svolítið eins og að opna veitingastað. Að elda góðan rétt er mikilvægt, vissulega. En þú þarft samt húsnæðið, starfsfólkið, kælinguna, matseðlana, framboðskeðjuna og leið til að takast á við kvöldmatarhraðann án þess að gráta í frystikistunni. Ekki fullkomin myndlíking ... en þú skilur. 🍝


2) Hvað gerir góða útgáfu af „Hvernig á að dreifa gervigreindarlíkönum“ ✅

„Góð dreifing“ er leiðinleg á besta hátt. Hún hegðar sér fyrirsjáanlega undir álagi og þegar hún gerir það ekki er hægt að greina það fljótt.

Svona lítur „gott“ yfirleitt út:

  • Endurtakanlegar byggingar
    Sami kóði + sömu ósjálfstæði = sama hegðun. Engar óhugnanlegar „virkar á fartölvunni minni“ tilfinningar 👻 ( Docker: Hvað er gámur? )

  • Skýr viðmótssamningur.
    Inntak, úttak, skema og brúnartilvik eru skilgreind. Engar óvæntar gerðir klukkan tvö að nóttu. ( OpenAPI: Hvað er OpenAPI?, JSON skema )

  • Afköst sem samsvara raunveruleikanum.
    Seinkun og afköst mæld á framleiðslulíkum vélbúnaði og raunverulegum farmhleðslum.

  • Eftirlit með tönnum.
    Mælingar, skrár, rakningar og rekstrarathuganir sem kalla fram aðgerðir (ekki bara mælaborð sem enginn opnar). ( SRE bók: Eftirlit með dreifðum kerfum )

  • Örugg útfærslustefna:
    Canary eða blágræn, auðveld afturrúllun, útgáfustjórnun sem krefst ekki bænar. ( Útgáfa Canary , Blágræn innleiðing )

  • Kostnaðarvitund
    „Hratt“ er frábært þangað til reikningurinn lítur út eins og símanúmer 📞💸

  • Öryggi og friðhelgi innbyggt í
    leyndarmálastjórnun, aðgangsstýringu, meðhöndlun persónuupplýsinga og endurskoðunarhæfni. ( Kubernetes Secrets , NIST SP 800-122 )

Ef þú getur gert þetta stöðugt, þá ertu nú þegar kominn á undan flestum liðum. Við skulum vera hreinskilin.


3) Veldu rétta dreifingarmynstrið (áður en þú velur verkfæri) 🧠

Ályktun um rauntíma API ⚡

Best þegar:

  • notendur þurfa tafarlausar niðurstöður (ráðleggingar, svikaprófanir, spjall, sérstillingar)

  • Ákvarðanir verða að taka meðan á beiðni stendur

Varúðarráðstafanir:

Hópastigagjöf 📦

Best þegar:

  • Hægt er að seinka spám (áhættumat yfir nótt, spá um viðskiptavinaþörf, ETL-auðgun) ( Amazon SageMaker Batch Transform )

  • þú vilt hagkvæmni og einfaldari rekstur

Varúðarráðstafanir:

  • gagnanýting og endurfyllingar

  • að halda eiginleikarökfræði í samræmi við þjálfun

Ályktun um streymi 🌊

Best þegar:

  • þú vinnur úr atburðum stöðugt (IoT, smellikerfi, eftirlitskerfi)

  • þú vilt ákvarðanir í nánast rauntíma án strangra beiðnasvars

Varúðarráðstafanir:

Útfærsla á jaðri 📱

Best þegar:

Varúðarráðstafanir:

Veldu fyrst mynstrið, svo staflann. Annars endarðu á því að neyða ferkantað líkan inn í hringlaga keyrslutíma. Eða eitthvað álíka. 😬


4) Að pakka líkaninu þannig að það endist í snertingu við framleiðslu 📦🧯

Þetta er þar sem flestar „auðveldar dreifingar“ deyja hljóðlega.

Útgáfa af öllu (já, öllu)

  • Líkangripur (vigt, graf, táknmyndari, merkimiðakort)

  • Eiginleikarökfræði (umbreytingar, staðlun, kóðarar)

  • Ályktunarkóði (fyrir/eftir vinnslu)

  • Umhverfi (Python, CUDA, kerfisskrár)

Einföld aðferð sem virkar:

  • meðhöndla líkanið eins og losunargrip

  • geymdu það með útgáfumerki

  • krefjast lýsigagnaskrár í formi líkankorts: skema, mælikvarða, athugasemdir um skyndimyndir af þjálfunargögnum, þekktar takmarkanir ( líkanskort fyrir líkanskýrslugerð )

Ílát hjálpa, en ekki dýrka þau 🐳

Ílát eru frábær vegna þess að þau:

En þú þarft samt að stjórna:

Staðlaðu viðmótið

Ákveddu inntaks-/úttakssnið snemma:

Og vinsamlegast staðfestið inntak. Ógild inntak eru helsta orsök „hvers vegna skilar það bull“ miða. ( OpenAPI: Hvað er OpenAPI?, JSON Schema )


5) Þjónustuvalkostir - frá „einföldu API“ til fullgerðra netþjóna 🧰

Það eru tvær algengar leiðir:

Valkostur A: Forritþjónn + ályktunarkóði (FastAPI-stíll aðferð) 🧪

Þú skrifar API sem hleður líkaninu og skilar spám. ( FastAPI )

Kostir:

  • auðvelt að aðlaga

  • frábært fyrir einfaldari gerðir eða vörur á frumstigi

  • Einföld heimild, leiðsögn og samþætting

Ókostir:

  • þín eigin afköstastilling (hópun, þráðun, notkun GPU)

  • þú munt finna upp hjólin á ný, kannski illa í fyrstu

Valkostur B: Líkanþjónn (TorchServe / Triton-stíll aðferð) 🏎️

Sérhæfðir netþjónar sem sjá um:

Kostir:

  • betri afköst frá upphafi

  • hreinni aðskilnaður milli þjónustu og viðskiptarökfræði

Ókostir:

  • auka rekstrarflækjustig

  • Uppsetning getur virst ... flókin, eins og að stilla hitastig sturtunnar

Blendingsmynstur er mjög algengt:


6) Samanburðartafla - vinsælar leiðir til að dreifa (með einlægum tilfinningum) 📊😌

Hér að neðan er hagnýt yfirlitsmynd af þeim valkostum sem fólk notar í raun þegar það finnur út hvernig á að setja upp gervigreindarlíkön .

Tól / Aðferð Áhorfendur Verð Af hverju það virkar
Docker + FastAPI (eða sambærilegt) Lítil teymi, sprotafyrirtæki Frjálslegt Einfalt, sveigjanlegt, fljótlegt að senda - þú munt „finna“ fyrir öllum vandamálum með stigstærð ( Docker , FastAPI )
Kubernetes (gerðu það sjálfur) Pallarlið Innra-háð Stýring + stigstærð ... líka fullt af hnöppum, sumir þeirra bölvaðir ( Kubernetes HPA )
Stýrður ML-pallur (ML-þjónusta í skýinu) Lið sem vilja færri aðgerðir Borgaðu eftir því sem þú notar Innbyggð vinnuflæði fyrir dreifingu, eftirlitskrókar - stundum dýrt fyrir endapunkta sem eru alltaf virkir ( Vertex AI dreifing , SageMaker rauntíma ályktun )
Netþjónslausar aðgerðir (til að draga léttar ályktanir) Atburðadrifin forrit Borga eftir notkun Frábært fyrir sprungnar umferðir - en kaldræsingar og stærð líkansins geta eyðilagt daginn 😬 ( AWS Lambda kaldræsingar )
NVIDIA Triton ályktunarþjónn Árangursmiðuð teymi Ókeypis hugbúnaður, kostnaður við innviði Frábær nýting GPU, hópvinnsla, fjöllíkön - stilling krefst þolinmæði ( Triton: Kvik hópvinnsla )
KyndillServe Lið sem nota mikið af PyTorch Ókeypis hugbúnaður Sæmileg sjálfgefin birtingarmynstur - gæti þurft að fínstilla fyrir stóra notkun ( TorchServe skjöl )
BentoML (umbúðir + framreiðslur) ML verkfræðingar Ókeypis kjarni, aukahlutir eru mismunandi Slétt umbúðir, góð upplifun forritara - þú þarft samt sem áður innviðavalkosti ( BentoML umbúðir fyrir dreifingu )
Ray Serve Dreifð kerfi fólk Innra-háð Stærist lárétt, gott fyrir verkefnalínur - finnst „stórt“ fyrir lítil verkefni ( Ray Serve skjöl )

Athugasemd við borð: „Ókeypis“ er hugtök sem koma fyrir í raunveruleikanum. Því það er aldrei ókeypis. Það er alltaf reikningur einhvers staðar, jafnvel þótt það sé svefninn þinn. 😴


7) Afköst og stigstærð - seinkun, afköst og sannleikurinn 🏁

Í afköstastillingu verður innleiðing að handverki. Markmiðið er ekki „hröð“. Markmiðið er að vera stöðugt nógu hröð .

Lykilmælikvarðar sem skipta máli

Algengar handfangsstangir til að toga í

  • Hópvinnsla
    Sameina beiðnir til að hámarka notkun skjákortsins. Gott fyrir afköst, getur haft áhrif á seinkun ef of mikið er gert. ( Triton: Kvik hópvinnsla )

  • Kvantisering
    Minni nákvæmni (eins og INT8) getur hraðað ályktunum og dregið úr minni. Getur dregið örlítið úr nákvæmni. Stundum ekki, sem kemur á óvart. ( Kvantisering eftir þjálfun )

  • Samantekt / hagræðing
    ONNX útflutningur, grafhagræðingar, TensorRT-lík flæði. Öflugt, en kembiforrit geta orðið flókin 🌶️ ( ONNX , ONNX keyrslutíma líkan hagræðingar )

  • Skyndiminni
    Ef innsláttur endurtekur sig (eða ef þú getur vistað innfelldar skrár í skyndiminni) geturðu sparað mikið.

  • Sjálfvirk
    kvarðastærð miðað við nýtingu örgjörva/skjákorts, biðraðardýpt eða beiðnatíðni. Biðraðardýpt er vanmetin. ( Kubernetes HPA )

Undarlegt en satt ráð: mælið með framleiðslulíkum farmstærðum. Lítil prufufarm ljúga að ykkur. Þau brosa kurteislega og svíkja ykkur svo síðar.


8) Eftirlit og athugunarhæfni - ekki fljúga í blindu 👀📈

Líkaneftirlit snýst ekki bara um eftirlit með spenntíma. Þú vilt vita hvort:

Hvað á að fylgjast með (lágmarksgildi)

Þjónustuheilsa

Hegðun líkansins

  • dreifingu inntakseiginleika (grunntölfræði)

  • innfellingarreglur (fyrir innfellingarlíkön)

  • dreifing úttaks (öryggi, bekkjarsamsetning, stigabil)

  • fráviksgreining á inntaki (rusl inn, rusl út)

Gagnarek og hugtakarek

Skráningar, en ekki aðferðin „skrá allt að eilífu“ 🪵

Skrá:

Gættu að friðhelgi einkalífsins. Þú vilt ekki að gagnaleki þinn verði að gagnaleka. ( NIST SP 800-122 )


9) CI/CD og útfærsluaðferðir - meðhöndlið líkön eins og raunverulegar útgáfur 🧱🚦

Ef þú vilt áreiðanlegar dreifingar, byggðu þá upp leiðslu. Jafnvel einfalda.

Traust flæði

  • Einingaprófanir fyrir forvinnslu og eftirvinnslu

  • Samþættingarpróf með þekktu inntaks-úttaks „gullna mengi“

  • Grunnlína fyrir álagspróf (jafnvel létt próf)

  • Smíðagripur (ílát + líkan) ( bestu starfshættir við smíði í Docker )

  • Setja upp í sviðsetningu

  • Útgáfa Canary fyrir lítinn hluta umferðar ( Canary Release )

  • Auka smám saman

  • Sjálfvirk afturköllun á lykilþröskuldum ( Blágræn dreifing )

Útfærslumynstur sem bjarga geðheilsu þinni

  • Canary : gefa út fyrst í 1-5% umferð ( Canary útgáfa )

  • Blágrænt : keyra nýja útgáfu samhliða þeirri gömlu, fletta yfir þegar hún er tilbúin ( Blágræn dreifing )

  • Skuggaprófun : senda raunverulega umferð á nýja líkanið en ekki nota niðurstöðurnar (frábært til mats) ( Microsoft: Skuggaprófun )

Og útgáfuðu endapunktana þína eða leiðina eftir líkanútgáfu. Í framtíðinni munt þú þakka þér. Núverandi munt þú einnig þakka þér, en hljóðlega.


10) Öryggi, friðhelgi og „vinsamlegast ekki leka efni“ 🔐🙃

Öryggisverðir mæta gjarnan seint, eins og óboðnir gestir. Betra að bjóða þeim snemma.

Hagnýtur gátlisti

  • Auðkenning og heimild (hver getur kallað á líkanið?)

  • Takmörkun á hraða (vernd gegn misnotkun og óviljandi stormum) ( API Gateway takmörkun )

  • Leyndarmálastjórnun (engir lyklar í kóða, engir lyklar í stillingarskrám heldur…) ( AWS Secrets Manager , Kubernetes Secrets )

  • Netstýringar (einkanet, þjónustu-til-þjónustu stefnur)

  • Endurskoðunarskrár (sérstaklega fyrir viðkvæmar spár)

  • Gagnalágmörkun (geymið aðeins það sem nauðsynlegt er) ( NIST SP 800-122 )

Ef líkanið snertir persónuupplýsingar:

  • rita eða ræsa auðkenni

  • forðastu að skrá hráar farmhleðslur ( NIST SP 800-122 )

  • skilgreina varðveislureglur

  • gagnaflæði skjala (leiðinlegt en verndandi)

Einnig getur misnotkun á hraðinnspýtingu og úttaki skipt máli fyrir kynslóðarlíkön. Bæta við: ( OWASP topp 10 fyrir LLM forrit , OWASP: Hraðinnspýting )

  • Reglur um hreinsun inntaks

  • úttakssíun þar sem við á

  • Verndargrindur fyrir verkfæraköll eða gagnagrunnsaðgerðir

Ekkert kerfi er fullkomið, en þú getur gert það minna brothætt.


11) Algengar gryfjur (einnig þekktar sem venjulegar gildrur) 🪤

Hér eru klassísku lögin:

Ef þú ert að lesa þetta og hugsar „já, við gerum tvö svona“, þá ertu velkominn í klúbbinn. Klúbburinn býður upp á snarl og væga streitu. 🍪


12) Samantekt - Hvernig á að setja upp gervigreindarlíkön án þess að missa vitið 😄✅

Innleiðing er þar sem gervigreind verður að raunverulegri vöru. Það er ekki glæsilegt, en það er þar sem traust er unnið.

Stutt samantekt

Og já, hvernig á að setja upp gervigreindarlíkön getur í fyrstu verið eins og að jonglera logandi keilukúlum. En þegar verkferillinn er orðinn stöðugur verður það undarlega ánægjulegt. Eins og að loksins skipuleggja óreiðukennda skúffu ... bara skúffan er framleiðsluumferð. 🔥🎳

Algengar spurningar

Hvað það þýðir að setja upp gervigreindarlíkan í framleiðslu

Að setja upp gervigreindarlíkan felur venjulega í sér miklu meira en að afhjúpa spáforritaskil. Í reynd felur það í sér að pakka líkaninu og tengslum þess, velja þjónunarmynstur (rauntíma, hópaforrit, straumspilun eða jaðarforrit), stækka með áreiðanleika, fylgjast með heilsu og reki og setja upp öruggar útfærslu- og afturfærsluleiðir. Traust útfærsla helst fyrirsjáanlega stöðug undir álagi og er greinanleg þegar eitthvað fer úrskeiðis.

Hvernig á að velja á milli rauntíma, hópútgáfu, straumspilunar eða jaðarútgáfu

Veldu dreifingarmynstur út frá því hvenær spár eru nauðsynlegar og þeim takmörkunum sem þú starfar undir. Rauntíma API-viðmót henta gagnvirkum upplifunum þar sem seinkun skiptir máli. Hópaeinkunn virkar best þegar tafir eru ásættanlegar og kostnaðarhagkvæmni leiðir. Streymi hentar fyrir samfellda atburðavinnslu, sérstaklega þegar merkingarfræði afhendingar verður erfið. Útfærsla á jaðri er tilvalin fyrir notkun án nettengingar, friðhelgi einkalífs eða kröfur um mjög lága seinkun, þó að uppfærslur og breytingar á vélbúnaði verði erfiðari að stjórna.

Hvaða útgáfu á að nota til að forðast að „virkar á fartölvunni minni“ uppsetningarvillur

Útgáfa meira en bara líkanþyngdir. Venjulega þarftu útgáfustýrða líkansgripi (þar á meðal táknagerðara eða merkimiðakort), forvinnslu og eiginleikarökfræði, ályktunarkóða og allt keyrsluumhverfið (Python/CUDA/kerfisbókasöfn). Meðhöndlið líkanið sem útgáfugrip með merkingum og léttum lýsigögnum sem lýsa væntingum um skema, matsskýringum og þekktum takmörkunum.

Hvort eigi að setja upp með einfaldri FastAPI-þjónustu eða sérstökum líkanþjóni

Einfaldur forritaþjónn (í stíl FastAPI) virkar vel fyrir snemmbúnar vörur eða einfaldar gerðir því þú heldur stjórn á leiðsögn, heimildum og samþættingu. Líkanþjónn (í stíl TorchServe eða NVIDIA Triton) getur veitt sterkari hópvinnslu, samhliða notkun og skilvirkni GPU strax úr kassanum. Mörg teymi lenda á blönduðu forriti: líkanþjónn fyrir ályktanir ásamt þunnu API-lagi fyrir heimildir, mótun beiðna og hraðatakmarkanir.

Hvernig á að bæta seinkun og afköst án þess að skerða nákvæmni

Byrjið á að mæla p95/p99 seinkun á framleiðslulíkum vélbúnaði með raunhæfum gagnamagni, þar sem litlar prófanir geta verið villandi. Algengar aðferðir eru meðal annars hópvinnsla (betri afköst, hugsanlega verri seinkun), magngreining (minni og hraðari, stundum með hóflegum nákvæmnisbreytingum), samantektar- og bestunarflæði (líkt og ONNX/TensorRT) og skyndiminni endurtekinna inntaks eða innfellinga. Sjálfvirk kvarðan byggð á biðraðardýpt getur einnig komið í veg fyrir að seinkun hala skríði upp á við.

Hvaða eftirlit er nauðsynlegt umfram „endapunkturinn er virkur“

Spennutími er ekki nóg, því þjónusta getur litið út fyrir að vera heilbrigð á meðan gæði spáa minnka. Að lágmarki skal fylgjast með fjölda beiðna, villutíðni og dreifingu seinkunar, auk mettunarmerkja eins og örgjörva/skjákorta/minni og biðtíma. Fyrir hegðun líkans skal fylgjast með dreifingu inntaks og úttaks ásamt grunn fráviksmerkjum. Bætið við rekprófum sem kalla fram aðgerðir frekar en hávaðasömum viðvörunum og skráið auðkenni beiðna, útgáfur líkans og niðurstöður skemaprófunar.

Hvernig á að setja nýjar útgáfur af gerðinni á öruggan hátt og endurheimta hana hratt

Meðhöndlið líkön eins og fullar útgáfur, með CI/CD leiðslu sem prófar forvinnslu og eftirvinnslu, keyrir samþættingarprófanir gegn „gullna settinu“ og setur álagsgrunnlínu. Fyrir útfærslur auka canary útgáfur umferð smám saman, en blue-green heldur eldri útgáfu virkri til að vera strax varaútgáfa. Skuggaprófanir hjálpa til við að meta nýja líkan á raunverulegri umferð án þess að hafa áhrif á notendur. Afturför ætti að vera fyrsta flokks aðferð, ekki eftiráhugsun.

Algengustu gildrurnar þegar lært er að nota gervigreindarlíkön

Skekkjandi þjálfunar- og framreiðsluferill er dæmigert tilfelli: forvinnsla er mismunandi milli þjálfunar og framleiðslu og afköstin versna hljóðlega. Annað algengt vandamál er vantar skemaprófun, þar sem breyting uppstreymis brýtur inntak á lúmskan hátt. Teymi vanmeta einnig seinkun á hala og ofmeta meðaltöl, horfa fram hjá kostnaði (óvirkar skjákort leggjast hratt saman) og sleppa afturvirkri áætlun. Að fylgjast aðeins með spenntíma er sérstaklega áhættusamt, því „upp en rangt“ getur verið verra en niður.

Heimildir

  1. Amazon Web Services (AWS) - Amazon SageMaker: Rauntímaályktun - docs.aws.amazon.com

  2. Amazon Web Services (AWS) - Amazon SageMaker hópumbreyting - docs.aws.amazon.com

  3. Amazon Web Services (AWS) - Amazon SageMaker líkanaeftirlit - docs.aws.amazon.com

  4. Amazon Web Services (AWS) - Takmörkun á beiðnum um API-gátt - docs.aws.amazon.com

  5. Amazon Web Services (AWS) - Leyndarmálastjóri AWS: Inngangur - docs.aws.amazon.com

  6. Amazon Web Services (AWS) - Líftími keyrsluumhverfis AWS Lambda - docs.aws.amazon.com

  7. Google Cloud - Vertex AI: Dreifa líkani á endapunkt - docs.cloud.google.com

  8. Google Cloud - Yfirlit yfir eftirlit með Vertex AI líkani - docs.cloud.google.com

  9. Google Cloud - Vertex AI: Eftirlit með skekkju og reki eiginleika - docs.cloud.google.com

  10. Google Cloud blogg - Gagnaflæði: nákvæmlega einu sinni á móti að minnsta kosti einu sinni streymisstillingum - cloud.google.com

  11. Google Cloud - Streymisstillingar Cloud Dataflow - docs.cloud.google.com

  12. Google SRE bókin - Eftirlit með dreifðum kerfum - sre.google

  13. Google rannsóknir - Halinn á stærðargráðunni - research.google

  14. LiteRT (Google AI) - LiteRT yfirlit - ai.google.dev

  15. LiteRT (Google AI) - LiteRT ályktun í tæki - ai.google.dev

  16. Docker - Hvað er gámur? - docs.docker.com

  17. Docker - Bestu starfshættir við smíði Docker - docs.docker.com

  18. Kubernetes - Kubernetes Secrets - kubernetes.io

  19. Kubernetes - Sjálfvirk stærðarbreyting láréttra hylkja - kubernetes.io

  20. Martin Fowler - Útgáfa Kanarífugla - martinfowler.com

  21. Martin Fowler - Blágræna dreifing - martinfowler.com

  22. OpenAPI frumkvæði - Hvað er OpenAPI? - openapis.org

  23. JSON skema - (vísað er til síðunnar) - json-schema.org

  24. Samskiptareglur - Yfirlit yfir samskiptareglur - protobuf.dev

  25. FastAPI - (vísað á síðu) - fastapi.tiangolo.com

  26. NVIDIA - Triton: Kvik hópvinnsla og samtímis líkanakeyrsla - docs.nvidia.com

  27. NVIDIA - Triton: Samhliða líkankeyrsla - docs.nvidia.com

  28. NVIDIA - Triton Inference Server skjöl - docs.nvidia.com

  29. PyTorch - TorchServe skjöl - docs.pytorch.org

  30. BentoML - Pökkun fyrir dreifingu - docs.bentoml.com

  31. Ray - Ray Serve skjöl - docs.ray.io

  32. TensorFlow - Kvantvæðing eftir þjálfun (TensorFlow líkanbestun) - tensorflow.org

  33. TensorFlow - TensorFlow gagnaprófun: greina skekkju í þjálfunar- og birtingarferli - tensorflow.org

  34. ONNX - (vísað er til síðunnar) - onnx.ai

  35. ONNX Runtime - Bestun líkana - onnxruntime.ai

  36. NIST (Þjóðarstofnun staðla og tækni) - NIST SP 800-122 - csrc.nist.gov

  37. arXiv - Líkanakort fyrir líkanaskýrslugerð - arxiv.org

  38. Microsoft - Skuggaprófanir - microsoft.github.io

  39. OWASP - OWASP topp 10 fyrir LLM umsóknir - owasp.org

  40. Öryggisverkefni OWASP GenAI - OWASP: Skjót innspýting - genai.owasp.org

Finndu nýjustu gervigreindina í opinberu versluninni fyrir gervigreindaraðstoðarmenn

Um okkur

Til baka á bloggið