Hvernig virkar uppskalun gervigreindar

Hvernig virkar uppskalun gervigreindar?

Stutt svar: Uppskalun með gervigreind virkar þannig að líkan er þjálfað á pöruðum myndum í lágri og hárri upplausn og síðan er notað til að spá fyrir um trúverðugar auka pixla við uppskalun. Ef líkanið hefur séð svipaðar áferðir eða andlit í þjálfun getur það bætt við sannfærandi smáatriðum; ef ekki gæti það „ofskynjað“ gripi eins og geislabauga, vaxkennda húð eða flökt í myndbandi.

Lykilatriði:

Spá : Líkanið býr til trúverðug smáatriði, ekki tryggða endurgerð veruleikans.

Líkanval : CNN-sjónvarpsstöðvar eru yfirleitt stöðugri; GAN-sjónvarpsstöðvar geta litið skarpari út en eru í hættu á að finna upp eiginleika.

Gripaathuganir : Gætið að geislum, endurteknum áferðum, „næstum stöfum“ og plastkenndum andlitum.

Stöðugleiki myndbands : Notið tímabundnar aðferðir eða þið sjáið glimmer og rek milli ramma.

Notkun þar sem mikil áhætta er á verkefnum : Ef nákvæmni skiptir máli skal upplýsa um vinnslu og meðhöndla niðurstöður sem dæmi.

Hvernig virkar uppskalun gervigreindar? Upplýsingamynd.

Þú hefur sennilega séð þetta: lítil, stökk mynd breytist í eitthvað nógu skarpt til að prenta, streyma eða setja inn í kynningu án þess að hryllast. Það líður eins og að svindla. Og - á besta hátt - það er það eiginlega 😅

Svo, hvernig uppskalun gervigreindar virkar snýst um eitthvað nákvæmara en „tölvan eykur smáatriði“ (handbylgjuð) og nær „líkan spáir fyrir um trúverðuga hárri upplausnarbyggingu byggða á mynstrum sem hún lærði af mörgum dæmum“ ( Djúpnám fyrir ofurupplausn mynda: Könnun ). Þetta spáskref er allur leikurinn - og þess vegna getur uppskalun gervigreindar litið stórkostlega út ... eða svolítið plastkennt ... eða eins og kötturinn þinn hafi ræktað auka viskastykki.

Greinar sem þú gætir viljað lesa eftir þessa:

🔗 Hvernig gervigreind virkar
Lærðu grunnatriði líköna, gagna og ályktana í gervigreind.

🔗 Hvernig gervigreind lærir
Sjáðu hvernig þjálfunargögn og endurgjöf bæta afköst líkansins með tímanum.

🔗 Hvernig gervigreind greinir frávik
Skilja grunnlínur mynstra og hvernig gervigreind flaggar óvenjulega hegðun fljótt.

🔗 Hvernig gervigreind spáir fyrir um þróun
Kannaðu spáaðferðir sem greina merki og sjá fyrir um framtíðareftirspurn.


Hvernig uppskalun gervigreindar virkar: kjarnahugmyndin, í daglegu tali 🧩

Uppskalun þýðir að auka upplausn: fleiri pixlar, stærri mynd. Hefðbundin uppskalun (eins og tvírúmsuppskalun) teygir í grundvallaratriðum pixla og sléttir umskipti ( tvírúmsuppskalun ). Það er í lagi, en það getur ekki búið til nýjar upplýsingar - það bara innskotar.

Uppskalun gervigreindar reynir eitthvað djarfara (einnig þekkt sem „ofurupplausn“ í rannsóknarheiminum) ( Djúpnám fyrir ofurupplausn mynda: Könnun ):

  • Það lítur á lágupplausnarinntakið

  • Þekkir mynstur (kanta, áferð, andlitsdrætti, textastrik, vefnað efnis…)

  • Spáir fyrir um hvernig útgáfa í hærri upplausn ætti að líta út

  • Býr til auka pixlagögn sem passa við þessi mynstur

Ekki „endurheimta raunveruleikann fullkomlega“, frekar eins og „gera mjög trúverðuga ágiskun“ ( Mynd Ofurupplausn Með Djúpum Fléttunarnetum (SRCNN) ). Ef það hljómar svolítið grunsamlegt, þá hefurðu ekki rangt fyrir þér - en það er líka ástæðan fyrir því að þetta virkar svona vel 😄

Og já, þetta þýðir að uppskalun með gervigreind er í grundvallaratriðum stýrð ofskynjun ... en á afkastamiklan hátt sem virðir pixla.


Hvað gerir uppskalun með gervigreind góða? ✅🛠️

Ef þú ert að dæma um uppskalun á gervigreind (eða forstillingu), þá er þetta það sem skiptir mestu máli:

  • Endurheimt smáatriða án ofeldunar.
    Góð uppskalun gefur stökkleika og áferð, ekki stökkt hávaða eða fölsuð svitaholur.

  • Agi á brúnum.
    Hreinar línur haldast hreinar. Slæmar gerðir láta brúnir vagga eða mynda geisla.

  • Áferðarraunsæi
    Hár ætti ekki að verða að pensilstroki. Múrsteinn ætti ekki að verða að endurteknu mynstri.

  • Meðhöndlun hávaða og þjöppunar.
    Margar daglegar myndir eru JPEG-skráðar í hel. Góður myndskalari magnar ekki upp þann skaða ( Real-ESRGAN ).

  • Andlits- og textavitund
    Andlit og texti eru auðveldast að greina mistök. Góðar fyrirsætur meðhöndla þau varlega (eða nota sérhæfða stillingu).

  • Samræmi á milli ramma (fyrir myndband)
    Ef smáatriði blikka ramma fyrir ramma munu augun þín öskra. Uppskalun myndbands lifir eða deyr eftir tímabundnum stöðugleika ( BasicVSR (CVPR 2021) ).

  • Stjórntæki sem eru skynsamleg.
    Þú vilt rennistikur sem tengjast raunverulegum útkomum: suðhreinsun, óskýrleika, fjarlægingu gripa, korngeymslu, skerpingu… það hagnýta.

Ein róleg regla sem heldur sér: „besta“ uppskalunin er oft sú sem maður tekur varla eftir. Það lítur bara út fyrir að þú hafir átt betri myndavél til að byrja með 📷✨


Samanburðartafla: vinsælir möguleikar á uppskalun gervigreindar (og hvað þeir eru góðir fyrir) 📊🙂

Hér að neðan er hagnýtur samanburður. Verð eru vísvitandi óljós því verkfæri eru mismunandi eftir leyfum, pakka, reiknikostnaði og öllu því skemmtilega.

Tól / Aðferð Best fyrir Verðstemning Af hverju það virkar (í grófum dráttum)
Skjáborðsuppskalarar í stíl Topaz ( Topaz Photo , Topaz Video ) Myndir, myndbönd, einfalt vinnuflæði Greitt-í-lagi Sterkar almennar gerðir + mikil stilling, virkar yfirleitt bara…
Eiginleikar af gerðinni „Super Resolution“ í Adobe ( Adobe Enhance > Super Resolution ) Ljósmyndarar sem eru þegar í því vistkerfi Áskrift-y Endurgerð á traustum smáatriðum, yfirleitt íhaldssöm (minni dramatík)
Raunverulegt-ESRGAN / ESRGAN afbrigði ( Raunverulegt-ESRGAN , ESRGAN ) DIY, forritarar, hópvinnur Ókeypis (en tímafrekt) Frábær í áferðarsmáatriðum, getur verið sterkt í andliti ef þú ert ekki varkár
Dreifingarbundin uppskalunarstilling ( SR3 ) Skapandi verk, stílfærð niðurstaða Blandað Getur skapað falleg smáatriði - getur líka fundið upp bull, svo… já
Leikjauppskalarar (í DLSS/FSR-stíl) ( NVIDIA DLSS , AMD FSR 2 ) Rauntímaspilun og flutningur Í pakka Notar hreyfigögn og lærðar fyrri mælingar - sléttur árangur og sigur 🕹️
Þjónusta við uppskalun í skýinu Þægindi, skjótir sigrar Greitt fyrir hverja notkun Hratt og sveigjanlegt, en þú skiptir á stjórn og stundum fínleika
Myndbandsmiðaðar gervigreindaruppskalarar ( BasicVSR , Topaz Video ) Gamalt myndefni, anime, skjalasöfn Greitt-í-lagi Tímabundin brellur til að draga úr flökti + sérhæfð myndbandslíkön
Uppskalun á „snjallsíma“/myndasafni Tilfallandi notkun Innifalið Léttar gerðir stilltar fyrir ánægjulega framleiðslu, ekki fullkomnun (ennþá handhægar)

Játning um sniðsérkenni: „Paid-ish“ er að vinna mikið í þeirri töflu. En þið skiljið hvað ég á við 😅


Stóra leyndarmálið: líkön læra vörpun frá lágupplausn til hárrar upplausnar 🧠➡️🖼️

Kjarninn í flestum uppskalunum gervigreindar er stýrt námskerfi ( Mynd Ofurupplausn Með Djúpum Föllunarnetum (SRCNN) ):

  1. Byrjaðu með myndum í hárri upplausn („sannleikurinn“)

  2. Minnkaðu úrtakið í útgáfur með lágri upplausn („inntakið“)

  3. Þjálfa líkan til að endurskapa upprunalegu háupplausnina úr lágupplausninni

Með tímanum lærir líkanið fylgni eins og:

  • „Þessi tegund af óskýrleika í kringum augað tilheyrir venjulega augnhárum.“

  • „Þessi pixlaþyrping gefur oft til kynna serif-texta“

  • „Þessi brúnhalli lítur út eins og þaklína, ekki handahófskennd hávaði“

Þetta snýst ekki um að leggja á minnið ákveðnar myndir (í einföldu máli), heldur um að læra tölfræðilega uppbyggingu ( Djúpnám fyrir ofurupplausn mynda: Könnun ). Hugsaðu um þetta eins og að læra málfræði áferðar og brúna. Ekki ljóðamálfræði, frekar eins og ... IKEA handbókarmálfræði 🪑📦 (klaufaleg myndlíking, en samt nógu nálægt).


Aðalatriðin: hvað gerist við ályktun (þegar þú uppskalar) ⚙️✨

Þegar þú setur mynd inn í gervigreindaruppskalara, þá er leiðsla yfirleitt svona:

  • Forvinnsla

  • Eiginleikaútdráttur

    • Snemma lög greina brúnir, horn, halla

    • Dýpri lög greina mynstur: áferð, form, andlitsþætti

  • Endurbygging

    • Líkanið býr til eiginleikakort í hærri upplausn

    • Breytir því síðan í raunverulega pixlaúttak

  • Eftirvinnsla

    • Valfrjáls skerping

    • Valfrjáls hávaðaminnkun

    • Valfrjáls hindrun á gripum (hringingar, geislar, blokkun)

Eitt fínt smáatriði: mörg verkfæri stækka flísar og blanda síðan saman samskeytum. Frábær verkfæri fela flísamörk. Meh verkfæri skilja eftir dauf ristamerki ef þú horfir á þau. Og já, þú munt horfir á þau, því mannfólkið elskar að skoða smávægileg ófullkomleika með 300% aðdrátt eins og litlir gremlínar 🧌


Helstu líkanfjölskyldurnar sem notaðar eru til uppskalunar á gervigreind (og hvers vegna þær virðast öðruvísi) 🤖📚

1) Ofurupplausn byggð á CNN (klassíski vinnuhesturinn)

Falsunartauganet eru frábær fyrir staðbundin mynstur: brúnir, áferð, litlar strúktúrar ( Mynd ofurupplausn með djúpum falsunarnetum (SRCNN) ).

  • Kostir: hraður, stöðugur, færri óvæntar uppákomur

  • Ókostir: getur virst svolítið „unnið“ ef ýtt er hart á það

2) GAN-byggð uppskalun (ESRGAN-stíll) 🎭

GAN (Generative Adversarial Networks) þjálfa rafal til að framleiða hágæða myndir sem greinirtæki getur ekki greint frá raunverulegum myndum ( Generative Adversarial Networks ).

  • Kostir: kraftmikil smáatriði, áhrifamikil áferð

  • Ókostir: getur fundið upp smáatriði sem voru ekki til staðar - stundum rangt, stundum óhugnanlegt ( SRGAN , ESRGAN )

GAN getur gefið þér þessa skarpleika sem þú getur ekki annað en að vekja athygli. Það getur líka gefið viðfangsefninu þínu auka augabrún. Svo ... veldu þínar bardaga 😬

3) Dreifingarbundin uppskalun (skapandi alhliða tákn) 🌫️➡️🖼️

Dreifingarlíkön fjarlægja suð skref fyrir skref og hægt er að leiðbeina þeim til að framleiða hágæða smáatriði ( SR3 ).

  • Kostir: getur verið ótrúlega góður í trúverðugum smáatriðum, sérstaklega fyrir skapandi verk

  • Ókostir: getur fjarlægt upprunalega auðkenni/uppbyggingu ef stillingarnar eru árásargjarnar ( SR3 )

Þetta er þar sem „uppskalun“ byrjar að blandast saman við „endurhugsun“. Stundum er það nákvæmlega það sem þú vilt. Stundum ekki.

4) Uppskalun myndbands með tímabundinni samræmi 🎞️

Uppskalun myndbanda bætir oft við hreyfivitundarrökfræði:

  • Notar nágrannaramma til að stöðuga smáatriði ( BasicVSR (CVPR 2021) )

  • Reynir að forðast flökt og skriðandi gripi

  • Sameinar oft ofurupplausn með suðhreinsun og fléttun úr hávaða ( Topaz myndband )

Ef uppskalun mynda er eins og að endurgera eitt málverk, þá er uppskalun myndbanda eins og að endurgera bók án þess að nef persónunnar breyti um lögun á hverri síðu. Sem er ... erfiðara en það hljómar.


Af hverju uppskalun gervigreindar lítur stundum út fyrir að vera fölsuð (og hvernig á að greina hana) 👀🚩

Uppskalun gervigreindar mistekst á greinilegan hátt. Þegar þú hefur lært mynstrin muntu sjá þau alls staðar, eins og að kaupa nýjan bíl og skyndilega taka eftir þeirri gerð á hverri götu 😵💫

Algengt segir:

  • Vaxhúð í andliti (of mikil hávaðahreinsun + sléttun)

  • Ofskertir geislar í kringum brúnir (klassískt „yfirskotssvæði“) ( tvíkubísk innskot )

  • Endurteknar áferðir (múrsteinsveggir verða að afritunar- og límamynstrum)

  • Stökkt ör-andstæða sem öskrar „reiknirit“

  • Textamismunun þar sem stafir verða næstum því að bókstöfum (af verstu gerðinni)

  • Smáatriði þar sem smáatriði breytast lítillega, sérstaklega í dreifingarvinnuflæði ( SR3 )

Það erfiða er að stundum líta þessir hlutir „betur“ út í fljótu bragði. Heilinn þinn hefur gaman af skerpu. En eftir smá stund finnst honum það… rangt.

Góð aðferð er að minnka myndina og athuga hvort hún líti eðlilega út í venjulegri fjarlægð. Ef hún lítur bara vel út í 400% aðdrátt, þá er það ekki sigur, það er áhugamál 😅


Hvernig uppskalun gervigreindar virkar: þjálfunarhliðin, án stærðfræðihöfuðverksins 📉🙂

Þjálfun ofurupplausnarlíkana felur venjulega í sér:

Algengar tegundir taps:

Það er stöðug togstreita:

  • Gerðu það trútt upprunalega
    vs.

  • Gerðu það sjónrænt ánægjulegt

Mismunandi verkfæri lenda á mismunandi stöðum á því litrófi. Og þú gætir kosið eitt þeirra eftir því hvort þú ert að endurheimta fjölskyldumyndir eða undirbúa veggspjald þar sem „snyrtilegt“ skiptir meira máli en nákvæmni í réttarmeinafræði.


Hagnýt vinnuferli: myndir, gamlar skannanir, anime og myndbönd 📸🧾🎥

Myndir (andlitsmyndir, landslagsmyndir, vörumyndir)

Besta starfshættir eru venjulega:

  • Væg hávaðaminnkun fyrst (ef þörf krefur)

  • Uppskalað með íhaldssömum stillingum

  • Bætið við korni ef hlutirnir eru of mjúkir (já, virkilega)

Korn er eins og salt. Of mikið eyðileggur kvöldmatinn, en ekkert af því getur smakkast svolítið flatt 🍟

Gamlar skannanir og mjög þjappaðar myndir

Þetta er erfiðara vegna þess að líkanið gæti meðhöndlað þjöppunarblokkir sem „áferð“.
Prófaðu:

  • Fjarlæging eða afblokkun gripa

  • Síðan uppskala

  • Svo létt skerping (ekki of mikil ... ég veit, allir segja það, en samt)

Anime og línulist

Línumyndir njóta góðs af:

  • Líkön sem varðveita hreinar brúnir

  • Minnkuð áferðarofskynjanir.
    Uppskalun á anime lítur oft vel út vegna þess að formin eru einfaldari og samræmd. (Heppni.)

Myndband

Myndband bætir við auka skrefum:

  • Hávaðadeyfing

  • Affléttun (fyrir ákveðnar heimildir)

  • Uppskalað

  • Tímabundin jöfnun eða stöðugleiki ( BasicVSR (CVPR 2021) )

  • Valfrjáls endurinnleiðing korns fyrir samheldni

Ef þú sleppir tímabundinni samræmi færðu þessa glitrandi smáatriði sem blikka. Þegar þú tekur eftir því geturðu ekki gleymt því. Eins og í pípandi stól í rólegu herbergi 😖


Að velja stillingar án þess að giska of mikið (lítill svindlmiði) 🎛️😵💫

Hér er góð byrjunarhugsun:

  • Ef andlit líta út fyrir að vera plastískt
    , minnkaðu hávaða, minnkaðu skerpu eða prófaðu líkan eða stillingu sem varðveitir andlit.

  • Ef áferðin lítur of sterk út,
    lækkaðu rennistikurnar fyrir „smáatriðisbætingu“ eða „endurheimta smáatriði“ og bættu við fíngerðri kornun á eftir.

  • Ef brúnirnar glóa,
    minnkið skerpu og athugið valkosti fyrir að bæla niður geisla.

  • Ef myndin lítur út fyrir að vera of „gervigreindarleg“
    skaltu fara íhaldssamari. Stundum er besta leiðin einfaldlega ... minna.

Einnig: ekki 8x uppskala bara af því að þú getur það. Hreint 2x eða 4x er oft besti kosturinn. Þar fyrir utan ertu að biðja fyrirsætuna að skrifa aðdáendasögur um pixlana þína 📖😂


Siðfræði, áreiðanleiki og vandræðalega spurningin um „sannleikann“ 🧭😬

Uppskalun gervigreindar þokar línunni:

  • Endurreisn felst í því að endurheimta það sem var til staðar

  • Að bæta við felur í sér að bæta við því sem ekki var til staðar

Með persónulegum myndum er það yfirleitt í lagi (og fallegt). Með blaðamennsku, lagalegum sönnunargögnum, læknisfræðilegri myndgreiningu eða hverju sem er þar sem trúverðugleiki skiptir máli ... þarf að vera varkár ( OSAC/NIST: Staðlaðar leiðbeiningar um réttarmeinafræðilega stafræna myndastjórnun , SWGDE leiðbeiningar um réttarmeinafræðilega myndgreiningu ).

Einföld regla:

  • Ef mikið er í húfi skal líta á uppskalun gervigreindar sem dæmigerða , ekki endanlega.

Einnig skiptir uppljóstrun máli í faglegum samhengi. Ekki vegna þess að gervigreind sé ill, heldur vegna þess að áhorfendur eiga skilið að vita hvort smáatriði voru endurgerð eða skráð. Það er bara ... virðing.


Lokaorð og stutt samantekt 🧡✅

Svona virkar uppskalun gervigreindar á eftirfarandi hátt: líkön læra hvernig smáatriði í hárri upplausn tengjast mynstrum í lágri upplausn og spá síðan fyrir um trúverðugar auka pixla við uppskalun ( Djúpnám fyrir ofurupplausn mynda: Könnun ). Eftir því hvaða líkanfjölskylda er um að ræða (CNN, GAN, dreifing, myndbandstíma) getur sú spá verið íhaldssöm og trú ... eða djörf og stundum óljós 😅

Stutt samantekt

Ef þú vilt, segðu mér hvað þú ert að uppskala (andlit, gamlar myndir, myndbönd, anime, textaskannanir), og ég skal leggja til stillingarstefnu sem forðast algengar „AI útlit“ gryfjur 🎯🙂


Algengar spurningar

Uppskalun gervigreindar og hvernig hún virkar

Uppskalun með gervigreind (oft kölluð „ofurupplausn“) eykur upplausn myndar með því að spá fyrir um vantar smáatriði í hárri upplausn úr mynstrum sem lærð eru við þjálfun. Í stað þess að teygja einfaldlega pixla eins og tvírúmsígild interpolering, rannsakar líkan brúnir, áferð, yfirborð og textalík strok og býr síðan til ný pixlagögn sem eru í samræmi við þessi lærðu mynstur. Það snýst minna um að „endurheimta raunveruleikann“ og meira um að „gera trúverðuga ágiskun“ sem lesist eins og náttúruleg.

Uppskalun með gervigreind samanborið við tvíkubíska eða hefðbundna stærðarbreytingu

Hefðbundnar uppskalunaraðferðir (eins og tvíkubísk) fella aðallega inn á milli núverandi pixla og slétta út breytingar án þess að skapa raunveruleg ný smáatriði. Markmið uppskalunar með gervigreind er að endurskapa trúverðuga uppbyggingu með því að þekkja sjónræn vísbendingar og spá fyrir um hvernig hágæða útgáfur af þessum vísbendingum líta út. Þess vegna geta niðurstöður gervigreindar virst mun skarpari og einnig geta þær bætt við gripum eða „fundið upp“ smáatriði sem voru ekki til staðar í upprunanum.

Af hverju andlit geta verið vaxkennd eða of slétt

Vaxkennd andlit koma venjulega frá öflugri suðahreinsun og sléttun ásamt skerpingu sem fjarlægir náttúrulega áferð húðarinnar. Mörg verkfæri meðhöndla suða og fína áferð á svipaðan hátt, þannig að „hreinsun“ á mynd getur eytt svitaholum og fíngerðum smáatriðum. Algeng aðferð er að draga úr suðahreinsun og skerpu, nota andlitsverndunarstillingu ef hún er til staðar og síðan bæta við smá kornmyndun svo að útkoman finnist minna plastleg og ljósmyndalegri.

Algengar uppskalunarbreytingar í gervigreind sem vert er að fylgjast með

Dæmigert lýsingarmerki eru meðal annars geislar í kringum brúnir, endurtekin áferðarmynstur (eins og afritunar- og límingarsteinar), stökkar ör-andstæður og texti sem breytist í „næstum því stafi“. Í dreifingarbundnum vinnuflæði er einnig hægt að sjá smáatriði þar sem smáatriði breytast lúmskt. Fyrir myndbönd eru flökt og smáatriði sem skríða yfir ramma stór viðvörunarmerki. Ef það lítur aðeins vel út við mikla aðdráttargetu eru stillingarnar líklega of árásargjarnar.

Hvernig niðurstöður GAN, CNN og dreifingaruppskalarar hafa tilhneigingu til að vera mismunandi

Ofurupplausn byggð á CNN er yfirleitt stöðugri og fyrirsjáanlegri, en getur virst „unnin“ ef mikið er á hana haldið. GAN-byggðir valkostir (í ESRGAN-stíl) framleiða oft kraftmeiri áferð og skynjaða skerpu, en þeir geta valdið ofskynjunum um röng smáatriði, sérstaklega á andlitum. Dreifingarbundin uppskalun getur skapað falleg og trúverðug smáatriði, en þau geta vikið frá upprunalegu uppbyggingunni ef leiðsögn eða styrkstillingar eru of sterkar.

Hagnýt stillingarstefna til að forðast „of gervigreindarlegt“ útlit

Byrjaðu íhaldssamt: minnkaðu um 2 eða 4 stig áður en þú grípur til öfgakenndra þátta. Ef andlit líta plastísk út skaltu draga úr hávaðaminnkun og skerpu og prófa andlitsvitundarstillingu. Ef áferðin verður of mikil skaltu minnka smáatriði og íhuga að bæta við fíngerðum kornum á eftir. Ef brúnir glóa skaltu draga úr skerpu og athuga hvort geislar eða gripir séu ekki lengur til staðar. Í mörgum ferli vinnur „minna“ því það varðveitir trúverðugan raunsæi.

Meðhöndlun á gömlum skönnuðum myndum eða mjög þjöppuðum JPEG-myndum áður en þær eru uppskalaðar

Þjappaðar myndir eru erfiðar því líkön geta meðhöndlað blokkargripi sem raunverulega áferð og magnað þá upp. Algengt vinnuflæði er að fjarlægja eða afblokka gripi fyrst, síðan uppskala og að lokum skerpa létt ef þörf krefur. Fyrir skannanir getur varkár hreinsun hjálpað líkaninu að einbeita sér að raunverulegri uppbyggingu frekar en skemmdum. Markmiðið er að draga úr „fölskum áferðarvísbendingum“ svo að sá sem uppskalar neyðist ekki til að gera öruggar ágiskanir út frá hávaðasömum inntaki.

Af hverju er erfiðara að uppskala myndbanda en ljósmynda

Uppskalun myndbands verður að vera samræmd á milli ramma, ekki bara góð á einni kyrrstöðu. Ef smáatriði blikka ramma fyrir ramma verður útkoman fljótt truflandi. Myndbandsmiðaðar aðferðir nota tímabundnar upplýsingar frá nágrannarömmum til að stöðuga endurgerð og forðast glitrandi artifacts. Mörg vinnuflæði fela einnig í sér suðhreinsun, fléttun úr ákveðnum heimildum og valfrjálsa endurinnsetningu korns svo að öll myndaröðin finnist samhangandi frekar en gervihúðuð.

Þegar uppskalun gervigreindar er ekki viðeigandi eða áhættusöm að reiða sig á hana

Uppskalun gervigreindar er best meðhöndluð sem úrbætur, ekki sönnunargögn. Í mikilvægum aðstæðum eins og blaðamennsku, lagalegum sönnunargögnum, læknisfræðilegri myndgreiningu eða réttarlæknisfræðilegri vinnu getur myndun „trúverðugra“ pixla verið villandi þar sem hún gæti bætt við smáatriðum sem ekki voru teknar. Öruggari rammi er að nota hann sem dæmi og sýna fram á að gervigreindarferli endurskapaði smáatriði. Ef nákvæmni er mikilvæg skal varðveita frumrit og skrá hvert vinnsluskref og stillingar.

Heimildir

  1. arXiv - Djúpnám fyrir ofurupplausn mynda: Könnun - arxiv.org

  2. arXiv - Ofurupplausn mynda með djúpum fellingarnetum (SRCNN) - arxiv.org

  3. arXiv - Raunverulegt ESRGAN - arxiv.org

  4. arXiv - ESRGAN - arxiv.org

  5. arXiv - SR3 - arxiv.org

  6. NVIDIA forritari - NVIDIA DLSS - developer.nvidia.com

  7. AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com

  8. Aðgangur að tölvusjónarstofnuninni (CVF) - BasicVSR: Leit að nauðsynlegum þáttum í ofurupplausn myndbanda (CVPR 2021) - openaccess.thecvf.com

  9. arXiv - Kynslóðabundin andstæð net - arxiv.org

  10. arXiv - SRGAN - arxiv.org

  11. arXiv - Skynjunartap (Johnson o.fl., 2016) - arxiv.org

  12. GitHub - Real-ESRGAN geymslurými (flísarvalkostir) - github.com

  13. Wikipedia - Tvíkubísk innskot - wikipedia.org

  14. Topaz Labs - Topaz Mynd - topazlabs.com

  15. Topaz Labs - Topaz myndband - topazlabs.com

  16. Hjálparmiðstöð Adobe - Adobe Enhance > Ofurupplausn - helpx.adobe.com

  17. NIST / OSAC - Staðlaðar leiðbeiningar um réttarmeinafræðilega stafræna myndastjórnun (útgáfa 1.0) - nist.gov

  18. SWGDE - Leiðbeiningar um réttarmeinafræðilega myndgreiningu - swgde.org

Finndu nýjustu gervigreindina í opinberu versluninni fyrir gervigreindaraðstoðarmenn

Um okkur

Til baka á bloggið