Hvað er AI þjálfari?

Hvað er AI þjálfari?

Gervigreind líður stundum næstum eins og töfrabrögð. Þú slærð inn handahófskennda spurningu og bam - fágað og glæsilegt svar birtist á nokkrum sekúndum. En hér er ferillinn: á bak við hverja „snilldar“vél eru raunverulegir einstaklingar sem ýta við, leiðrétta og móta hana á leiðinni. Þetta fólk er kallað gervigreindarþjálfari og vinnan sem þeir vinna er undarlegri, fyndnari og heiðarlega mannlegri en flestir halda.

Við skulum skoða hvers vegna þessir þjálfarar skipta máli, hvernig daglegt líf þeirra lítur í raun út og hvers vegna þetta hlutverk er að springa hraðar út en nokkurn hafði spáð.

Greinar sem þú gætir viljað lesa eftir þessa:

🔗 Hvað er gervigreindararbitrage: Sannleikurinn á bak við tískuorðið
Útskýrir gervigreindarhömlun, áhættu hennar, ávinning og algengar misskilninga.

🔗 Kröfur um gagnageymslu fyrir gervigreind: Það sem þú þarft virkilega að vita
Nær yfir geymsluþarfir, stigstærð og skilvirkni fyrir gervigreindarkerfi.

🔗 Hver er faðir gervigreindar?
Kannar frumkvöðla gervigreindar og uppruna hennar.


Hvað einkennir traustan gervigreindarþjálfara? 🏆

Þetta er ekki vinna þar sem maður þarf að troða í takkana. Bestu þjálfararnir reiða sig á nokkuð undarlega blöndu af hæfileikum:

  • Þolinmæði (mikil) - Fyrirsætur læra ekki í einni tilraun. Þjálfarar halda áfram að beita sömu leiðréttingunum þar til þær festast.

  • Að greina blæbrigði - Að greina kaldhæðni, menningarlegt samhengi eða hlutdrægni er það sem gefur mannlegri endurgjöf sína forskot [1].

  • Einföld samskipti - Helmingur verksins er að skrifa skýrar leiðbeiningar sem gervigreindin getur ekki misskilið.

  • Forvitni + siðfræði - Góður þjálfari veltir fyrir sér hvort svar sé „staðreyndalega rétt“ en félagslega óskýrt - meginþema í eftirliti með gervigreind [2].

Einfaldlega sagt: þjálfari er að hluta til kennari, að hluta til ritstjóri og að hluta til siðfræðingur.


Hlutverk gervigreindarþjálfara í hnotskurn (með nokkrum sérkennum 😉)

Tegund hlutverks Hver passar best Dæmigert laun Af hverju það virkar (eða virkar ekki)
Gagnamerkingarforrit Fólk sem elskar fínar smáatriði Lágt–Miðlungs $$ Algjörlega nauðsynlegt; ef merkingar eru ósæmilegar, þá þjáist allt líkanið [3] 📊
Sérfræðingur í RLHF Rithöfundar, ritstjórar, greinendur Miðlungs–Hátt $$ Raðar og endurskrifar svör til að samræma tón og skýrleika við væntingar manna [1]
Lénþjálfari Lögfræðingar, læknar, sérfræðingar Um allt landakortið 💼 Tekur á sér sérhæfð fagmál og jaðarmál fyrir kerfi sem eru sértæk fyrir atvinnugreinina
Öryggisskoðunarmaður Siðferðilega sinnað fólk Miðlungs $$ Beitir leiðbeiningum svo gervigreind forðist skaðlegt efni [2][5]
Skapandi þjálfari Listamenn, sögumenn Ófyrirsjáanlegt 💡 Hjálpar gervigreind að enduróma ímyndunaraflið en halda sig innan öruggra marka [5]

(Já, sniðið er svolítið flókið - eins og verkið sjálft.)


Dagur í lífi gervigreindarþjálfara

Hvernig lítur þá raunverulega vinnan út? Hugsaðu um minna glæsilega forritun og meira:

  • Að raða svörum sem skrifuð eru með gervigreind frá verstu til bestu (hefðbundið RLHF skref) [1].

  • Að laga ruglinga (eins og þegar líkanið gleymir að Venus er ekki Mars).

  • Endurskrifa svör frá spjallþjónum svo þau hljómi eðlilegri.

  • Að merkja fjöll af texta, myndum eða hljóði - þar sem nákvæmni skiptir miklu máli [3].

  • Umræða um hvort „tæknilega rétt“ sé nógu gott eða hvort öryggisleiðbeiningar eigi að víkja fyrir [2].

Þetta er að hluta til púsluspil og að hluta til þraut. Ímyndaðu þér að kenna páfagauk ekki bara að tala heldur að hætta að nota orð sem eru aðeins röng - þannig er stemningin. 🦜


Af hverju þjálfarar skipta miklu meira máli en þú heldur

Án mannastýringar myndi gervigreind:

  • Hljóðið stíft og vélrænt.

  • Dreifing hlutdrægni óheft (ógnvekjandi hugsun).

  • Vantar alveg húmor eða samkennd.

  • Vertu minna öruggur í viðkvæmum aðstæðum.

Þjálfarar eru þeir sem laumast inn „óreiðukennda mannlega hluti“ - slangur, hlýju, einstaka klaufalega myndlíkingu - en nota jafnframt öryggisgrindur til að tryggja öryggi [2][5].


Hæfni sem skiptir raunverulega máli

Gleymdu goðsögninni um að þú þurfir doktorsgráðu. Það sem hjálpar mest er:

  • Ritun + ritstjórn - Fægður en eðlilegur texti [1].

  • Greiningarhugsun - Að koma auga á endurtekin mistök í líkani og fínstilla þau.

  • Menningarvitund - Að vita hvenær orðalag gæti farið úrskeiðis [2].

  • Þolinmæði - Vegna þess að gervigreindin nær ekki strax tökum á málum.

Aukastig fyrir fjöltyngda færni eða sérþekkingu á sérstökum sviðum.


Þar sem þjálfarar mæta 🌍

Þetta starf snýst ekki bara um spjallþjóna - það læðist inn í alla geira:

  • Heilbrigðisþjónusta - Að skrifa skýringarreglur fyrir jaðartilvik (endurtekið í leiðbeiningum um gervigreind í heilbrigðisþjónustu) [2].

  • Fjármál - Þjálfun kerfa til að uppgötva svik án þess að fólk kæfi í falskum viðvörunum [2].

  • Smásala - Að kenna aðstoðarmönnum að tileinka sér slangurlegt kaupendamál en halda sig við vörumerkistóninn [5].

  • Menntun - Að móta kennslubotta þannig að þeir séu hvetjandi í stað þess að vera yfirlætislegir [5].

Í grundvallaratriðum: ef gervigreind á sæti við borðið, þá er þjálfari að fela sig í bakgrunni.


Siðfræðihlutinn (get ekki sleppt þessu)

Hér verður þetta mikilvægt. Ef gervigreind er ekki tekin í notkun endurtekur hún staðalímyndir, rangfærslur eða verra. Þjálfarar stöðva það með því að nota aðferðir eins og RLHF eða stjórnarskrárreglur sem stýra líkönum í átt að gagnlegum, skaðlausum svörum [1][5].

Dæmi: ef spjallþjónn sendir hlutdrægar starfstillögur, þá flaggar þjálfari það, endurskrifar reglubókina og tryggir að það gerist ekki aftur. Það er eftirlit í verki [2].


Ekki svo skemmtilega hliðin

Þetta er ekki allt glansandi. Þjálfarar takast á við:

  • Einhæfni - Endalausar merkingar verða gamlar.

  • Tilfinningaleg þreyta - Að skoða skaðlegt eða óþægilegt efni getur tekið sinn toll; stuðningskerfi eru mikilvæg [4].

  • Skortur á viðurkenningu - Notendur gera sér sjaldan grein fyrir tilvist þjálfara.

  • Stöðugar breytingar - Verkfæri þróast stöðugt, sem þýðir að þjálfarar verða að fylgjast með.

Samt sem áður heldur spennan við að móta „heila“ tækninnar mörgum föstum.


Falin MVP-verk gervigreindar

Hverjir eru þá þjálfarar í gervigreind? Þeir eru brúin á milli hrára reiknirita og kerfa sem virka fyrir fólk. Án þeirra væri gervigreind eins og bókasafn án bókasafnsfræðinga - fullt af upplýsingum, en næstum ómögulegt að nota.

Næst þegar spjallþjónn fær þig til að hlæja eða finnst þér ótrúlega „samstilltur“ skaltu þakka þjálfara. Þeir eru hljóðlátu verurnar sem láta vélar ekki bara reikna, heldur tengjast [1][2][5].


Heimildir

[1] Ouyang, L. o.fl. (2022). Þjálfun tungumálalíkana til að fylgja leiðbeiningum með mannlegri endurgjöf (InstructGPT). NeurIPS. Tengill

[2] NIST (2023). Rammi fyrir áhættustjórnun gervigreindar (AI RMF 1.0). Tengill

[3] Northcutt, C. o.fl. (2021). Algengar merkingarvillur í prófunarsöfnum gera vélanámsviðmið óstöðug. NeurIPS gagnasöfn og viðmið. Tengill

[4] Alþjóðaheilbrigðismálastofnunin (WHO/ILO) (2022). Leiðbeiningar um geðheilsu á vinnustað. Tengill

[5] Bai, Y. o.fl. (2022). Stjórnskipuleg gervigreind: Skaðleysi frá endurgjöf gervigreindar. arXiv. Tengill


Finndu nýjustu gervigreindina í opinberu versluninni fyrir gervigreindaraðstoðarmenn

Um okkur

Til baka á bloggið