Ste se kdaj praskali po glavi in se spraševali ... od kod pravzaprav prihajajo te stvari ? Mislim, umetna inteligenca ne brska po prašnih knjižničnih policah ali skrivaj gleda kratkih videoposnetkov na YouTubu. Pa vendar nekako najde odgovore na vse – od trikov za lazanjo do fizike črnih lukenj – kot da bi imela v sebi neko brezdno omaro za dokumente. Resničnost je bolj čudna in morda bolj zanimiva, kot bi si mislili. Pa jo malo razvozlajmo (in ja, morda med potjo razbijmo še nekaj mitov).
Je to čarovništvo? 🌐
Ni čarovništvo, čeprav se včasih tako zdi. Kar se dogaja pod pokrovom, je v bistvu napovedovanje vzorcev . Veliki jezikovni modeli (LLM) ne shranjujejo dejstev tako, kot se vaši možgani oklepajo babičinega recepta za piškote; namesto tega so usposobljeni, da ugibajo naslednjo besedo (žeton) na podlagi tega, kar je bilo prej [2]. V praksi to pomeni, da se oklepajo odnosov: katere besede so povezane, kako se stavki običajno oblikujejo, kako so celotne ideje zgrajene kot oder. Zato se izhod sliši pravilno, čeprav – popolnoma iskreno – gre za statistično mimikrijo, ne za razumevanje [4].
Kaj torej dejansko naredi informacije, ki jih ustvari umetna inteligenca, uporabne ? Nekaj stvari:
-
Raznolikost podatkov – črpanje iz neštetih virov, ne iz enega ozkega toka.
-
Posodobitve - brez ciklov osveževanja se hitro zastari.
-
Filtriranje - idealno lovljenje smeti, preden pronicajo noter (čeprav, bodimo realni, ta mreža ima luknje).
-
Navzkrižno preverjanje – zanašanje na avtoritativne vire (pomislite na NASO, SZO, večje univerze), kar je nujno v večini priročnikov o upravljanju umetne inteligence [3].
Vseeno pa si včasih samozavestno izmišljuje. Te tako imenovane halucinacije ? V bistvu izpiljene neumnosti, izrečene z resnim obrazom [2][3].
Članki, ki jih boste morda želeli prebrati po tem:
🔗 Ali lahko umetna inteligenca napove številke loterije
Raziskovanje mitov in dejstev o napovedih loterij z umetno inteligenco.
🔗 Kaj pomeni celosten pristop k umetni inteligenci
Razumevanje umetne inteligence z uravnoteženimi perspektivami glede etike in vpliva.
🔗 Kaj pravi Sveto pismo o umetni inteligenci
Preučevanje biblijskih perspektiv o tehnologiji in stvarjenju človeka.
Hitra primerjava: Od kod črpa umetna inteligenca 📊
Niso vsi viri enaki, vendar vsak igra svojo vlogo. Tukaj je kratek pregled.
| Vrsta vira | Kdo ga uporablja (AI) | Cena/vrednost | Zakaj deluje (ali ne ...) |
|---|---|---|---|
| Knjige in članki | Veliki jezikovni modeli | Neprecenljivo (ali približno) | Gosto, strukturirano znanje se preprosto hitro postara. |
| Spletne strani in blogi | Skoraj vse umetne inteligence | Prosto (s hrupom) | Divja sorta; mešanica briljantnosti in popolne zaničljivosti. |
| Akademski članki | Umetne inteligence, ki zahtevajo veliko raziskav | Včasih plačljivo | Strogost + verodostojnost, vendar zavito v težki žargon. |
| Uporabniški podatki | Prilagojene umetne inteligence | Zelo občutljivo ⚠️ | Ostro krojenje, a veliko težav z zasebnostjo. |
| Splet v realnem času | Umetne inteligence, povezane z iskanjem | Brezplačno (če je na spletu) | Ohranja informacije sveže; slaba stran je tveganje za širjenje govoric. |
Vesolje podatkov o usposabljanju 🌌
To je faza »učenja v otroštvu«. Predstavljajte si, da otroku naenkrat milijone javno dostopne podatke, licencirane vire in besedilo, ki ga ustvari trener [2].
Na vrhu: izbrani človeški primeri – dobri odgovori, slabi odgovori, spodbude v pravo smer – še preden se okrepitev sploh začne [1].
Opozorilo glede preglednosti: podjetja ne razkrijejo vseh podrobnosti. Nekatera varovala so zaupnost (intelektualna lastnina, varnostni pomisleki), zato dobite le delni vpogled v dejansko dogajanje [2].
Iskanje v realnem času: Dodatni preliv 🍒
Nekateri modeli lahko zdaj pogledajo izven svojega učnega mehurčka. To je generiranje z razširjenim iskanjem (RAG) – v bistvu črpa dele iz živega indeksa ali shrambe dokumentov in jih nato vpleta v odgovor [5]. Idealno za hitro spreminjajoče se stvari, kot so naslovi novic ali cene delnic.
Težava? Internet je v enakih delih genialnost in požar smeti. Če so filtri ali preverjanja izvora šibki, tvegate, da se bodo neželeni podatki prikradili nazaj – natanko to, na kar opozarjajo okviri za ocenjevanje tveganj [3].
Pogosta rešitev: podjetja modele povezujejo s svojimi internimi bazami podatkov, zato odgovori navajajo trenutno kadrovsko politiko ali posodobljen dokument o izdelku, namesto da bi se pretvarjali. Pomislite: manj trenutkov »oh«, več zaupanja vrednih odgovorov.
Natančna nastavitev: Korak poliranja umetne inteligence 🧪
Surovi, prednaučeni modeli so nerodni. Zato jih je treba natančno nastaviti :
-
Učenje, da so koristni, neškodljivi in pošteni (z učenjem s krepitvijo iz človeških povratnih informacij, RLHF) [1].
-
Brušenje nevarnih ali strupenih robov (poravnava) [1].
-
Prilagajanje tona – pa naj bo ta prijazen, formalen ali igrivo sarkastičen.
Ne gre toliko za poliranje diamanta, temveč za to, da se statistični plaz sprevrže v vedenje, ki je bolj podobno sogovorniku.
Neuspehi in težave 🚧
Ne pretvarjajmo se, da je brezhibno:
-
Halucinacije - ostri odgovori, ki so popolnoma napačni [2][3].
-
Pristranskost – odraža vzorce, vdelane v podatke; če jih ne nadzorujemo, jih lahko celo okrepi [3][4].
-
Brez izkušenj iz prve roke - lahko govori o receptih za juhe, vendar jih še nikoli ni poskusil [4].
-
Prevelika samozavest - besedilo teče, kot da ve, tudi ko ne. Okviri tveganja poudarjajo označevanje predpostavk [3].
Zakaj se zdi kot da vem 🧠
Nima prepričanj, nima spomina v človeškem smislu in zagotovo nima jaza. Ker pa stavke gladko povezuje, vaši možgani to berejo, kot da bi razumeli . Kar se dogaja, je le obsežno napovedovanje naslednjega žetona : obdelava bilijonov verjetnosti v delčkih sekunde [2].
Vzdušje »inteligence« je emergentno vedenje – raziskovalci ga nekoliko v šali imenujejo »stohastične papige« [4].
Analogija za otroke 🎨
Predstavljajte si papigo, ki je prebrala vse knjige v knjižnici. Zgodb sicer ne razume , a besede lahko predela v nekaj, kar se zdi modro. Včasih je to popolno, včasih pa neumno – ampak z dovolj bistroumnosti ne morete vedno opaziti razlike.
Za konec: Od kod prihajajo informacije o umetni inteligenci 📌
Povedano preprosto:
-
Obsežni podatki o usposabljanju (javni + licencirani + podatki, ki jih ustvarijo trenerji) [2].
-
Natančno uglaševanje s človeškimi povratnimi informacijami za oblikovanje tona/vedenja [1].
-
Sistemi za pridobivanje podatkov , ko so priključeni na tokove podatkov v živo [5].
Umetna inteligenca ne »ve« stvari – napoveduje besedilo . To je hkrati njena supermoč in Ahilova peta. Bistvo? Vedno preverite pomembne stvari z zaupanja vrednim virom [3].
Reference
-
Ouyang, L. et al. (2022). Usposabljanje jezikovnih modelov za sledenje navodilom s človeškimi povratnimi informacijami (InstructGPT) . arXiv .
-
OpenAI (2023). Tehnično poročilo GPT-4 – mešanica licenciranih, javnih in človeško ustvarjenih podatkov; cilj in omejitve napovedi naslednjega žetona. arXiv .
-
NIST (2023). Okvir za upravljanje tveganj umetne inteligence (AI RMF 1.0) – izvor, zaupanja vreden nadzor in nadzor tveganj. PDF .
-
Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). O nevarnostih stohastičnih papig: Ali so lahko jezikovni modeli preveliki? PDF .
-
Lewis, P. et al. (2020). Generiranje z razširjenim iskanjem za NLP, ki temelji na znanju . arXiv .