Kako deluje umetna inteligenca?

Umetna inteligenca se lahko zdi kot čarovniški trik, ki mu vsi prikimajo, medtem ko tiho razmišljajo ... počakajte, kako to pravzaprav deluje? Dobra novica. Demistificirali jo bomo brez odvečnih besed, ostali praktični in dodali nekaj nepopolnih analogij, ki še vedno delujejo logično. Če želite le bistvo, si oglejte spodnji enominutni odgovor; ampak iskreno, podrobnosti so tisto, kar vas spravi v poštev 💡.

Članki, ki jih boste morda želeli prebrati po tem:

🔗 Kaj pomeni kratica GPT
Kratek opis kratice GPT in njenega pomena.

🔗 Od kod umetna inteligenca dobiva svoje informacije
Viri, ki jih umetna inteligenca uporablja za učenje, usposabljanje in odgovarjanje na vprašanja.

🔗 Kako vključiti umetno inteligenco v vaše podjetje
Praktični koraki, orodja in poteki dela za učinkovito integracijo umetne inteligence.

🔗 Kako ustanoviti podjetje za umetno inteligenco
Od ideje do lansiranja: potrditev, financiranje, ekipa in izvedba.

Kako deluje umetna inteligenca? Odgovor v eni minuti ⏱️

Umetna inteligenca se uči vzorcev iz podatkov, da bi lahko napovedovala ali ustvarjala vsebino – ročno napisana pravila niso potrebna. Sistem vnese primere, s funkcijo izgub izmeri, kako napačen je, in prilagodi svoje notranje gumbe –parametre–, da so vsakič nekoliko manj napačni. Izperi, ponovi, izboljšaj. Z dovolj cikli postane uporaben. Ista zgodba velja ne glede na to, ali razvrščate e-pošto, odkrivate tumorje, igrate družabne igre ali pišete haikuje. Za preprosto osnovo »strojnega učenja« je IBM-ov pregled soliden [1].

Večina sodobne umetne inteligence je strojno učenje. Preprosta različica: vnos podatkov, učenje preslikave vhodnih podatkov v izhodne podatke in nato posploševanje na nove stvari. Ne magična matematika, računanje in, če smo iskreni, ščepec umetnosti.

"Kako deluje umetna inteligenca?" ✅

Ko ljudje v Googlu iščejo » Kako deluje umetna inteligenca?«, običajno želijo:

miselni model, ki mu lahko zaupajo, ki ga je mogoče ponovno uporabiti
zemljevid glavnih vrst učenja, da žargon ne bo več strašljiv
vpogled v nevronske mreže, ne da bi se izgubili
zakaj se zdi, da transformatorji zdaj vladajo svetu
praktični cevovod od podatkov do uvedbe
hitra primerjalna tabela, ki jo lahko posnamete in shranite
varovala glede etike, pristranskosti in zanesljivosti, ki niso neenakomerna

To boste tukaj dobili. Če se sprehajam, je to namerno – kot da bi se ubral po slikoviti poti in si naslednjič nekako bolje zapomnil ulice. 🗺️

Osnovne sestavine večine sistemov umetne inteligence 🧪

Predstavljajte si sistem umetne inteligence kot kuhinjo. Štiri sestavine se pojavljajo znova in znova:

Podatki – primeri z oznakami ali brez njih.
Model – matematična funkcija z nastavljivimi parametri.
Cilj – funkcija izgube, ki meri, kako slaba so ugibanja.
Optimizacija – algoritem, ki prilagaja parametre za zmanjšanje izgub.

Pri globokem učenju je ta spodbuda običajno gradientni spust s povratnim širjenjem– učinkovit način, da ugotovimo, kateri gumb na ogromni zvočni plošči je zaškripal, nato pa ga nekoliko zmanjšamo [2].

Mini primer: Krhek filter neželene pošte, ki temelji na pravilih, smo zamenjali z majhnim nadzorovanim modelom. Po tednu dni zank označevanje → merjenje → posodabljanje se je zmanjšalo število lažno pozitivnih rezultatov in število zahtevkov za podporo. Nič posebnega – le čistejši cilji (natančnost pri »amaterskih« e-poštnih sporočilih) in boljša optimizacija.

Učne paradigme na prvi pogled 🎓

Nadzorovano učenje.
Zagotovite vhodno-izhodne pare (fotografije z oznakami, e-poštna sporočila označena kot neželena pošta/ne neželena pošta). Model se uči vhod → izhod. Ozadje mnogih praktičnih sistemov [1].
Nenadzorovano učenje
Brez oznak. Poiščite strukturne skupine, kompresije, latentne faktorje. Odlično za raziskovanje ali predhodno učenje.
Samonadzorovano učenje
Model ustvarja lastne oznake (napoveduje naslednjo besedo, manjkajoči del slike). Pretvori surove podatke v učni signal v velikem obsegu; podpira sodobne jezikovne in vidne modele.
Učenje z okrepitvijo
Agent deluje, zbira nagradein se uči politike, ki maksimizira kumulativno nagrado. Če vam »funkcije vrednosti«, »politike« in »učenje časovnih razlik« zvenijo znano, je to njihov dom [5].

Da, kategorije se v praksi zamegljujejo. Hibridne metode so normalne. Resnično življenje je neurejeno; dober inženiring se s tem sreča tam, kjer je.

Znotraj nevronske mreže brez glavobola 🧠

Nevronska mreža zlaga plasti drobnih matematičnih enot (nevronov). Vsaka plast transformira vhode z utežmi, pristranskostmi in mehko nelinearnostjo, kot sta ReLU ali GELU. Zgodnje plasti se naučijo preprostih funkcij; globlje plasti kodirajo abstrakcije. »Čarobnost« – če jo lahko tako imenujemo – je kompozicija: z veriženjem majhnih funkcij lahko modelirate izjemno kompleksne pojave.

Vadbena zanka, samo vibracije:

ugibanje → merjenje napake → pripisovanje krivde prek povratnega propa → uteži pomika → ponovitev.

To storite v več serijah in model, podobno kot neroden plesalec, ki izboljšuje vsako pesem, ne bo več stopal na vaše prste. Za prijazno in natančno poglavje o podpori glejte [2].

Zakaj so transformatorji prevzeli oblast – in kaj »pozornost« pravzaprav pomeni 🧲

Transformatorji uporabljajo samopozornost , da hkrati pretehtajo, kateri deli vhodnega signala so pomembni drug za drugega. Namesto da bi stavek bral strogo od leve proti desni kot starejši modeli, lahko transformator pogleda povsod in dinamično oceni odnose – kot bi skeniral natrpan prostor, da bi videl, kdo se s kom pogovarja.

Ta zasnova je pri modeliranju zaporedij odpravila ponavljanje in konvolucije, kar je omogočilo masiven vzporedni razvoj in odlično skaliranje. Članek, ki je sprožil ta proces -Attention Is All You Need- predstavlja arhitekturo in rezultate [3].

Samopozornost v eni vrstici: ustvarite poizvedbe, ključain vrednosti za vsak žeton; izračunajte podobnosti za pridobitev uteži pozornosti; ustrezno zmešajte vrednosti. Natančno v podrobnostih, elegantno v duhu.

Pozor: Transformatorji prevladujejo, ne monopolizirajo. CNN, RNN in drevesni ansambli še vedno zmagajo pri določenih tipih podatkov in omejitvah zakasnitve/stroškov. Izberite arhitekturo za delo, ne pa pompa.

Kako deluje umetna inteligenca? Praktični cevovod, ki ga boste dejansko uporabili 🛠️

Oblikovanje problema
Kaj napovedujete ali ustvarjate in kako boste merili uspeh?
podatkov
, po potrebi označevanje, čiščenje in razdeljevanje. Pričakujte manjkajoče vrednosti in robne primere.
Modeliranje
Začnite preprosto. Osnove (logistična regresija, gradientno povečanje ali majhen transformator) pogosto premagajo junaško kompleksnost.
Usposabljanje
Izberite cilj, izberite optimizer, nastavite hiperparametre. Ponovite.
Vrednotenje
Uporabite pridržke, navzkrižno validacijo in metrike, povezane z vašim dejanskim ciljem (natančnost, F1, AUROC, BLEU, zmedenost, latenca).
Uvajanje
Strežite za API-jem ali vdelajte v aplikacijo. Spremljajte zakasnitev, stroške in prepustnost.
Spremljanje in upravljanje
Opazujte odklon, pravičnost, robustnost in varnost. Okvir za upravljanje tveganj za umetno inteligenco NIST (GOVERN, MAP, MEASURE, MANAGE) je praktičen kontrolni seznam za zaupanja vredne sisteme od začetka do konca [4].

Mini primer: Model vida je v laboratoriju odlično opravil delo, nato pa se je na terenu zapletel, ko se je osvetlitev spremenila. Spremljanje zaznanega drifta v vhodnih histogramih; hitra dopolnitev + natančna nastavitev bump-a je obnovila delovanje. Dolgočasno? Da. Učinkovito? Tudi da.

Primerjalna tabela - pristopi, za koga so namenjeni, okvirni stroški, zakaj delujejo 📊

Namerno nepopolno: nekoliko neenakomerno besedišče pomaga, da se zdi človeško.

Pristop	Idealno občinstvo	Približno cena	Zakaj deluje / opombe
Nadzorovano učenje	Analitiki, produktne ekipe	nizko–srednje	Neposredno preslikavanje vhoda → oznake. Odlično, če obstajajo oznake; tvori hrbtenico mnogih nameščenih sistemov [1].
Nenadzorovano	Raziskovalci podatkov, raziskave in razvoj	nizek	Najde grozde/kompresije/latentne faktorje – dobro za odkrivanje in predhodno učenje.
Samonadzorovano	Platformne ekipe	srednje	Iz surovih podatkovnih lestvic z izračuni in podatki ustvari lastne oznake.
Učenje z okrepitvijo	Robotika, operacijske raziskave	srednje visoko	Uči se pravil iz signalov nagrajevanja; za kanon preberite Suttona in Barta [5].
Transformatorji	NLP, vizija, multimodalnost	srednje visoko	Samopozornost zajame dolgoročne globine in se dobro vzporedi; glej izvirni članek [3].
Klasično strojno učenje (drevesa)	Tabelarno poslovne aplikacije	nizek	Poceni, hitre, pogosto šokantno močne izhodiščne vrednosti za strukturirane podatke.
Na podlagi pravil/simbolno	Skladnost, deterministična	zelo nizka	Transparentna logika; uporabna v hibridnih sistemih, ko potrebujete možnost revizije.
Vrednotenje in tveganje	Vsi	se spreminja	Za varnost in uporabnost uporabite NIST-ov GOVERN-MAP-MEASURE-MANAGE [4].

Cena = označevanje podatkov + računalništvo + ljudje + strežba.

Poglobljen vpogled 1 - funkcije izgub, gradienti in drobni koraki, ki spremenijo vse 📉

Predstavljajte si, da na podlagi velikosti hiše narišete črto, s katero napovedujete ceno. Izberete parametra (w) in (b), napovedate (\hat{y} = wx + b) in izmerite napako s povprečjem kvadratov izgube. Naklon vam pove, v katero smer se morate premikati (w) in (b), da najhitreje zmanjšate izgubo – kot če bi se v megli spustili navzdol, če začutite, v katero smer se tla nagibajo. Po vsaki seriji posodobite in vaša črta se bo bolj približala realnosti.

V globokih mrežah je to ista pesem z večjim pasom. Backprop učinkovito izračuna, kako so parametri posamezne plasti vplivali na končno napako, tako da lahko premaknete milijone (ali milijarde) gumbov v pravo smer [2].

Ključne intuicije:

Izguba oblikuje pokrajino.
Gradienti so vaš kompas.
Hitrost učenja je odvisna od velikosti koraka – prevelik korak in se ziblješ, premajhen korak in zadremaš.
Regularizacija vam preprečuje, da bi si učni niz zapomnili kot papiga s popolnim spominom, a brez razumevanja.

Poglobljen vpogled 2 - vdelave, spodbujanje in iskanje 🧭

Vdelave preslikajo besede, slike ali elemente v vektorske prostore, kjer se podobne stvari nahajajo blizu drug drugega. To vam omogoča:

poiščite pomensko podobne odlomke
iskanje moči, ki razume pomen
vključite generiranje z razširjenim iskanjem (RAG), da lahko jezikovni model poišče dejstva, preden jih zapiše

Spodbujanje je način, kako usmerjate generativne modele – opišete nalogo, navedete primere, postavite omejitve. Predstavljajte si to kot pisanje zelo podrobne specifikacije za zelo hitrega pripravnika: zagnanega, občasno preveč samozavestnega.

Praktični nasvet: če vaš model halucinira, dodajte priklic, poostrite poziv ali pa ga ocenite z utemeljenimi metrikami namesto z "vibrami".

Poglobljen vpogled 3 - ocena brez iluzij 🧪

Dobra ocena se zdi dolgočasna – kar je ravno bistvo.

Uporabite zaklenjen testni niz.
Izberite metriko, ki odraža težavo uporabnika.
Naredi ablacije, da boš vedel/a, kaj je dejansko pomagalo.
Zabeležite napake z resničnimi, neurejenimi primeri.

V produkciji je spremljanje evalvacija, ki se nikoli ne ustavi. Dogaja se zdrs. Pojavi se nov sleng, senzorji se ponovno kalibrirajo in včerajšnji model nekoliko zdrsne. Okvir NIST je praktična referenca za stalno obvladovanje tveganj in upravljanje – ne pa dokument o politiki, ki ga je treba odložiti [4].

Opomba o etiki, pristranskosti in zanesljivosti ⚖️

Sistemi umetne inteligence odražajo svoje podatke in kontekst uvajanja. To prinaša tveganja: pristranskost, neenakomerne napake med skupinami, krhkost pri distribucijskih premikih. Etična uporaba ni neobvezna – gre za ključne dejavnike. NIST opozarja na konkretne prakse: dokumentiranje tveganj in vplivov, merjenje škodljivih pristranskosti, vzpostavitev nadomestnih rešitev in obveščanje ljudi, ko so dejavniki tveganja visoki [4].

Konkretne poteze, ki pomagajo:

zbiranje raznolikih, reprezentativnih podatkov
meriti uspešnost v podpopulacijah
kartice modelov dokumentov in podatkovni listi
dodajte človeški nadzor, kjer je tveganje veliko
zasnujte varnostne mehanizme, ko je sistem negotov

Kako deluje umetna inteligenca? Kot miselni model jo lahko ponovno uporabite 🧩

Kratek kontrolni seznam, ki ga lahko uporabite za skoraj vsak sistem umetne inteligence:

Kaj je cilj? Napovedovanje, razvrščanje, generiranje, nadzor?
Od kod prihaja učni signal? Oznake, samonadzorovane naloge, nagrade?
Katera arhitektura se uporablja? Linearni model, drevesni ansambel, CNN, RNN, transformator [3]?
Kako je optimizirano? Variacije gradientnega spusta/povratni prop [2]?
Kakšen podatkovni režim? Majhen označen nabor, ocean neoznačenega besedila, simulirano okolje?
Kakšni so načini odpovedi in zaščitni ukrepi? Pristranskost, premik, halucinacije, latenca, stroškovno preslikano v skladu z NIST-ovim GOVERN-MAP-MEASURE-MANAGE [4].

Če lahko odgovorite na ta vprašanja, potem v osnovi razumete sistem – ostalo so podrobnosti implementacije in poznavanje domene.

Hitri viri, vredni dodajanja med zaznamke 🔖

Uvod v koncepte strojnega učenja (IBM) v preprostem jeziku [1]
Povratno širjenje z diagrami in preprosto matematiko [2]
Članek o transformatorju, ki je spremenil modeliranje zaporedij [3]
Okvir NIST za upravljanje tveganj umetne inteligence (praktično upravljanje) [4]
Učbenik za kanonično učenje s krepitvijo (brezplačno) [5]

Pogosta vprašanja o strelah ⚡

Je umetna inteligenca samo statistika?
Gre za statistiko, optimizacijo, računalništvo, podatkovno inženirstvo in oblikovanje izdelkov. Statistika je okostje, ostalo so mišice.

Ali večji modeli vedno zmagajo?
Skaliranje pomaga, vendar so kakovost podatkov, vrednotenje in omejitve pri uvajanju pogosto pomembnejše. Najmanjši model, ki doseže vaš cilj, je običajno najboljši za uporabnike in denarnice.

Ali lahko umetna inteligenca razume?
Definirajte razumevanje. Modeli zajamejo strukturo v podatkih in impresivno posplošujejo; vendar imajo slepe pege in se lahko samozavestno motijo. Z njimi ravnajte kot z močnimi orodji – ne kot z modreci.

Je doba transformatorjev za vedno?
Verjetno ne za vedno. Zdaj prevladuje, ker se pozornost dobro vzporedno izvaja in skalira, kot je pokazal prvotni članek [3]. Vendar pa raziskave ne prenehajo.

Kako deluje umetna inteligenca? Predolgo, nisem bral 🧵

Umetna inteligenca se uči vzorcev iz podatkov, zmanjšuje izgube in posplošuje na nove vhodne podatke [1,2].
Glavne nastavitve usposabljanja so nadzorovano, nenadzorovano, samonadzorovano in učenje z okrepitvijo; RL se uči iz nagrad [5].
Nevronske mreže uporabljajo povratno širjenje in gradientni spust za učinkovito prilagajanje milijonov parametrov [2].
Transformatorji prevladujejo v mnogih zaporednih nalogah, ker samopozornost zajame odnose vzporedno v velikem obsegu [3].
Umetna inteligenca v resničnem svetu je cevovod – od oblikovanja problema do uvajanja in upravljanja – in okvir NIST-a vas ohranja iskrene glede tveganja [4].

Če vas kdo ponovno vpraša Kako deluje umetna inteligenca?,se lahko nasmehnete, srknete kavo in rečete: uči se iz podatkov, optimizira izgubo in uporablja arhitekture, kot so transformatorji ali drevesni ansambli, odvisno od problema. Nato pa še pomežiknete, ker je to preprosto in prikrito popolno. 😉

Reference

[1] IBM - Kaj je strojno učenje?
preberite več

[2] Michael Nielsen - Kako deluje algoritem povratnega širjenja,
preberite več

[3] Vaswani in drugi - Pozornost je vse, kar potrebujete (arXiv)
preberite več

[4] NIST - Okvir za upravljanje tveganj umetne inteligence (AI RMF 1.0)
preberite več

[5] Sutton & Barto - Učenje z utrjevanjem: Uvod (2. izd.)
preberi več

Poiščite najnovejšo umetno inteligenco v uradni trgovini z umetno inteligenco

O nas

Nazaj na blog