Kako deluje umetna inteligenca?

Kako deluje umetna inteligenca?

Umetna inteligenca se lahko zdi kot čarovniški trik, ki mu vsi prikimajo, medtem ko tiho razmišljajo ... počakajte, kako to pravzaprav deluje? Dobra novica. Demistificirali jo bomo brez odvečnih besed, ostali praktični in dodali nekaj nepopolnih analogij, ki še vedno delujejo logično. Če želite le bistvo, si oglejte spodnji enominutni odgovor; ampak iskreno, podrobnosti so tisto, kar vas spravi v poštev 💡.

Članki, ki jih boste morda želeli prebrati po tem:

🔗 Kaj pomeni kratica GPT
Kratek opis kratice GPT in njenega pomena.

🔗 Od kod umetna inteligenca dobiva svoje informacije
Viri, ki jih umetna inteligenca uporablja za učenje, usposabljanje in odgovarjanje na vprašanja.

🔗 Kako vključiti umetno inteligenco v vaše podjetje
Praktični koraki, orodja in poteki dela za učinkovito integracijo umetne inteligence.

🔗 Kako ustanoviti podjetje za umetno inteligenco
Od ideje do lansiranja: potrditev, financiranje, ekipa in izvedba.


Kako deluje umetna inteligenca? Odgovor v eni minuti ⏱️

Umetna inteligenca se uči vzorcev iz podatkov, da bi lahko napovedovala ali ustvarjala vsebino – ročno napisana pravila niso potrebna. Sistem vnese primere, s funkcijo izgub izmeri, kako napačen je, in prilagodi svoje notranje gumbe – parametre –, da so vsakič nekoliko manj napačni. Izperi, ponovi, izboljšaj. Z dovolj cikli postane uporaben. Ista zgodba velja ne glede na to, ali razvrščate e-pošto, odkrivate tumorje, igrate družabne igre ali pišete haikuje. Za preprosto osnovo »strojnega učenja« je IBM-ov pregled soliden [1].

Večina sodobne umetne inteligence je strojno učenje. Preprosta različica: vnos podatkov, učenje preslikave vhodnih podatkov v izhodne podatke in nato posploševanje na nove stvari. Ne magična matematika, računanje in, če smo iskreni, ščepec umetnosti.


"Kako deluje umetna inteligenca?" ✅

Ko ljudje v Googlu iščejo » Kako deluje umetna inteligenca?« , običajno želijo:

  • miselni model, ki mu lahko zaupajo, ki ga je mogoče ponovno uporabiti

  • zemljevid glavnih vrst učenja, da žargon ne bo več strašljiv

  • vpogled v nevronske mreže, ne da bi se izgubili

  • zakaj se zdi, da transformatorji zdaj vladajo svetu

  • praktični cevovod od podatkov do uvedbe

  • hitra primerjalna tabela, ki jo lahko posnamete in shranite

  • varovala glede etike, pristranskosti in zanesljivosti, ki niso neenakomerna

To boste tukaj dobili. Če se sprehajam, je to namerno – kot da bi se ubral po slikoviti poti in si naslednjič nekako bolje zapomnil ulice. 🗺️


Osnovne sestavine večine sistemov umetne inteligence 🧪

Predstavljajte si sistem umetne inteligence kot kuhinjo. Štiri sestavine se pojavljajo znova in znova:

  1. Podatki – primeri z oznakami ali brez njih.

  2. Model – matematična funkcija z nastavljivimi parametri.

  3. Cilj – funkcija izgube, ki meri, kako slaba so ugibanja.

  4. Optimizacija – algoritem, ki prilagaja parametre za zmanjšanje izgub.

Pri globokem učenju je ta spodbuda običajno gradientni spust s povratnim širjenjem – učinkovit način, da ugotovimo, kateri gumb na ogromni zvočni plošči je zaškripal, nato pa ga nekoliko zmanjšamo [2].

Mini primer: Krhek filter neželene pošte, ki temelji na pravilih, smo zamenjali z majhnim nadzorovanim modelom. Po tednu dni zank označevanje → merjenje → posodabljanje se je zmanjšalo število lažno pozitivnih rezultatov in število zahtevkov za podporo. Nič posebnega – le čistejši cilji (natančnost pri »amaterskih« e-poštnih sporočilih) in boljša optimizacija.


Učne paradigme na prvi pogled 🎓

  • Nadzorovano učenje.
    Zagotovite vhodno-izhodne pare (fotografije z oznakami, e-poštna sporočila označena kot neželena pošta/ne neželena pošta). Model se uči vhod → ​​izhod. Ozadje mnogih praktičnih sistemov [1].

  • Nenadzorovano učenje
    Brez oznak. Poiščite strukturne skupine, kompresije, latentne faktorje. Odlično za raziskovanje ali predhodno učenje.

  • Samonadzorovano učenje
    Model ustvarja lastne oznake (napoveduje naslednjo besedo, manjkajoči del slike). Pretvori surove podatke v učni signal v velikem obsegu; podpira sodobne jezikovne in vidne modele.

  • Učenje z okrepitvijo
    Agent deluje, zbira nagrade in se uči politike, ki maksimizira kumulativno nagrado. Če vam »funkcije vrednosti«, »politike« in »učenje časovnih razlik« zvenijo znano, je to njihov dom [5].

Da, kategorije se v praksi zamegljujejo. Hibridne metode so normalne. Resnično življenje je neurejeno; dober inženiring se s tem sreča tam, kjer je.


Znotraj nevronske mreže brez glavobola 🧠

Nevronska mreža zlaga plasti drobnih matematičnih enot (nevronov). Vsaka plast transformira vhode z utežmi, pristranskostmi in mehko nelinearnostjo, kot sta ReLU ali GELU. Zgodnje plasti se naučijo preprostih funkcij; globlje plasti kodirajo abstrakcije. »Čarobnost« – če jo lahko tako imenujemo – je kompozicija : z veriženjem majhnih funkcij lahko modelirate izjemno kompleksne pojave.

Vadbena zanka, samo vibracije:

  • ugibanje → merjenje napake → pripisovanje krivde prek povratnega propa → uteži pomika → ponovitev.

To storite v več serijah in model, podobno kot neroden plesalec, ki izboljšuje vsako pesem, ne bo več stopal na vaše prste. Za prijazno in natančno poglavje o podpori glejte [2].


Zakaj so transformatorji prevzeli oblast – in kaj »pozornost« pravzaprav pomeni 🧲

Transformatorji uporabljajo samopozornost , da hkrati pretehtajo, kateri deli vhodnega signala so pomembni drug za drugega. Namesto da bi stavek bral strogo od leve proti desni kot starejši modeli, lahko transformator pogleda povsod in dinamično oceni odnose – kot bi skeniral natrpan prostor, da bi videl, kdo se s kom pogovarja.

Ta zasnova je pri modeliranju zaporedij odpravila ponavljanje in konvolucije, kar je omogočilo masiven vzporedni razvoj in odlično skaliranje. Članek, ki je sprožil ta proces - Attention Is All You Need - predstavlja arhitekturo in rezultate [3].

Samopozornost v eni vrstici: ustvarite poizvedbe , ključa in vrednosti za vsak žeton; izračunajte podobnosti za pridobitev uteži pozornosti; ustrezno zmešajte vrednosti. Natančno v podrobnostih, elegantno v duhu.

Pozor: Transformatorji prevladujejo, ne monopolizirajo. CNN, RNN in drevesni ansambli še vedno zmagajo pri določenih tipih podatkov in omejitvah zakasnitve/stroškov. Izberite arhitekturo za delo, ne pa pompa.


Kako deluje umetna inteligenca? Praktični cevovod, ki ga boste dejansko uporabili 🛠️

  1. Oblikovanje problema
    Kaj napovedujete ali ustvarjate in kako boste merili uspeh?

  2. podatkov
    , po potrebi označevanje, čiščenje in razdeljevanje. Pričakujte manjkajoče vrednosti in robne primere.

  3. Modeliranje
    Začnite preprosto. Osnove (logistična regresija, gradientno povečanje ali majhen transformator) pogosto premagajo junaško kompleksnost.

  4. Usposabljanje
    Izberite cilj, izberite optimizer, nastavite hiperparametre. Ponovite.

  5. Vrednotenje
    Uporabite pridržke, navzkrižno validacijo in metrike, povezane z vašim dejanskim ciljem (natančnost, F1, AUROC, BLEU, zmedenost, latenca).

  6. Uvajanje
    Strežite za API-jem ali vdelajte v aplikacijo. Spremljajte zakasnitev, stroške in prepustnost.

  7. Spremljanje in upravljanje
    Opazujte odklon, pravičnost, robustnost in varnost. Okvir za upravljanje tveganj za umetno inteligenco NIST (GOVERN, MAP, MEASURE, MANAGE) je praktičen kontrolni seznam za zaupanja vredne sisteme od začetka do konca [4].

Mini primer: Model vida je v laboratoriju odlično opravil delo, nato pa se je na terenu zapletel, ko se je osvetlitev spremenila. Spremljanje zaznanega drifta v vhodnih histogramih; hitra dopolnitev + natančna nastavitev bump-a je obnovila delovanje. Dolgočasno? Da. Učinkovito? Tudi da.


Primerjalna tabela - pristopi, za koga so namenjeni, okvirni stroški, zakaj delujejo 📊

Namerno nepopolno: nekoliko neenakomerno besedišče pomaga, da se zdi človeško.

Pristop Idealno občinstvo Približno cena Zakaj deluje / opombe
Nadzorovano učenje Analitiki, produktne ekipe nizko–srednje Neposredno preslikavanje vhoda → oznake. Odlično, če obstajajo oznake; tvori hrbtenico mnogih nameščenih sistemov [1].
Nenadzorovano Raziskovalci podatkov, raziskave in razvoj nizek Najde grozde/kompresije/latentne faktorje – dobro za odkrivanje in predhodno učenje.
Samonadzorovano Platformne ekipe srednje Iz surovih podatkovnih lestvic z izračuni in podatki ustvari lastne oznake.
Učenje z okrepitvijo Robotika, operacijske raziskave srednje visoko Uči se pravil iz signalov nagrajevanja; za kanon preberite Suttona in Barta [5].
Transformatorji NLP, vizija, multimodalnost srednje visoko Samopozornost zajame dolgoročne globine in se dobro vzporedi; glej izvirni članek [3].
Klasično strojno učenje (drevesa) Tabelarno poslovne aplikacije nizek Poceni, hitre, pogosto šokantno močne izhodiščne vrednosti za strukturirane podatke.
Na podlagi pravil/simbolno Skladnost, deterministična zelo nizka Transparentna logika; uporabna v hibridnih sistemih, ko potrebujete možnost revizije.
Vrednotenje in tveganje Vsi se spreminja Za varnost in uporabnost uporabite NIST-ov GOVERN-MAP-MEASURE-MANAGE [4].

Cena = označevanje podatkov + računalništvo + ljudje + strežba.


Poglobljen vpogled 1 - funkcije izgub, gradienti in drobni koraki, ki spremenijo vse 📉

Predstavljajte si, da na podlagi velikosti hiše narišete črto, s katero napovedujete ceno. Izberete parametra (w) in (b), napovedate (\hat{y} = wx + b) in izmerite napako s povprečjem kvadratov izgube. Naklon vam pove, v katero smer se morate premikati (w) in (b), da najhitreje zmanjšate izgubo – kot če bi se v megli spustili navzdol, če začutite, v katero smer se tla nagibajo. Po vsaki seriji posodobite in vaša črta se bo bolj približala realnosti.

V globokih mrežah je to ista pesem z večjim pasom. Backprop učinkovito izračuna, kako so parametri posamezne plasti vplivali na končno napako, tako da lahko premaknete milijone (ali milijarde) gumbov v pravo smer [2].

Ključne intuicije:

  • Izguba oblikuje pokrajino.

  • Gradienti so vaš kompas.

  • Hitrost učenja je odvisna od velikosti koraka – prevelik korak in se ziblješ, premajhen korak in zadremaš.

  • Regularizacija vam preprečuje, da bi si učni niz zapomnili kot papiga s popolnim spominom, a brez razumevanja.


Poglobljen vpogled 2 - vdelave, spodbujanje in iskanje 🧭

Vdelave preslikajo besede, slike ali elemente v vektorske prostore, kjer se podobne stvari nahajajo blizu drug drugega. To vam omogoča:

  • poiščite pomensko podobne odlomke

  • iskanje moči, ki razume pomen

  • vključite generiranje z razširjenim iskanjem (RAG), da lahko jezikovni model poišče dejstva, preden jih zapiše

Spodbujanje je način, kako usmerjate generativne modele – opišete nalogo, navedete primere, postavite omejitve. Predstavljajte si to kot pisanje zelo podrobne specifikacije za zelo hitrega pripravnika: zagnanega, občasno preveč samozavestnega.

Praktični nasvet: če vaš model halucinira, dodajte priklic, poostrite poziv ali pa ga ocenite z utemeljenimi metrikami namesto z "vibrami".


Poglobljen vpogled 3 - ocena brez iluzij 🧪

Dobra ocena se zdi dolgočasna – kar je ravno bistvo.

  • Uporabite zaklenjen testni niz.

  • Izberite metriko, ki odraža težavo uporabnika.

  • Naredi ablacije, da boš vedel/a, kaj je dejansko pomagalo.

  • Zabeležite napake z resničnimi, neurejenimi primeri.

V produkciji je spremljanje evalvacija, ki se nikoli ne ustavi. Dogaja se zdrs. Pojavi se nov sleng, senzorji se ponovno kalibrirajo in včerajšnji model nekoliko zdrsne. Okvir NIST je praktična referenca za stalno obvladovanje tveganj in upravljanje – ne pa dokument o politiki, ki ga je treba odložiti [4].


Opomba o etiki, pristranskosti in zanesljivosti ⚖️

Sistemi umetne inteligence odražajo svoje podatke in kontekst uvajanja. To prinaša tveganja: pristranskost, neenakomerne napake med skupinami, krhkost pri distribucijskih premikih. Etična uporaba ni neobvezna – gre za ključne dejavnike. NIST opozarja na konkretne prakse: dokumentiranje tveganj in vplivov, merjenje škodljivih pristranskosti, vzpostavitev nadomestnih rešitev in obveščanje ljudi, ko so dejavniki tveganja visoki [4].

Konkretne poteze, ki pomagajo:

  • zbiranje raznolikih, reprezentativnih podatkov

  • meriti uspešnost v podpopulacijah

  • kartice modelov dokumentov in podatkovni listi

  • dodajte človeški nadzor, kjer je tveganje veliko

  • zasnujte varnostne mehanizme, ko je sistem negotov


Kako deluje umetna inteligenca? Kot miselni model jo lahko ponovno uporabite 🧩

Kratek kontrolni seznam, ki ga lahko uporabite za skoraj vsak sistem umetne inteligence:

  • Kaj je cilj? Napovedovanje, razvrščanje, generiranje, nadzor?

  • Od kod prihaja učni signal? Oznake, samonadzorovane naloge, nagrade?

  • Katera arhitektura se uporablja? Linearni model, drevesni ansambel, CNN, RNN, transformator [3]?

  • Kako je optimizirano? Variacije gradientnega spusta/povratni prop [2]?

  • Kakšen podatkovni režim? Majhen označen nabor, ocean neoznačenega besedila, simulirano okolje?

  • Kakšni so načini odpovedi in zaščitni ukrepi? Pristranskost, premik, halucinacije, latenca, stroškovno preslikano v skladu z NIST-ovim GOVERN-MAP-MEASURE-MANAGE [4].

Če lahko odgovorite na ta vprašanja, potem v osnovi razumete sistem – ostalo so podrobnosti implementacije in poznavanje domene.


Hitri viri, vredni dodajanja med zaznamke 🔖

  • Uvod v koncepte strojnega učenja (IBM) v preprostem jeziku [1]

  • Povratno širjenje z diagrami in preprosto matematiko [2]

  • Članek o transformatorju, ki je spremenil modeliranje zaporedij [3]

  • Okvir NIST za upravljanje tveganj umetne inteligence (praktično upravljanje) [4]

  • Učbenik za kanonično učenje s krepitvijo (brezplačno) [5]


Pogosta vprašanja o strelah ⚡

Je umetna inteligenca samo statistika?
Gre za statistiko, optimizacijo, računalništvo, podatkovno inženirstvo in oblikovanje izdelkov. Statistika je okostje, ostalo so mišice.

Ali večji modeli vedno zmagajo?
Skaliranje pomaga, vendar so kakovost podatkov, vrednotenje in omejitve pri uvajanju pogosto pomembnejše. Najmanjši model, ki doseže vaš cilj, je običajno najboljši za uporabnike in denarnice.

Ali lahko umetna inteligenca razume?
Definirajte razumevanje . Modeli zajamejo strukturo v podatkih in impresivno posplošujejo; vendar imajo slepe pege in se lahko samozavestno motijo. Z njimi ravnajte kot z močnimi orodji – ne kot z modreci.

Je doba transformatorjev za vedno?
Verjetno ne za vedno. Zdaj prevladuje, ker se pozornost dobro vzporedno izvaja in skalira, kot je pokazal prvotni članek [3]. Vendar pa raziskave ne prenehajo.


Kako deluje umetna inteligenca? Predolgo, nisem bral 🧵

  • Umetna inteligenca se uči vzorcev iz podatkov, zmanjšuje izgube in posplošuje na nove vhodne podatke [1,2].

  • Glavne nastavitve usposabljanja so nadzorovano, nenadzorovano, samonadzorovano in učenje z okrepitvijo; RL se uči iz nagrad [5].

  • Nevronske mreže uporabljajo povratno širjenje in gradientni spust za učinkovito prilagajanje milijonov parametrov [2].

  • Transformatorji prevladujejo v mnogih zaporednih nalogah, ker samopozornost zajame odnose vzporedno v velikem obsegu [3].

  • Umetna inteligenca v resničnem svetu je cevovod – od oblikovanja problema do uvajanja in upravljanja – in okvir NIST-a vas ohranja iskrene glede tveganja [4].

Če vas kdo ponovno vpraša Kako deluje umetna inteligenca?, se lahko nasmehnete, srknete kavo in rečete: uči se iz podatkov, optimizira izgubo in uporablja arhitekture, kot so transformatorji ali drevesni ansambli, odvisno od problema. Nato pa še pomežiknete, ker je to preprosto in prikrito popolno. 😉


Reference

[1] IBM - Kaj je strojno učenje?
preberite več

[2] Michael Nielsen - Kako deluje algoritem povratnega širjenja,
preberite več

[3] Vaswani in drugi - Pozornost je vse, kar potrebujete (arXiv)
preberite več

[4] NIST - Okvir za upravljanje tveganj umetne inteligence (AI RMF 1.0)
preberite več

[5] Sutton & Barto - Učenje z utrjevanjem: Uvod (2. izd.)
preberi več

Poiščite najnovejšo umetno inteligenco v uradni trgovini z umetno inteligenco

O nas

Nazaj na blog