A mesterséges intelligencia (MI ~ AI = Artificial Intelligence) az elmúlt években a technológiai fejlődés élvonalába került, megváltoztatva a technológiához fűződő attitűdünket, elvárásainkat, és alapvetően az életvitelünket. A mesterséges intelligencia hosszú távon lehetővé teheti, hogy gépek ne csupán utánozzák az emberi megismerést, hanem önállóan képezzék is le azokat, összetett feladatokat hajtsanak végre, és az egészségügytől az ügyfélszolgálaton át az újságírásig sokféle módon segítsenek minket. Az MI fejlődését ugyanakkor jelentős mértékben befolyásolta az utóbbi időszakban a nagy nyelvi modellek (LLM ~ Large Language Model) fejlesztése illetve elterjedése. Ennek zászlóshajója a techvilágot az elmúlt negyedévben maga alá gyűrő GPT (Generative Pre-trained Transformer ~ generatív előképzett transzformátor), amelynek hirtelen jött ismertsége és népszerűsége talán még az OpenAI (a GPT-t fejlesztő szervezet) csapatát is meglepte.
A GPT-ről már sokan hallottak, látták, próbálták, de természetesen sokan vannak, akiket elkerültek még az olyan hírek is, mint hogy bizonyos egyetemeken és országban üldözni kezdték, sőt tiltják is (mint például Olaszországban). Tudósok, innovátorok és milliárdosok is tiltakoznak a fejlesztésének megfékezése érdekében. Pedig a GPT esetében egy rendkívül hasznos és az ember életét megkönnyítő eszközről van szó – tiltás helyett érdemes lehet megismerni képességeit. Na de mi is a GPT egészen pontosan? Hogy működik? Mire használható? Miért és mire érdemes akár már ma felhasználni a mindennapi életünkben? Ebben a cikkben ezeket a kérdéseket járjuk körbe.
Mi a GPT?
Előre szeretném leszögezni azt, hogy a GPT semmiképpen sem mesterséges intelligencia, habár a média előszeretettel lovagolja meg ezt a klikkvadász megállapítást. A GPT egy mélytanuló neurális hálózati modell, amely gépi tanulási algoritmusokat használ a természetes nyelvi minták megértésére illetve az emberhez hasonló szöveg generálására. Hatalmas (tényleg, ember számára felfoghatatlan, a GPT 4-et nagyjából 1 trillió, de bizonyos források szerint 100 trillió paraméteren tanították) mennyiségű szöveges adaton képzik ki, amelyet felhasználva nagy pontossággal képes összefüggő és nyelvtanilag helyes szöveget generálni. Tulajdonképpen az előtanítási folyamat során a modellt úgy képzik ki, hogy egy adott szósorozat következő szavát megjósolja.
A modell a transzformátor-architektúrán alapul, amely lehetővé teszi, hogy hosszú távú függőségeket modellezzen a szövegben, és kontextuálisan relevánsabb válaszokat hozzon létre. Hogy mit is jelent ez magyarul? Azt, hogy a felhasználó bemeneti szövegének kontextusát igyekszik nagy pontossággal megbecsülni, majd a felhasználó számára releváns választ generál. Ebben a válaszban gyakorlatilag megbecsüli a nyelvi modell azt, hogy egyes szavakat (vagy szótagokat) milyen lehetséges szavaknak kellene követni, amelyek tartalmi szempontból értelmesek és a felhasználó számára hasznos információt tartalmaznak. Természetesen gyakran hibás és megtévesztő információkat is találhatunk ezekben a generált szövegekben, de erre térjünk ki később.
A GPT emberhez hasonló szövegek generálására való képessége miatt a különböző területeken – többek között a marketing, az ügyfélszolgálat, a tartalomkészítés, az oktatás, az egészségügy, a nyelvtanulás, vagy például a programozás területén – nélkülözhetetlen eszközzé vált. Segítséget nyújthat a rutinfeladatok automatizálásában, például az ügyfélkérdésekre való válaszadásban, a hosszú dokumentumok összefoglalóinak létrehozásában és megnyerő tartalom létrehozásában. Akár a célkitűzésben is segítő kezet nyújthat. A GPT-t annak nyelvi feldolgozási képességei az ügyfelek visszajelzéseinek elemzésében, a trendek azonosításában, sőt, akár a betegségek diagnosztizálásában is hasznos eszközzé teszik. A fő erőssége pedig abban rejlik, hogy
olyan jó minőségű szöveget képes generálni, amely szinte megkülönböztethetetlen az ember által írt szövegtől.
A GPT által biztosított előnyök
- Időt és energiát takaríthat meg: A GPT gyorsan és pontosan képes szöveget generálni, ami időt és energiát takarít meg a kézi tartalomkészítéshez képest. Ez különösen hasznos az olyan iparágakban, ahol nagy mennyiségű szöveg előállítására van szükség, például a tartalomkészítés vagy az ügyfélszolgálat területén.
- Növeli a produktivitást: Az olyan feladatok automatizálásával, mint a szövegösszefoglalás vagy a nyelvi fordítás, a GPT növelheti a termelékenységet és a hatékonyságot a különböző iparágakban. Ez lehetővé teszi a vállalkozások és szervezetek számára, hogy fontosabb feladatokra összpontosítsanak.
- A tartalom minőségének javítása: A GPT jó minőségű, nyelvtanilag helyes és a kontextus szempontjából releváns szöveget képes generálni akár még magyar nyelven is, ami javíthatja a tartalom általános minőségét.
- A tartalom személyre szabása: A GPT finomhangolható, hogy a felhasználói adatok alapján személyre szabott tartalmat generáljon, ami javíthatja a felhasználók elkötelezettségét és elégedettségét. Ez például a kereskedelemben illetve a marketing területén rendkívül hasznos.
- Több nyelv kezelése: A GPT több nyelvet is képes kezelni, ami hasznos a többnyelvű környezetben működő vállalkozások és szervezetek számára. Ez lehetővé teszi számukra, hogy a vevőkkel vagy ügyfelekkel az általuk preferált nyelven kommunikáljanak.
A GPT által biztosított funkciók
- Tartalom létrehozása: Például blogbejegyzések, hírcikkek vagy közösségi oldalakon elhelyezhető bejegyzések készítésére is alkalmas a GPT. Néhány kulcsszó, kifejezés, vagy konkrét utasítások megadásával a GPT képes a szövegkörnyezet szempontjából releváns és nyelvtanilag helyes szöveget generálni.
- Nyelvi fordítás: A GPT több nyelv közötti szöveg fordítására is használható. A modell többnyelvű adatokon történő kiképzése által pontosan lefordíthatja a szöveget, és javíthatja a kultúrák közötti kommunikációt. Ez például hasznos lehet a nyelvtanulásban és a nyelvtanításban is.
- Szentimentelemzés: A GPT használható a szöveges adatok, például az ügyfélértékelések vagy a közösségi médiában közzétett bejegyzések hangulatának, érzelmi világának elemzésére.
- Szöveges összegzés: A GPT nagy mennyiségű szöveges adat, például újságcikkek vagy kutatási cikkek összegzésére használható. Az összefoglaló létrehozásával a modell segíthet időt megtakarítani úgy, hogy biztosítani tudja az információmegőrzést.
- Kérdések megválaszolása: A GPT nagy adathalmazok alapján összetett kérdések megválaszolására használható. Az egyszerű, mindennapi kérdésektől tudományspecifikus kérdésekig képes értelmes és használható válaszokat generálni.
- Nyelvi modellezés: A GPT felhasználható olyan új szöveg generálására, amely egy adott írásmódot vagy formátumot követ. Ez hasznos lehet a tartalomkészítők vagy marketingesek számára, akiknek olyan szöveget kell generálniuk, amely megfelel a márkájuk hangjának és hangnemének.
- Programozás: A hatalmas dataset által a GPT képes a megadott utasításoknak megfelelően szinte bármilyen programnyelven használható kódokat generálni. Ez a szoftverfejlesztésben időt spórolandó felhasználható akár komplexebb, akár repetitív feladatok kiváltására is.
Valós példák
Nézzünk meg néhány valós példát, amelyet a cikk írása közben teszteltem a ChatGPT segítségével. A ChatGPT a GPT 3.5-ös modellt használja, amelyet 2021 őszéig visszavezethető adatokkal tanítottak. A GPT 4-től eltérően még nem képes vizuális bemenetek értelmezésére, csupán szöveges módon használható. Jelenleg ingyenesen is elérhető a ChatGPT, ehhez az OpenAI honlapján szükséges először regisztrálni, majd tudjuk is használni a chatbotot.
Étrend készítése
Látható, hogy egészen mindennapi célra is igénybevehető a chatbot. Megkértem a modellt arra, hogy egy napi maximum kalóriamennyiséget figyelembe véve készítsen számomra étrendet a következő hétre. Az utasítást további paraméterekkel is felruházhattam volna, például kérhettem volna azt, hogy csak vegán ételeket ajánljon, vagy ne javasoljon halételeket. Ami szembetűnő, hogy nem feltétlenül teljesítette maradéktalanul a kérést: volt egy pont, amikor a szöveg generálása megszakadt.
Ez általában a tokenek túlcsordulása miatt történik.
Mit is jelent ez pontosan? A GPT a szöveget tokenek segítségével dolgozza fel, amelyek a szövegben található gyakori karaktersorozatok. Az angol vagy a német nyelvben a tokenek akár teljes szavakat, vagy szótagokat fednek le, míg a magyar nyelvben a szótagokon kívül a toldalékokat, ragokat is egy-egy tokennek számolja. A GPT 3.5 maximálisan 4096 tokent képes kezelni, na már most az látható, hogy egy hosszabb étrend generálása bőven meghaladhatja ezt a limitet. Ilyen esetben érdemes lehet felbontani az utasítást több kisebb utasításra: „Készíts nekem étrendet hétfőtől szerdáig, napi max. 2100 kalória tartalommal.”
Összefoglaló készítése egy témáról
Habár tudományos igényességű összefoglalót kértem az egysejtűekről, azon azért vitatkozhatunk, hogy a nyelvezete mennyire volt ténylegesen tudományos. Ezek a kérések általában angol nyelven minőségibb módon kerülnek feldolgozásra. Egy kis fact-checket követően azt meg tudom állapítani, hogy a válaszul kapott tények legalább hitelesek.
Nyelvtanulás
Ahogy látható, a chatbot nyelvtanulás céljára is igénybe vehető. A német nyelv Perfekt múltidejének alapvető szabályait maradéktalanul bemutatta.
Komplex téma bemutatása érthetően
Kifejezetten szórakoztató tartalmat képes generálni a ChatGPT, ha arra kérjük, hogy egy-egy komplexebb témát akár egy 10 éves számára is érthető módon mutasson be. Azt, hogy egy 10 éves számára ténylegesen érthető-e Einsten relativitáselmélete olyan formában, ahogy a GPT bemutatja, érdemes lehet ellenőrizni a saját környezetünkben. Előfordulhat, hogy egy, a témában elmerülő gyerek érthetőbben magyarázná el számunkra a témát. 🙂
Adjunk szerepet a GPT-nek
A GPT-t fel tudjuk ruházni egy általunk meghatározott szereppel. Ebben a példában arra utasítottam a chatbotot, hogy a továbbiakban úgy készítsen közösségi médiára bejegyzéseket számomra, hogy az illeszkedjen egy 15 év tapasztalattal rendelkező marketing szakember profiljába. Habár egy-két mondatot a nyelvhelyesség és az értelmesség biztosítása érdekében érdemes lehet változtatni rajta, a generált tartalom alapvetően lenyűgöző lehet.
A GPT-ben fellelhető korlátok
Bár a GPT egy hatékony eszköz a szöveggeneráláshoz, fontos megemlíteni néhány limitációt:
- Elfogultság: Mint minden gépi tanulási modell, a GPT is elfogult lehet, ez például a sztereotípiákhoz való illeszkedésben nyilvánulhat meg. Fontos, hogy tisztában legyünk ezekkel az elfogultságokkal.
- Hallucináció: Bár a GPT gyorsan és hatékonyan képes szöveget generálni, a kimenet minősége változó, egy szó mint száz, megtévesztő lehet. Fontos, hogy a pontosság és az egyértelműség biztosítása érdekében a GPT által adott válaszokat, illetve azok információtartalmának helyességét minden esetben ellenőrizzük.
- Értelmetlenség: Habár a GPT többnyire értelmes, emberi szövegeket generál, tudnunk kell azt, hogy nincs agya, nincs kognitív és érzelmi működése és nem rendelkezik ezekből fakadó emberi adottságokkal. Emiatt bizonyos válaszok furcsának, értelmetlennek tűnhetnek.
- Korlátolt információhalmaz: A ChatGPT-vel (ingyenesen) a GPT 3.5-ös verziót használhatjuk, amelyet viszont 2021 őszéig datálható adatokkal tanították. Mivel a ChatGPT nem kapcsolódik az internetre, ezért az általa generált információk mára elavultak lehetnek. Ugyanakkor a Microsoft a saját Edge böngészőjéből felkeresett Bing keresőoldalba integrálta a GPT 4-et, amelyet bárki ingyenesen használhat.
- Aritmetikai képességek hiánya: A GPT nem képes matematikai műveletek elvégzésére, ugyanakkor megválaszolja az ilyen jellegű kérdéseket. Az egyszerűbbeket általában pontosan (hiszen az óriási adatset miatt helyesen becsli meg a megfelelő választ), a komplexebbeket már inkább hibásan. Ugyanakkor ezt a korlátot hamarosan megugorhatják, tekintve, hogy milyen tempóval fejlesztik a modellt.
- Feledékenység: A GPT bizonyos tranzakciók után egyszerűen elfelejti az általunk és az általa korábban megadott információkat is. Ebben az esetben visszakanyarodhatunk egy korábbi ponthoz: a modell el kezd hallucinálni, téves vagy nem releváns tartalmat generálni.
Út a technológiai szingularitáshoz?
Amint a média felkapta a ChatGPT-t, megjelentek azok a hangok, amelyek szerint a GPT segítségével ráléptünk a technológiai szingularitás útjára, vagy el is értük azt. A technológiai szingularitás fogalma arra a hipotetikus időpontra utal, amikor a mesterséges intelligencia meghaladja az emberi intelligenciát és felgyorsítja az általunk nem befolyásolható technológiai fejlődést. Egyes kutatók szerint a hirtelen, katasztrofális szingularitás valószínűtlen. Ugyanakkor a mesterséges intelligencia társadalomra gyakorolt hatásával kapcsolatban még mindig vannak aggályok, beleértve az emberi munkaerő kiszorítását és a mesterséges intelligencia rosszindulatú felhasználásának lehetőségét. (Ennek ellenére nagyon úgy tűnik, hogy jelen esetben a GPT máris létrehozott egy új karrierutat: a Prompt Engineering arra a munkára utal, amely során a szakember a lehető leghatékonyabban igyekszik megfelelő utasításokat vagy bemeneteket megfogalmazni a nyelvi modell számára.)
A mesterséges intelligencia típusai
A cikk elején azzal kezdtem, hogy a GPT nem mesterséges intelligencia. Érdemes akkor most tisztába tenni azt, hogy a futurizmus, a filozófia és egyéb tudományágak szerint milyen típusai lehetnek a mesterséges intelligenciának.
- Mesterséges „szűk” intelligencia (Artificial Narrow Intelligence): Az ANI olyan mesterséges intelligenciaeszközöket foglal magába, amelyeket nagyon specifikus műveletek vagy parancsok végrehajtására terveztek.
- Mesterséges általános intelligencia (Artificial General Intelligence): Az AGI-t erős mesterséges intelligenciának vagy teljes mesterséges intelligenciának is nevezik. Olyan gépeket ír le, amelyek képesek minden olyan szellemi feladat elvégzésére, amelyre az ember is képes.
- Mesterséges szuperintelligencia (Artificial Superintelligence): Az ASI olyan mesterséges intelligencia, amely minden tekintetben felülmúlja az emberi intelligenciát.
- Reaktív gépek (Reactive Machines): A reaktív gépek a mesterséges intelligencia legegyszerűbb típusai. Csak bizonyos helyzetekre tudnak reagálni, és nem képesek emlékezetet kialakítani, vagy a múltbeli tapasztalatokat felhasználni a jövőbeli döntésekhez.
- Korlátozott memóriájú gépek (Limited Memory Machines): A korlátozott memóriájú gépek képesek a múltbeli tapasztalatokat felhasználni a jövőbeli döntésekhez.
- Az elme elmélete (Theory of Mind): Az elmeelméleti gépek képesek megérteni önmaguk és mások érzelmeit és gondolatait.
- Öntudatosság: Az öntudatos gépek tudattal rendelkeznek, és képesek megérteni saját létezésüket.
Jelen ismereteink szerint a világon elérhető MI-k közül még csak mesterséges szűk intelligenciáról (Siri, Cortana), reaktív gépekről (egyszerű robotok), és korlátozott memóriájú gépekről (önvezető autók) beszélhetünk.
Az öntudatosságtól, a mesterséges általános intelligenciától és a mesterséges szuperintelligenciától még rendkívül messze áll a technológia. Nagyjából ezek lennének a technológiai szingularitás feltételei.
A GPT pedig, mivel csupán egy nyelvi modellről van szó, egyik felsorolt típusba sem sorolható. Azaz nem, még nem érkezett el a szingularitás, de képzett és felkészült szakemberek tízezrei dolgoznak azon, hogy egyszer megvalósuljon az emberi elmét modellezni képes, már-már öntudattal rendelkező mesterséges intelligencia.
Óvatosan kezeljük, de ne féljünk tőle
Összefoglalva, a GPT-t az teszi a természetes nyelvfeldolgozás különleges eszközévé, hogy képes kiváló minőségű, kontextus szempontjából releváns és nyelvtanilag helyes szöveget generálni, sokoldalúan kezeli a különböző nyelvfeldolgozási feladatokat, és képes a szövegben lévő hosszú távú függőségek modellezésére. Érdemes óvatosan kezelni a modellt, de félni, üldözni, és tiltani hasonlóságot mutatna a középkor könyvégetésével. Láthattuk, hogy olyan célokra használhatjuk, mint az egyszerű, mindennapi kérdések megválaszolása, nyelvtanulás, cikkek és közösségi oldalakra szánt posztok gyártása. A programozásban, tudományos cikkek összefoglalására, szentimentelemzésre és adatok értelmezésére is hatékony eszköznek bizonyul. S bár számos előnyt biztosít, fontos, hogy tisztában legyünk a korlátaival, mint például a hallucinációval, az esetleges értelmetlenséggel, a feledékenységgel és az aritmetikai hiányosságaival. Ezek megértésével, ellenőrzésével és a legjobb gyakorlatok felfedezésével a GPT minden szempontból segítő kezet nyújthat mind a mindennapokban, mind a szakmai életben.
Források
Soares, L. H. The Technological Singularity: A realistic overview.
https://machinelearningmastery.com/the-transformer-model/
https://openai.com/