GPT-4, najnovija verzija chatbota za umjetnu inteligenciju (AI), ChatGPT, može proći srednjoškolske testove i ispite pravnog fakulteta s rezultatima rangiranim u 90. percentilu i ima nove mogućnosti obrade koje nisu bile moguće s prethodnom verzijom.
Brojke iz testnih rezultata GPT-4 podijelio je 14. ožujka njegov tvorac OpenAI otkrivajući da također može pretvoriti slike, audio i video ulaze u tekst uz kreativnije i pouzdanije rukovanje “mnogo nijansiranijim uputama”.
"Prolazi simulirani pravosudni ispit s rezultatom oko 10% najboljih ispitanika", dodao je OpenAI. "Nasuprot tome, rezultat GPT-3.5 bio je oko najnižih 10%."
Brojke pokazuju da je GPT-4 postigao rezultat od 163 u 88. percentilu na LSAT ispitu — ispit koji studenti moraju položiti u Sjedinjenim Državama da bi bili primljeni na pravni fakultet.
Rezultat GPT4 stavio bi ga u dobru poziciju za prijem među 20 najboljih pravnih fakulteta i samo je nekoliko bodova manje od prijavljenih rezultata potrebnih za prijem na prestižne škole kao što su Harvard, Stanford, Princeton ili Yale.
Prethodna verzija ChatGPT-a postigla je samo 149 bodova na LSAT-u, što ju je svrstalo u najnižih 40%.
GPT-4 također je postigao 298 od 400 na Jedinstvenom pravosudnom ispitu — testu koji polažu nedavno diplomirani studenti prava koji im omogućuje da rade kao odvjetnici u bilo kojoj jurisdikciji SAD-a.
Stara verzija ChatGPT-a imala je problema u ovom testu, završivši u najnižih 10% s rezultatom 213 od 400.
Što se tiče ispita čitanja i pisanja temeljenog na dokazima SAT i ispita matematike SAT koje su polagali američki srednjoškolci kako bi izmjerili svoju spremnost za fakultet, GPT-4 postigao je 93. odnosno 89. percentil.
GPT-4 također je briljirao u "teškim" znanostima, objavljujući rezultate znatno iznad prosjeka percentila u AP biologiji (85-100%), kemiji (71-88%) i fizici 2 (66-84%).
Međutim, njegov AP Calculus rezultat bio je prilično prosječan, rangiran od 43. do 59. percentila.
Još jedno područje gdje je GPT-4 nedostajao bili su ispiti iz engleske književnosti, koji su objavljivali rezultate od 8. do 44. percentila na dva odvojena testa.
OpenAI je rekao da su GPT-4 i GPT-3.5 uzeli ove testove iz praktičnih ispita 2022.-2023. i da alati za obradu jezika nisu prošli "nikakvu posebnu obuku":
“Nismo imali posebnu obuku za ove ispite. Manekenka je uočila manji dio problema na ispitima tijekom treninga, ali vjerujemo da su rezultati reprezentativni.”
Rezultati su također izazvali strah u zajednici na Twitteru.
Povezano: Kako će ChatGPT utjecati na Web3 prostor? Odgovori industrije
Nick Almond, osnivač FactoryDAO rekao njegovih 14,300 sljedbenika na Twitteru 14. ožujka da će GPT4 "uplašiti ljude" i "urušiti" globalni obrazovni sustav.
Teorija ocjenjivanja bila je veliki dio mog života nekoliko godina. Razmišljao sam o dolasku ovog dana prije mnogo godina. Doslovno sam zvučao kao stalni krenk u to vrijeme.
Ali… ovo zapravo znači da je sve osim nadzorne procjene od ove točke gotovo.
— drnick ️² (@DrNickA) Ožujak 14, 2023
Bivši direktor Coinbasea, Conor Grogan, rekao je da je umetnuo živi Ethereum pametni ugovor u GPT-4 i odmah ukazao na nekoliko "sigurnosnih propusta" i opisao kako se kod može iskoristiti:
Bacio sam živi Ethereum ugovor u GPT-4.
U trenu je istaknuo niz sigurnosnih propusta i ukazao na površine na kojima bi se ugovor mogao iskoristiti. Zatim je potvrdio određeni način na koji mogu iskoristiti ugovor pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) Ožujak 14, 2023
Ranije revizije pametnih ugovora na ChatGPT-u otkrile su da je njegova prva verzija također bila sposobna u razumnoj mjeri uočavati pogreške koda.
Rowan Cheung, osnivač AI biltena “The Rundown” podijelio je video GPT-a koji prepisuje rukom nacrtanu lažnu web stranicu na komadu papira u kod.
Upravo sam gledao kako GPT-4 pretvara rukom nacrtanu skicu u funkcionalnu web stranicu.
Ovo je ludo. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Ožujak 14, 2023
Izvor: https://cointelegraph.com/news/chatgpt-v4-aces-the-bar-sats-and-can-identify-exploits-in-eth-contracts