EXPERIMENT Am pus boții să rezolve probleme la info, mate și română. „Avem nevoie de oameni care știu să scrie ei singuri sau care știu să folosească AI?”

EXPERIMENT Am pus boții să rezolve probleme la info, mate și română. „Avem nevoie de oameni care știu să scrie ei singuri sau care știu să folosească AI?”

Asta este întrebarea pe care o lansează Letiția Pârcălăbescu, lector de la Universitatea Heidelberg din Germania, specializată pe machine learning. Am analizat alături de ea rezolvările pe care ni le-au dat trei aplicații care se folosesc de inteligența artificială la probleme de matematică, informatică și limba română. Am aflat folosindu-le că dacă vrei ca boții să-ți rezolve tema, nu ai garantată o notă bună, dar abilitățile cu procesul nu sunt de lepădat. Totuși, e bine de știut că „mâna” AI e greu de detectat, chiar și prin aplicații specifice. 

03.10.2023

de George Herlaș

Inteligența artificială a luat un avânt la finalul lui 2022 când a fost lansată aplicația ChatGPT. Tot mai mulți oameni au accesat platforma care funcționează ca un asistent personal care răspunde la tot ceea ce îl întrebi. Dar ChatGPT nu e singurul algoritm de inteligență artificială creat. Mai sunt și alții, specializați pe crearea de poze ori videoclipuri sau asemănători cu sistemul dezvoltat de OpenAI, frați ai lui ChatGPT.

Am utilizat trei dintre aceștia: ChatGPT de la OpenAI, My AI de la Snapchat și Bard de la Google, pentru a vedea dacă pot rezolva probleme de informatică, matematică sau subiecte de română. 

Redacția Școala 9 a discutat și cu un lector de la Universitatea Heidelberg din Germania, specializat în „machine learning” pentru a afla de ce roboții rezolvă probleme de info dar sunt bâtă la unele de mate și cum funcționează modelele care ar trebui să detecteze ce nu este făcut de om. 

Mai puțin „deștept” în română

Letiția Pârcălăbescu, lector de la Universitatea Heidelberg din Germania, specializat în „machine learning” ne-a explicat că în ciuda faptului că putem comunica în română cu acești boți, ei funcționează mai bine în engleză: „Aceste modele sunt antrenate mult mai puțin pe română pentru că majoritatea internetului este în engleză și ele au fost antrenate pe foarte multe date de pe internet și româna este foarte slab reprezentată. Dacă căutăm într-o limbă africană, probabil avem zero succes, pentru că nu au văzut particularitățile acelei limbi”.

Ilustrație generată cu ajutorul intelienței artificiale 

Pentru a folosi aceste programe de inteligență artificială, este nevoie să ai cont pe platformele lor - OpenAI, Snapchat sau Google. ChatGPT și Bard păstrează conversațiile, pe când la My AI mesajele dispar, imediat sau după 24 de ore, asta dacă nu le salvezi manual. Timpul de răspuns la fiecare e de doar câteva secunde, indiferent de cerință. Practic, ai pe telefon sau laptop permanent pe cineva care îți răspunde la mesajele pe care i le trimiți. Bard poate chiar vorbi cu tine, adică citește mesajele pe care le trimite, prin funcția cunoscută sub denumirea de „text-to-speech”, iar My AI îți cere și trimite poze. 

Problemă de informatică de clasa a IX-a, rezolvată perfect

Pentru a testa cât de bine reușesc niște algoritmi să creeze alți algoritmi, am ales aleatoriu o problemă de informatică de pe platforma pbinfo.ro, am dat-o celor trei boți să o rezolve și am încărcat variantele lor, dat fiind faptul că Pbinfo oferă posibilitatea de a încărca sursa și o evaluează cu puncte între 0 și 100. 

„Să se scrie un program care citeşte de la tastatură un număr natural cu cel puţin două cifre şi determină suma dintre cifra zecilor şi cifra unităţilor numărului citit” este problema pe care am dat-o celor trei roboți să o rezolve.

Problema este una de clasa a IX-a, care, pe lângă scrierea de cod, implică și cunoștințe de matematică, pentru aflarea cifrei zecilor și a unităților numărului citit.

Codurile au fost introduse ca date speciale în softurile AI

Fiecare dintre ei a venit cu codul scris în limbajul C++, după cum i-am cerut noi, iar Bard și My AI au luat 100 de puncte pe Pbinfo. ChatGPT a luat 0 puncte, dar nu pentru că nu ar fi rezolvat corect, ci pentru că a folosit elemente care nu sunt recunoscute de Pbinfo. 

Pârcălăbescu explică de ce au reușit să scrie codul corect: „Modelele au fost antrenate explicit - li s-au dat date despre programare: astea sunt probleme de informatică, trebuie să-mi scrii cod sau ăsta e codul, trebuie să continui codul și să ajungi la un astfel de rezultat”. Asta înseamnă că nu au folosit doar date de pe internet, ci și alte date, introduse de programatori. 

Am vrut să vedem și dacă softurile care promit că detectează informațiile generate de inteligența artificială ne arată și nouă că am scris codul cu ajutorul acesteia. Siteurile folosite au fost zerogpt.com și contentscale.ai. Doar codul scris de MyAi de la Snapchat a fost prins că a fost generat cu ajutorul inteligenței artificiale. Pentru celelalte, ni s-a zis că au fost scrise de om.

Vârsta Mariei i-a dat de furcă lui My AI 

Tot din domeniul științelor exacte, le-am dat celor trei roboți să rezolve o problemă de clasa a VIII-a de la Evaluarea Națională. 

„Maria are 14 ani și tatăl ei 40 de ani. Peste câți ani vârsta Mariei va fi jumătate din vârsta tatălui?”

Fiecare dintre cei trei roboți ne-au dat răspunsuri diferite, iar singurul corect a fost cel generat de Chat GPT, adică 12 ani și am primit și explicația, asemănătoare cu cea din barem. 

Ilustrație generată cu ajutorul intelienței artificiale 

My AI: „Dacă în prezent Maria are 14 ani și tatăl ei are 40 de ani, atunci diferența de vârstă este de 26 de ani. Pentru ca vârsta Mariei să fie jumătate din vârsta tatălui, diferența de vârstă trebuie să fie aceeași. Prin urmare, peste 26 de ani, când Maria va avea 40 de ani și tatăl ei va avea 66 de ani, vârsta Mariei va fi jumătate din vârsta tatălui. Deci, răspunsul este 26 ani.”

Bard: „Diferența dintre vârsta Mariei și a tatălui ei este de 40-14=26 de ani. Pentru ca vârsta Mariei să fie jumătate din vârsta tatălui ei, diferența dintre vârstele lor trebuie să fie egală cu jumătate din vârsta tatălui ei. Așadar, Maria trebuie să aibă 26/2=13 ani. Deci, Maria va avea 13 ani peste 26-13=13 ani. Răspuns: 13 ani”

Chat GPT: „La momentul actual, vârsta Mariei este de 14 ani și vârsta tatălui este de 40 de ani. Peste x ani, vârsta Mariei va fi de 14 + x, iar vârsta tatălui va fi de 40 + x. Conform condiției problemei, vârsta Mariei va fi jumătate din vârsta tatălui peste x ani, deci putem scrie ecuația: 14 + x = (40 + x) / 2. Putem rezolva această ecuație pentru a găsi valoarea lui x. Multiplicăm ambele părți ale ecuației cu 2 pentru a scăpa de fracție: 2 * (14 + x) = 40 + x

Distribuim: 28 + 2x = 40 + x. Adunăm -x la ambele părți ale ecuației: 28 + x = 40. Scădem 28 de la ambele părți ale ecuației: x = 40 - 28. x = 12. Deci, peste 12 ani, vârsta Mariei va fi jumătate din vârsta tatălui”.

AI vede altfel numerele față de oameni 

Răspunsurile date de AI sunt, de fapt, preconizări a ce cuvinte ar urma. De aici răspunsurile incorecte: „Noi știm că 2+2 e 4, că 2+3 e 5, dar aceste modele nu pricep algoritmul acesta, pentru că ele sunt antrenate doar pentru a continua secvența. Dacă îl întrebăm cât e 2+2 va fi cel mai probabil 4, pentru că are în datele de antrenare, dar dacă sunt completări mai puțin comune, atunci aritmetica devine dificilă pentru că el vede numărul descompus. Pentru noi 2.540 e ceva ce vedem ca pe un întreg, dar el vede 2, 5, 4 și 0. Este destul de dificil de înțeles că este o unitate, iar când avem și zecimale, devine și mai complicat”, explică Pârcălăbescu. 

Softurile specializate care nu detectează ceea ce generează AI

  • Răspunsul lui Chat GPT a fost detectat de zerogpt.com ca fiind făcut de o inteligență artificială în proporție de aproape 17%, iar contentscale.ai spune că a fost dat de un om;
  • Ceea ce ne-a spus Bard este generat în proporție de 66% de AI, potrivit lui zerogpt.com și 0%, conform contentscale.ai;
  • MyAI câștigă detașat la matematică, dat fiind faptul că niciunul dintre cei doi detectori folosiți de noi nu și-au dat seama că textul ar fi scris de AI, deși există niște neconcordanțe clare.

Specialista în machine learning ne-a explicat că softurile care detectează AI caută diferențe între texte: „Modelele sunt antrenate pe comparații - ăsta e text scris de om, ăsta e text scris de Bard și spun diferența. La fel cum sunt modele antrenate să detecteze fețele de non-fețe, ca atunci când telefonul îți detectează fața într-o poză, așa sunt antrenate și modelele de a identifica textele scrise de AI de textele scrise de om”.

AI, bun la gramatica limbii române

„Oamenii pun în detector texte dintr-o altă categorie față de cele la care s-a gândit programatorul când a construit modelul. El poate nu s-a gând să pună și lucruri în română. Modelul a fost antrenat pe texte standard - de Wikipedia, Twitter, Reddit, dar nu s-a gândit că într-o anumită limbă ar putea fi un anumit subiect”, explică Pârcălăbescu erorile pe care le dau softurile care detectează AI.

Pentru română, le-am dat celor trei de rezolvat un exercițiu de gramatică de la Evaluarea Națională: „Selectează, din secvențele următoare, trei substantive comune aflate în cazuri diferite, precizând cazul în care se află fiecare: „Văduva suspină, căci atâta copil avea și ea și mult îi era dragă fata, [...] norocul copilului său îl visa [...]. 

— Mergi – îi zise dar –, copila mea, și nici spini, nici buruiană în calea ta să nu găsești.”

Chat GPT a găsit trei substantive și a nimerit cazul la două dintre ele, iar Bard și Snapchat au rezolvat corect exercițiul. Niciunul dintre cele două site-uri folosite pentru detectarea inteligenței artificiale nu ar fi observat că textele au fost scrise astfel. 

Pentru a fi detectat textul scris de boți, firmele ar trebui să pună un watermark

Din experimentul Școala 9 reiese că inteligența artificială uneori funcționează, iar alteori nu și la fel se întâmplă și cu softurile care ar trebui să detecteze ceea ce nu e făcut de om. 

Pentru o mai bună acuratețe a detectării, Pârcălăbescu spune că ar trebui ca „OpenAI, de pildă, să bage un «watermark», ca o amprentă în cuvinte și care se poate detecta cu acuratețe. Pentru asta, trebuie să existe legi care să-i forțeze să bage acest watermark pentru că altfel textul nu este recognoscibil întotdeauna. Dacă nu e antrenat pe română, nu va recunoaște textele în română”.

De asemenea, în ceea ce privește școala, profesoara spune că „profesorul trebuie să se obișnuiască cu faptul că s-ar putea să primească soluții de la ChatGPT, deci ar trebui să își schimbe modul de evaluare”. 

Ilustrație generată cu ajutorul intelienței artificiale 

„Ai nevoie de inteligență umană ca să știi să folosești inteligența artificială”

Ea mai spune că nu se supără pe studenții care folosesc programe de acest fel, ci atunci când o fac, își ridică așteptările: „Ai nevoie de inteligență umană ca să știi să folosești inteligența artificială. Eu nu sunt supărată pe studenții mei dacă folosesc astfel de unelte, pentru că suntem încă în stadiul în care este dificil să le folosești. Le folosești ca și cum ai avea un coleg care este foarte bun la proiect și faci mai mult. Tocmai pentru că ai un coleg mai bun, nu reinventezi roata, ci căruța. Eu doar îmi ridic așteptările dacă folosești un asistent - înseamnă că faci mai bine, faci mai mult și faci mai repede”. 

„Avem acum nevoie de oameni care știu să scrie ei singuri sau avem nevoie de oameni care știu să folosească inteligența artificială? Asta este întrebarea la care trebuie să se gândească profesorii”, încheie Pârcălăbescu. 

Fotografia principală și ilustrațiile din acest articol au fost realizate cu ajutorul inteligenței artificiale. 

George Herlaș

reporter

George Herlaș este student la Facultatea de Jurnalism și Științele Comunicării din cadrul Universității din București și s-a alăturat echipei Școala 9 pentru că spune „da" oricărei provocări. Prin jurnalism, vede o misiune de a aduce valoare cititorilor și întregii comunități.

CUVINTE-CHEIE

elevi școală examene nationale inteligenta artificiala ai română matematică informatică probleme