Mulți elevi folosesc agenți de inteligență artificială ca să-i scutească de teme plictisitoare. De multe ori, ei știu că rezultatul prompt-ului nu e la nivelul cerințelor școlare, dar conversația cu ChatGPT a înlocuit demult căutările pe Google. Ar fi mai încrezători să se prezinte la examene cu răspunsurile unor agenți personalizați, informați chiar de manualele și fișele lor de lucru?
Într-un eseu publicat în Dilema, Mara Marinescu, proaspăt trecută prin Evaluarea Națională, scrie despre perioada de pregătire pentru proba de română. Împreună cu colegii „exersează conștiincios modelul de rezolvare a fiecărei cerințe. [...] La școală, copiii compară tiparele, fac schimb, învață cât mai multe.”
Rezumatele, comentariile literare și caracterizările personajelor, așa-zisele eseuri de la limba și literatura română au o reputație care le îndepărtează tot mai mult de încercările pe care le sugerează termenul. În schimb, le iau locul fraze-tipar, vocabular standard și structuri bine exersate. Multe din rezolvările subiectelor de Evaluare Națională sau Bacalaureat sunt atât de mașinale, încât ar putea fi scrise și de un computer cu inteligență artificială mediocră. Elevii memorează mai mult decât gândesc și reproduc mai mult decât creează la o disciplină artistică fundamentală a culturii.
Este foarte răspândită ideea că pregătirea pentru temele și examenele de limba și literatura română se bazează în primul rând pe șabloane. Dacă adaugi și că inteligența artificială livrează teme gata făcute, inclusiv sus-menționatele eseuri, care te trec prin școală pe nesimțite, ai o imagine complet automatizată a școlii din România. Elevul este cel mult un executant, care copiază cerințe în căsuța de prompt, apoi răspunsurile la aceste cerințe, iar în cazuri stringente, ca în preajma unui examen, le memorează.
În această mini-serie, îmi asum, simultan, greșeala generalizării și pe cea a cazurilor izolate, a particularizării. Pornesc de la cele două presupuneri — atrofierea creativității în favoarea memorării și utilizarea excesivă a inteligenței artificiale la teme și teste —, și le probez cu ajutorul unor elevi de liceu.
Am conceput împreună trei agenți personalizați desprinși din Microsoft 365 Copilot (bazat pe GPT-5), cărora le-am dat instrucțiuni specifice materiei de liceu din România și materiale de referință la trei discipline: română, fizică și matematică. Am încărcat copii digitale de manuale, subiecte de bacalaureat, împreună cu rezolvările și baremele lor, dar și câteva fișe de pregătire pe care mi le-au dat elevii, primite de la profesorii de clasă sau meditație. Aceste materiale au fost folosite ca referințe (Copilot permite maximum 100 de fișiere), iar apoi, am pus întrebări diverse agenților, atât sub forma unor subiecte de bacalaureat, cât și inspirate din temele de la școală.
Dacă vrei să vezi exact instrucțiunile de personalizare și fragmente din discuțiile cu agentul, am încărcat aici câteva screenshot-uri și un subiect de bacalaureat pe care l-a rezolvat.
Nu am folosit o metodologie riguroasă, pentru că nu ne-am propus o cercetare. Pe mine m-au interesat mai mult reacțiile elevilor la răspunsurile unor astfel de agenți personalizați, care se inspiră puternic din materialele de referință și câteva detalii tehnice pe care o să le explic. De cealaltă parte, elevii au fost curioși să vadă dacă o astfel de interacțiune le poate oferi mai mult decât uneltele pe care le folosesc de obicei.
Cunosc diverse metode de personalizare mult mai amănunțită, cu unelte de programare diverse, abonamente costisitoare și documentație consistentă. Dar înainte de a te gândi că poate am fost superficial, cred că merită să te întrebi dacă un astfel de efort e justificat, ca să obții, în final, o mașinărie de rezolvat teme și examene, pentru care elevii să fie cel mult spectatori. Reacția lor chiar și la aceste încercări ale mele nu cred că mai lasă loc de întrebări.
Mulțumiri, așadar, colaboratorilor: Rareș Duțulescu, Anca Petcu (clasa a X-a), Ana Gheorghe (clasa a XI-a), Chris Bădulescu, Tudor Cristea, Sofia Dragomir, Cristina Milutinovici (clasa a XII-a).
Bacovia și Creangă, copiați cu emoji și em dash
Primul lucru pe care îl observi în orice conversație cu un agent de inteligență artificială este structura vizuală a răspunsurilor. Din dorința de a-ți rezuma informațiile și a ți le prezenta în bucăți mici, face exces de emoji-uri și liste, în paragrafe foarte scurte. Așa că instrucțiunile pentru agentul personalizat au fost să dea răspunsuri detaliate, structurate ca eseuri, căci altfel, îți analizează poezia lui George Bacovia așa:
Un alt detaliu ortografic, pe care l-a remarcat Tudor, este că agentul folosește multe liniuțe de pauză (em dash, în engleză), ceea ce a ajuns să fie recunoscut ca o „semnătură” a răspunsurilor generate de roboți. Totuși, dacă ții cont că toate modelele lingvistice mari au fost antrenate pe documente și limbaj natural, deciziile de punctuație sunt, în mare parte, acceptabile. Mulți jurnaliști și scriitori au remarcat că doar o privire superficială va spune automat că un text care folosește linia de pauză este generat artificial.
Dar „inspirația” pe care agentul ar trebui să o preia din documentele de referință pe care le-am încărcat alunecă foarte ușor spre copiere. Explicația se leagă de o problemă tehnică și de una specifică domeniilor artistice. Agenții de inteligență artificială nu au acces legal la multe dintre operele literare studiate în școală, din cauza drepturilor de autor. Așa că mai toate citatele pe care le-a reprodus Copilotul nostru se găseau în documentele de referință pe care le-am încărcat.
Nu e vorba doar de citate, însă. Copilotul a încercat să reformuleze idei, dar numai un ochi indulgent ar spune că nu a copiat. De exemplu, în eseul care ar fi trebuit să comenteze poezia „Plumb”, agentul a avut în documentul de referință (scris de un profesor de română) acest paragraf:
Titlul, un alt element al textului poetic, valorifică simbolul central: plumbul, care are aici utilizare simbolic-funerară: cenușiul, greutatea, apăsarea. Repetițiile realizate prin reluarea simbolului accentuează un univers aflat sub o continuă apăsare: flori de plumb, coroane de plumb, amor de plumb, aripi de plumb etc. Plumbul cuprinde atât lumea obiectuală (sicrie, flori, coroane), cât și pe cea sufletească („amor de plumb”). Oximoronul din final, „aripile de plumb”, asociază un simbol ascensional („aripile” – simbol al libertății) plumbului, o tratare prin negație a temei simboliste a elevației, a ascensiunii spirituale. Astfel, titlul este relevant pentru textul poetic bacovian, anticipând un imaginar poetic claustrant, în care ființa este captivă. Repetarea cuvântului-cheie „plumb” și paralelismul sintactic creează impresia de mare simplitate a formei, dar și de intensitate a unei obsesii.
Formularea pe care a găsit-o agentul AI este aceasta:
Titlul poeziei valorifică simbolul central – plumbul – care are o utilizare simbolic-funerară, sugerând cenușiul, greutatea și apăsarea. Repetițiile realizate prin reluarea acestui cuvânt („flori de plumb”, „coroane de plumb”, „amor de plumb”, „aripi de plumb”) accentuează un univers aflat sub o continuă apăsare. Plumbul cuprinde atât lumea obiectuală, cât și pe cea sufletească, iar oximoronul „aripile de plumb” asociază un simbol ascensional cu greutatea, tratând prin negație tema simbolistă a elevației spirituale.
Imaginarul poetic este preponderent vizual, cu imagini precum „flori de plumb”, „funerar vestmânt”, „aripi de plumb”, dar și auditiv, prin versul „scârțâiau coroanele de plumb”, care contribuie la realizarea unui univers agonizant. Spațiul este închis, claustrant, exprimat încă din prima strofă: „stam singur în cavou”.
Apoi, provocarea unor discuții pe teme literare este că majoritatea răspunsurilor nu decurg logic, algoritmic, deci potrivit unei analize computaționale. Cu alte cuvinte, agentul artificial nu poate să deducă lucruri despre poezia „Plumb” sau despre „Povestea lui Harap Alb”, cum ar face-o într-o chestiune de științe, ci trebuie să le știe, adică să le aibă memorate. Acest lucru, împreună cu limitarea legată de drepturi de autor, face ca răspunsurile pe baza textelor literare să fie copiate sau șablonate.
Problema merge și mai departe, la structura eseurilor sau a răspunsurilor mai ample. Cu ajutorul elevilor, am ghidat agentul să scrie un eseu despre basmul popular, cu exemplul „Poveștii lui Harap Alb”. Elevii au cerut apoi să țină cont în dezvoltare de mai multe idei importante, pe care le-au discutat la clasă (viziunea despre lume a autorului sau rolul umorului, elemente de structură, compoziție și limbaj, evoluția personajelor și a moralității lor). Agentul s-a conformat și a rescris eseul, dar fără să-l „înțeleagă”: paragrafele pe care le-a scris urmau întocmai ordinea din prompt, deși nu aceasta ar fi fost ordinea firească într-un eseu. Spre exemplu, în prompt, am lăsat ca ultimă cerință discuția despre diferențele dintre basme populare și cele culte. Un elev ar fi știut că astfel de chestiuni se discută în introducere, dar Copilotul a răspuns întocmai; ultimul paragraf arată așa:
Diferențele dintre basmul cult și cel popular sunt evidente. În basmul popular, autorul este anonim, stilul este simplu, iar personajele sunt tipologice. În basmul cult, autorul este cunoscut (Ion Creangă), stilul este elaborat, iar personajele sunt individualizate psihologic. De asemenea, basmul cult valorifică oralitatea într-un mod artistic, iar viziunea despre lume este mai apropiată de realitate decât de fabulos.
Încheierea eseului AI este stângace și din nou șablonată:
În concluzie, „Povestea lui Harap Alb” este o capodoperă a basmului cult românesc, în care Ion Creangă reușește să îmbine elementele tradiționale cu o viziune artistică modernă. Prin oralitate, umor și profunzime psihologică, autorul construiește o lume fabuloasă, dar credibilă, în care binele învinge, iar omul se desăvârșește prin învățare și empatie.
„Limbaj îmbâcsit” și lipsă de experiență
Într-un alt test, am cerut agentului să rezolve complet un subiect de bacalaureat din 2020, pentru că am fost curioși de abordarea diferită la nivelul celor trei subiecte.
Prima parte, care cerea răspunsuri scurte, pe baza unui text literar la prima vedere, conținut integral în subiect, a fost foarte ușoară. Până la urmă, avea doar să găsească sinonime sau să identifice ideea principală din anumite paragrafe, lucruri pe care le pot face multe unelte de analiză a limbajului natural, chiar în lipsa inteligenței artificiale.
Dar la textul argumentativ am avut o nouă surpriză neplăcută. Cerința era de a scrie un eseu argumentativ despre rolul educației, eventual cu inspirație din textul la prima vedere. Copilotul a mușcat imediat momeala și, pe lângă faptul că a scris un text de doar un paragraf, în care nu și-a delimitat ideile, s-a concentrat aproape exclusiv pe textul la prima vedere. Iar încheierea folosește din nou o tehnică stângace, prin care anunță: „Concluzia este că...”.
Am discutat cu elevii și cu toții au fost de acord că, din cel puțin două puncte de vedere, răspunsul Copilotului este la un nivel foarte slab. În primul rând, structura: fără paragrafe delimitate, totul prezentat într-un singur bloc, deși conține mai multe idei. Iar apoi, concentrarea aproape exclusivă pe exemple din textul dat, ceea ce ar putea fi de înțeles când te gândești că un agent AI nu are „experiență de viață”. În orice caz, subiectul, cu o structură parțial creativă, a fost rezolvat sub așteptări.
În fine, eseul de la subiectul al treilea a fost și el o dezamăgire, din aceleași motive pe care le-am mai întâlnit. A avut de scris un eseu pe baza unui text narativ al lui Mihail Sadoveanu. Agentul a identificat printre fișierele de referință un eseu despre „Baltagul” — exemplul așteptat și în barem —, pe care l-a comprimat și l-a livrat cu un limbaj pe care Cristina l-a numit foarte potrivit „îmbâcsit”:
„Un prim episod relevant este plecarea Vitoriei Lipan în căutarea soțului ei, care evidențiază determinarea și curajul unei femei simple, dar înțelepte. Al doilea episod este descoperirea crimei și confruntarea cu ucigașii, moment de climax care aduce rezolvarea conflictului și reafirmarea valorilor morale.”
Lipsesc citatele și alte detalii mai consistent legate de structura și conținutul operei, pe care le-ar scrie cineva care chiar a citit lucrarea. Așa că i-am cerut să refacă eseul și i-am dat baremul, ca să poată urmări punctele-cheie pe care le aștept. Rezultatul s-a îmbunătățit întrucâtva, dar ideile par din nou deconectate și eseul se încheie, deloc surprinzător, cu „În concluzie...”.
„Operele merită mult mai mult”
După astfel de teste, am stat să discutăm rezultatele din mai multe puncte de vedere.
Accesul non-stop la un agent de inteligență artificială este un avantaj, dar Rareș și Chris, scepticii grupului, sunt preocupați și de impactul ecologic. Cei doi mi-au spus de la început că majoritatea colegilor folosesc AI-ul la teme, chiar și la teste, dar că ei preferă căutări pe Google sau în materialele școlare. „Când ne dă doamna o temă așa, inventată, de nu găsesc pe Google, am mai folosit, recunosc, dar în rest, nu-mi place. Am auzit și de consumul foarte mare de energie”, spune Rareș.
În ce privește discuțiile din cadrul testului, concluzia tuturor a fost că agentul personalizat dă răspunsuri mai bune, pentru că folosește documentele de referință pe care le-am încărcat. Însă niciunul dintre elevi nu s-ar încumeta să se prezinte la clasă sau cu atât mai puțin la bacalaureat cu eseuri sau comentarii de asemenea natură. Între structura schițată, artificială, doar cu puțin superioară unei liste, „limbajul îmbâcsit” și ideile (aproape) copiate, nimeni nu crede că o astfel de temă este acceptabilă.
Nu e vorba numai de teme; am discutat inclusiv despre înțelegerea operelor și a comentariilor acestora, cu tot cu plasarea în context istoric și cultural. Dacă nu ai avea de dat un examen sau de scris o temă, cum ți s-ar părea un astfel de eseu? Găsești natural un astfel de limbaj, ți se pare la îndemână să scrii așa? Înțelegi ce vrea să transmită „criticul”?
Mă bucur să pot încheia cu răspunsul lor negativ. Elevii apreciază ajutorul pe care îl oferă inteligența artificială, dar materialele didactice pregătite de profesori, atât cele scrise, cât și cele discutate la clasă, depășesc din toate punctele de vedere răspunsurile unui ChatGPT sau Copilot, fie el și personalizat. Lectura operelor, urmată de discuții între oameni, care chiar au înțeles ce au citit sau măcar pot discuta cu o anume experiență școlară și de viață, înseamnă pentru ei mult mai mult decât răspunsuri de-a gata, la care apelează, totuși, dar numai când se simt supraîncărcați sau în fața unei teme la o materie pe care nu o prioritizează.
Documentele distribuite de profesori și discuțiile de la clasă conțin „comentarii și eseuri mult mai complexe și materiale mai detaliate. Cred că operele literare merită mult mai mult decât răspunsuri schițate”, concluzionează și Sofia.