O companie formată doar din angajați AI s-a prăbușit. Ce s-a întâmplat

Un experiment recent desfășurat de cercetătorii de la Universitatea Carnegie Mellon a demonstrat ceva ce mulți dintre noi bănuiam: inteligența artificială nu este (încă) capabilă să ne înlocuiască complet la locul de muncă. Deși se vorbește tot mai mult despre AI care “va fura joburile oamenilor”, realitatea e departe de acest scenariu apocaliptic, scriu cei de la futurism.com.
Ca să testeze cât de bine s-ar descurca agenții AI în lumea reală a muncii, cercetătorii au creat o companie falsă, numită sugestiv TheAgentCompany. Acolo, toate rolurile — de la ingineri software la manageri de proiect și analiști financiari — au fost ocupate exclusiv de agenți AI de la companii mari precum OpenAI, Google, Meta și Anthropic.
Ce au avut de făcut „angajații” AI?
Sarcinile au fost inspirate din activitatea zilnică a unei companii reale de software. Agenții AI au trebuit, printre altele:
- să navigheze prin dosare și fișiere,
- să scrie evaluări de performanță,
- să viziteze virtual spații de birouri,
- să interacționeze cu colegi simulați, inclusiv cu un departament de resurse umane.
Rezultatele?
Cel mai „productiv” agent a fost Claude 3.5 Sonnet, dezvoltat de Anthropic, dar chiar și acesta a reușit să ducă la capăt doar 24% dintre sarcini. Iar pentru fiecare dintre ele a fost nevoie, în medie, de 30 de pași și de un cost de peste 6 dolari per task.
Al doilea cel mai „harnic” agent, Google Gemini 2.0 Flash, a avut o rată de succes de doar 11,4%, cu un proces și mai greoi – aproximativ 40 de pași pentru fiecare sarcină finalizată. Cel mai slab performer a fost Nova Pro v1 de la Amazon, care a finalizat doar 1,7% dintre sarcini.
De ce au eșuat agenții AI?
Studiul a identificat mai multe probleme majore:
- Agenții nu înțeleg contextul social sau situațiile ambigue.
- Slabe abilități sociale. De exemplu, dacă nu găseau pe cineva pe „chat”, unii încercau să rezolve problema… prin rescrierea numelui altui utilizator pentru a se potrivi cu cel căutat.
- Dificultăți în navigarea pe internet și între distingerea a ceea ce e relevant și ce nu.
- Tendința să-și mintă propriul sistem – au creat soluții scurtate care, de fapt, strică și mai mult lucrurile.
Ce înseamnă asta pentru noi?
Deși agenții AI pot fi de ajutor pentru sarcini simple, repetitive, studiul arată clar că nu sunt pregătiți pentru munca complexă pe care oamenii o fac zi de zi într-o companie. În ciuda progreselor tehnologice, AI-ul actual este în esență o versiune sofisticată a funcției de completare automată a telefonului — departe de ideea unei inteligențe conștiente și autonome.
CITEȘTE ȘI: Ce poate învăța un vânzător dintr-un call ratat?
Foto: ID 316782370 | Ai Robots Job ©Inna Kot | Dreamstime.com