Cum putem prevedea criza cu ajutorul unor algoritmi
Dar ce-ar fi dacă asemenea evenimente destabilizatoare ar putea fi previzionate din timp? Ce acţiuni ar putea să întreprindă liderii dacă semnalele de alarmă timpurii ar fi mai uşor de detectat? Tocmai în acest deceniu, noi am ajuns în sfârşit să deţinem acel volum critic de date şi acel nivel al puterii de calcul de care avem nevoie pentru a crea asemenea instrumente de detectare.
“Ce e istoria? Un ecou al trecutului, ajuns în viitor”, scria Victor Hugo în romanul său “Omul care râde”. Deşi evenimentele viitoare au loc în circumstanţe care sunt unice pentru aceste evenimente, ele urmează în mod tipic aceleaşi tipare familiare din trecut. Avansurile pe care le-a înregistrat omenirea în materie de calcul computerizat, de capacitate de stocare a datelor şi de creare a algoritmurilor complexe pe care se bazează ştiinţa prelucrării datelor permit ca acele tipare să devină vizibile.
Un sistem a cărui dezvoltare am condus-o în ultimii şapte ani culege istorii “la scară mare”, enciclopedii, materiale media culese din postările găsite în reţelele de socializare şi din relatările făcute de către mass media în timp real, precum şi informaţii despre comportamentul pe care oamenii îl au pe Internet – toate în format digital – pentru a calcula nişte estimări în timp real ale probabilităţilor ca unele evenimente viitoare să aibă loc. În principiu, sistemul combină articolele publicate de cotidianul New York Times timp de 150 de ani, toate informaţiile cuprinse în binecunoscuta enciclopedie online Wikipedia, precum şi milioane de căutări şi de site-uri de pe Internet, pentru a crea un model al probabilităţii producerii unor rezultate sau consecinţe potenţiale ce ar putea avea loc în contextul unor condiţii specifice. Algoritmul generalizează succesiunile evenimentelor istorice extrase din acele seturi masive de date, încercând în mod automat toate combinaţiile cauză-efect posibile şi găsind corelaţii statistice.
De exemplu, noi am creat recent nişte algoritmuri care permis realizarea, pentru prima oară în ultimii 130 de ani, a unei previziuni pline de acurateţe a unei epidemii de holeră. Tiparul pe care l-a dedus sistemul nostru a arătat că este mult mai probabil ca epidemiile de holeră din zonele geografice “fără ieşire la mare” să izbucnească în urma unor furtuni, în special când aceste furtuni sunt precedate, cu până la doi ani în urmă, de o perioadă de secetă prelungită. Lucrul acesta este surprinzător, fiindcă holera este o boală care se transmite prin apă şi te-ai aştepta ca asemenea epidemii să aibă loc în nişte zone cu o mare concentrare de apă. (O posibilă explicaţie ar putea proveni din modul în care sunt tratate infecţiile cu bacteria holerei: dacă este furnizat în mod prompt un tratament pentru deshidratarea rapidă şi masivă cauzată de holeră, ratele mortalităţii cauzate de holeră scad de la 50% până la mai puţin de 1%. Drept urmare, s-ar putea ca epidemiile să nu fi avut loc în acele zone în care există suficientă apă curată).
Implicaţia unor asemenea previziuni, dedusă în mod automat de către un sistem statistic care se auto-actualizează permanent, este că echipele medicale pot fi alertate chiar şi cu doi ani în avans de faptul că într-o anumită locaţie există riscul unei epidemii de holeră.
Alte epidemii pot fi previzionate într-un mod similar. Ebola este încă destul de rară, aşa că tiparele statistice sunt greu de dedus. Dar, chiar şi în aceste condiţii, dacă folosim datele privitoare la numărul de victime umane, culese din publicaţiile medicale, în combinaţie cu datele referitoare la evenimentele care se repetă, apare într-adevăr un tipar evident pentru modul în care apar epidemiile de Ebola.
Mai multe publicaţii au relatat că există o legătură între, pe de o parte, atât actuala epidemie, cât şi cele precedente, iar pe de altă parte, liliecii “de fructe” –care se hrănesc numai cu fructe şi polen şi denumiţi lilieci frugivori. Dar din ce cauză ajung liliecii frugivori să intre în contact cu oamenii?
Primele epidemii de Ebola au avut loc în 1976 în Zair şi Sudan. Cu un an înainte, în acea zonă a erupt un vulcan, fapt care i-a determinat pe mulţi oameni să caute acolo aur şi diamante. Aceste căutări au atras după ele un val de despăduriri. Algoritmul nostru a dedus, din enciclopedii şi din alte baze de date, faptul că despăduririle cauzează migraţia animalelor – inclusiv migraţia liliecilor frugivori.
Noi am folosit aceeaşi abordare pentru a crea un model probabilistic pentru izbucnirile violente. Sistemul nostru a prezis că vor avea loc revolte în Siria şi Sudan, precum şi locaţiile în care vor avea loc, prin faptul că a remarcat că există o probabilitate mai mare ca revoltele să aibă loc atunci când sunt anulate subvenţiile de preţ care fuseseră acordate până atunci pentru anumite produse în nişte regiuni nedemocratice, caracterizate de un PIB în creştere şi de un venit scăzut per cap de locuitor.
Algoritmul a previzionat şi probabilitatea unui genocid, identificând faptul că este mult mai probabil ca un genocid să aibă loc dacă liderii sau personalităţile marcante dintr-o ţară dezumanizează o minoritate din cadrul acelei populaţii, mai ales când se referă la minorităţi ca şi cum ar fi o plagă sau nişte insecte sau animale dăunătoare. Un asemenea exemplu este genocidul din Ruanda. Cu ani buni înainte ca 4.000 de oameni de etnia minoritară Tutsi să fie masacraţi în comuna Kivumu, liderii etniei majoritare Hutu (reprezentând aproape 85% din populaţia ţării), precum primarul comunei Kivumu, Gregoire Ndahimana, s-au referit la oamenii din etnia minoritară Tutsi denumindu-i “invenzi” (gândaci de bucătărie).
Pe baza acelor date şi a altor date istorice, algoritmul nostru a dedus faptul că probabilitatea unui genocid creşte de aproape 4 ori dacă: o persoană sau un grup descrie un grup minoritar (aşa cum este definit prin termenul folosit în recensământul populaţiei şi în datele ONU) fie drept un non-mamifer, fie ca un animal care răspândeşte boli; iar vorbitorul face acest lucru cu trei până la cinci ani înainte ca grupul minoritar să ajungă să fie de cel puţin câteva zeci de ori subiectul ştirilor din presă şi să poată fi găsit pe Wikipedia, într-o prezentare realizată în limba locală.
După o analiză empirică făcută asupra a mii de evenimente din ultimul secol, am observat că sistemul nostru identifică 30% până la 60% din evenimentele ce urmează să aibă loc cu un grad de acurateţe de 70% până la 90%. Aşa ceva nu este tocmai “de claritatea cristalului”. Dar este, de departe, ceva cu mult mai bun decât ceea ce a avut la îndemână înainte omenirea.
Oare ce ar însemna pentru ONG-uri, companiile de construcţii şi organizaţiile pentru protecţia sănăţăţii să ştie că secetele urmate de furtuni ar putea duce la izbucnirea unor epidemii de holeră? Ce ar însemna pentru companiile miniere, autorităţile de reglementare, organizaţiile ecologiste şi liderii guvernamentali să ştie că exploatările miniere duc la despăduriri şi că despăduririle duc la migraţia liliecilor frugivori, iar migrarea liliecilor frugivori ar putea creşte riscul izbucnirii unei epidemii de Ebola? Şi ce am face noi toţi cu informaţia potrivit căreia anumite alegeri privind limbajul folosit şi anumite schimbări politice pot declanşa un val de violenţă generalizată? Cum am putea cu toţii să începem să gândim în mod diferit în privinţa riscului?
Da, bazele masive de date şi procesele analitice sofisticate permit cu adevărat companiilor să-şi îmbunătăţească în mod considerabil marjele de profit. Dar combinaţia dintre cunoştinţele obţinute prin “sondarea” a milioane de articole de presă, mii de articole din enciclopedii şi nenumărate site-uri, realizată pentru a furniza o analiză de tip cauză-efect coerentă, are un potenţial mult mai mare decât o combinaţie de informaţii ce permite doar o creştere a vânzărilor. Ne poate permite să anticipăm crize care până acum erau imprevizibile, să gândim mai strategic în privinţa riscului şi să înarmăm umanitatea cu o înţelegere profundă şi intuitivă ceea ce s-ar putea întâmpla în viitor, bazată pe lecţiile învăţate din experienţele relevante din trecut. Înseamnă că putem face ceva în privinţa volatilităţii, incertitudinii şi ambiguităţii care ne înconjoară. Şi mai înseamnă că data viitoare când are loc o revoltă violentă sau izbucneşte o epidemie, liderii nu vor mai fi luaţi prin surprindere.
Kira Radinsky este Chief Technical Officer şi co-fondator al SalesPredict, o firmă ce le furnizează companiilor informaţii privilegiate şi valoroase privind ciclul de viaţă al clienţilor, informaţii care îi ajută pe profesioniştii din marketing şi vânzări să crească ratele de conversie a potenţialilor clienţi în clienţi efectivi şi să-şi accelereze ciclurile de vânzări folosind procesele analitice predictive. Kira Radinsky a fost inclusă în topul “35 de Inovatori în vârstă de până la 35 de ani” realizat în 2013 de MIT Technology Review – revistă fondată în 1899 la faimoasa universitate MIT şi beneficiind de autoritatea sa în domeniul tehnologic – iar în 2014 ea a fost inclusă, de către revista Forbes, în Topul 50 al celor mai influente femei din Israel.