SUA cred că ar fi găsit cheia pentru a câștiga cursa AI împotriva Chinei: Etichetarea datelor, anunțată de Pentagon

Gheorghiță Orjanu |

Data publicării: 29.01.2023 20:12

Inteligență artificială, poză cu caracter descriptiv Sursă foto: US Army

Pentru a depăși China în jocul din ce în ce mai competitiv de inteligență artificială (AI – artificial intelligence), SUA trebuie să-și intensifice dramatic eforturile de a colecta, eticheta și sorta munți de date care, în cele din urmă, vor fi, utilizate în regimuri de antrenament automat, a spus șeful pentru AI de la Pentagon, potrivit publicației americane Defense News.

„Învățarea automată (Machine Learning - ML) nu vă va economisi bani. ML vă va costa bani. De ce? Trebuie să etichetați acele date”, a declarat directorul pentru sisteme digitale și AI, Craig Martell, pe 26 ianuarie, la simpozionul organizat de Centrul pentru Strategie și Război/Academia Forțelor Aeriene. „Dacă vom învinge China și trebuie să învingem China în AI, trebuie să găsim o modalitate de a eticheta la scară. Pentru că dacă nu etichetăm la scară, nu vom câștiga”, arată Defense News.

Sistemele sau echipamentele cu capacități de recunoaștere a modelelor și sistemele autonome necesită cantități semnificative de date pentru antrenare (învățare), acestea trebuind să fie corecte, pentru ca ulterior, după antrenare/ învățare, sistemele să-și facă bine treaba.

Generarea acestor seturi uriașe de date necesită resurse: timp, date și forță de muncă.

Postul lui Martell, CDAO (Chief Data and AI Officer), a fost înființat în decembrie 2021, cu scopul de a accelera și extinde integrarea sistemelor AI și a analizei datelor în cadrul Departamentului de Apărare. Biroul a făcut primii pași concreți câteva luni mai târziu, în iunie, după ce a subsumat Centrul Comun de AI, Serviciul Digital al Apărării, Advana (Advanced Analytics - platforma de date mari a DoD pentru analiză avansată) și Șeful Datelor DoD.

„Au văzut că acești patru, împreună, creează de fapt, ceea ce eu numesc această ierarhie a nevoilor de date și inteligență artificială”, a declarat Martell. „În principiu, în partea de jos, trebuie să obținem datele corecte. În plus, trebuie să obținem analize grozave.”

Datele de jos, de la baza piramidei de informații, sunt numite și date primare. Ele pot fi date brute, de regulă de mare claritate, care sunt obținute de senzori în condiții perfect cunoscute sau pot fi date axiomatice care sunt validate de mediul științific. Aceste date primare trebuie să fie corecte, deoarece cu ele se antrenează sistemele AI, sisteme care ulterior vor face prelucrări de date provenite din medii operaționale unde sunt prezente distorsiuni, erori și mai ales înșelări ale inamicului.

Pentagonul a urmărit de ani de zile inteligența artificială ca un mijloc de a lua mai rapid decizii mai informate și de a facilita explorarea acolo unde nimeni nu ar îndrăzni să meargă.
China și Rusia, principalele amenințări la securitatea națională, au, de asemenea, programe de AI destul de avansate, potrivit oficialilor americani.

China, în prezent, se ocupă de etichetarea masivă, dar manuală a datelor

„China nu ne bate pentru că au acces la algoritmi mai buni”, a spus Martell, care a lucrat anterior la Lyft și LinkedIn. „Vor să stea doar în aceste camere mari: „Tanc, nu tanc, tanc, rachetă, nu rachetă”, doar etichetând datele, 10 până la 12 ore pe zi, șase zile pe săptămână, fără să fie plătiți, pentru că ei trăiesc într-un stat autocratic.”

Etichetarea înseamnă, în principiu, ca unui obiect/entitate să i se atribuie un nume (cel puțin un nume) pentru ca ulterior acest obiect/entitate să poată fi găsit(ă) mai ușor în volumul uriaș de date cu care se operează în prezent.

De exemplu, elevii pun (de regulă), pe caietele de studiu, etichete pe care scriu numele disciplinei de studiu – matematică, fizică, istorie etc. Astfel, nu mai au nevoie să deschidă fiecare caiet și să citească în interior pentru a fi nevoie să-l găsească pe cel dorit. Este o ușurare, dar mai rămâne încă mult de căutat, dacă sunt să zicem 10 de discipline de studiu, fiecare cu două caiete.

În continuare, caietele pot fi îmbrăcate cu folii de culori diferite - roșu pentru științe exacte, de exemplu, și alb pentru cele sociale. Astfel, pe lângă nume, se mai primește o etichetă de culoare, care reduce munca de căutare, la jumătate.

Se poate continua cu una sau două etichete în acest caz, astfel încât să se ajungă la un compromis cu efortul de memorare a etichetelor, care să nu devină prea costisitor.

SUA au sute de proiecte de AI, inclusiv de sisteme de arme majore

Peste 685 de proiecte de AI, inclusiv mai multe legate de sistemele de arme majore, erau în curs de desfășurare la Departamentul american al Apărării la începutul anului 2021, potrivit unui raport al Oficiului de Responsabilitate Guvernamentală.

La începutul acestei luni, Forțele Aeriene au apelat la Universitatea Howard pentru un contract pe cinci ani, de 90 de milioane de dolari, pentru a desfășura cercetări privind autonomia tactică a mașinilor, inclusiv echipele mixte om-mașină.

În general, SUA, legat de domeniul militar, adoptă strategii bazate pe întrebuințarea la scară mare a automatizării care au ca efecte o eficiență mai mare, reducerea cât se poate de mult a pierderilor umane, limitarea erorilor umane foarte prezente în situații de criză etc.

În acest caz, al etichetării datelor primare, Departamentul american al Apărării, optează pentru dezvoltarea de algoritmi, spre deosebire de China care încearcă să facă același lucru, dar manual.

O potențială eroare într-un algoritm va genera o eroare sistematică, care, de regulă, este vizibilă, rapid depistată și izolată, principalul dezavantaj fiind afectarea unei părți mari a sistemului.

Pe de altă parte, eroarea umană este, de regulă, complet aleatorie și va rămâne pentru, mult timp, adânc îngropată, generând, tot aleator, erori, aparent inexplicabile, la vârful piramidei informaționale. Principalul dezavantaj este că în situații de criză, eroarea nu va fi percepută de factorul uman datorită presiunii evenimentelor și credinței că sistemul este cvasi-infailibil (dă foarte rar erori).

În plus, algoritmii de etichetare, după ce au fost validați, vor fi folosiți și în situațiile operaționale, deoarece datele culese vor fi la rândul lor etichetate (indexate – se mai folosește și acest termen).

DefenseRomania App

Fii primul care află cele mai importante știri din domeniu cu aplicația DefenseRomania. Downloadează aplicația DefenseRomania de pe telefonul tău Android (Magazin Play) sau iOS (App Store) și ești la un click distanță de noi în permanență