MAE va monitoriza în timp real site-uri de știri, bloguri și conturile pe rețelele de comunicare virtuală ale jurnaliștilor, celebrităților și demnitarilor

Ministerul Afacerilor Externe (MAE) a anunţat intenţia de a cumpăra un sistem IT bazat pe Inteligență Artificială (IA) care să monitorizeze în timp real conținutul online de pe platformele de comunicare virtuală, site-uri de știri, bloguri, dar și conturile celor mai urmăriți influenceri – jurnaliști, celebrități și demnitari. Scopul declarat este de a detecta, analiza și combate dezinformarea și propaganda.

Ministerul Afacerilor Externe (MAE), condus până de curând de liberalul Bogdan Aurescu, a demarat sâmbătă, 10 iunie, o licitație deschisă pentru achiziția unui sistem IT bazat pe algoritmi avansați de Inteligență Artificială pentru analizarea și verificarea conținutului online pentru a determina originea acestuia, în scopul detectării, analizării, identificării și combaterii dezinformării din mediul online în domeniile de responsabilitate ale MAE.

Contractul, cu o valoare estimată la peste 3,2 milioane de lei (fără TVA), este finanțat cu fonduri UE și ar urma să fie implementat în termen de 4 luni, potrivit datelor din Sistemul Electronic de Achiziții Publice (SEAP).

Contractul include și achiziția serviciilor de instruire aferente pregătirii personalului propriu în folosirea instrumentului IT dezvoltat.

Vor fi colectate 500 GB de date pe lună: Ce conținut online va fi monitorizat în timp real

În caietul de sarcini al licitației se menționează că în procesul de colectare a datelor din surse de tip Facebook, Twitter etc., modulele de colectare este necesar să asigure un volum minim de 500GB date colectate pe lună, fără costuri suplimentare pentru MAE.

Iată ce prevede Caietul de sarcini:

Sistemul IT va include, printre altele, un modul de colectare a datelor online, de tip COTS sau open source, pentru monitorizarea în timp real a conținutului online (platformelor de comunicare virtuală, site-uri de știri, bloguri etc.), cu următoarele capabilități:

  • segmentare geografică – posibilitatea de separare a datelor / mențiunilor în funcție de țara de origine;
  • detecție rapidă – articolele, mențiunile sau postările este necesar să fie detectate într-un interval de maxim 30 de minute;
  • monitorizare interacțiuni – în măsura în care sistemele sursă permit aceasta, sistemul este necesar să fie capabil să colecteze statistici cu privire la interacțiunile utilizatorilor cu conținutul monitorizat: număr de vizualizări, like-uri, distribuiri etc. (sistemul este necesar să includă posibilitatea de a programa reîmprospătarea datelor la intervale de timp, pentru a putea acoperi întreaga durată de viața a unui articol, sau postare);
  • să extragă date publice din platforme de comunicare virtuală, cel puțin: Facebook, Twitter, Instagram, minim postări și comentarii pentru fiecare rețea de comunicare virtuală, cu și fără a fi nevoie de autentificare;
  • să permită extragerea metadatelor asociate unei pagini web: data, autor, keywords, descriere, titlu.

Instrumentul IT va fi o soluție bazată pe un portal web în care reprezentanții desemnați din cadrul MAE vor accesa datele și informațiile necesare.

Sistemul de IA va monitoriza influenceri și site-uri de știri dar și starea emoțională produsă de articole

Iată câteva dintre serviciile pe care viitorul sistem IT bazat pe Inteligență Artificială se așteaptă să le furnizeze:

Dashboard customizabil (n.a. interfață grafică de administrare):

  • Dashboard configurabil, sub forma de widgets (drag & drop) pentru a putea compara diverse subiecte, influenceri, cuvinte cheie etc.
  • Feed – utilizatorul poate naviga și gestiona toate mențiunile, să le distribuie altor utilizatori ai sistemului, să adauge note sau etichete. De asemenea, poate arhiva / clasifica informația în dosare personale.

Vizualizare date:

  • Determinarea automată a asemănărilor semantice dintre textele analizate, extragerea de hyperlinkuri și referințe din articolele online.
  • Aceste linkuri vor fi folosite pentru a construi un grafic de relații semantice semnificative, care descoperă modul în care informația se deplasează în diverse medii online, urmărind-o înapoi la originea acesteia (sursa inițială).

Filtrarea datelor

  • Sistemul este necesar să permită filtrarea datelor stocate în funcție de subiect / categorie, cuvinte cheie, canal media, nume utilizatori, perioade de timp (azi, ieri, săptămâna / luna trecută etc.), sentiment, limbă, țară, etichete etc.

Analiza stărilor emoționale induse de un articol

  • Sistemul va atribui automat tipul stării emoționale induse de un articol (benefică, nefastă, neutră) cel puțin în limbile română și engleză și va permite analiza acestora în funcție de canalul media, tendințe, subiecte etc.
  • Totodată, ofertantul va fi necesar să prezinte dovezi clare de existență la momentul ofertării a modulului de analiză a stării emoționale induse de un articol și pentru minim limbile spaniolă, italiană, rusă, franceză, germană portugheză, maghiară, ce vor putea fi achiziționate de MAE ulterior finalizării și punerii în producție a instrumentului IT.

Analiză influenceri și profile

Identificarea celor mai activi / influenți autori, surse de top și comunități online.

Creare a unui profil de influencer:

  • Nume utilizator
  • Număr de postări per subiect
  • Număr de articole clasificate în funcție de starea indusă de un articol (benefică, nefastă sau neutră) atribuite postărilor
  • Număr de urmăritori

Conturile influencerilor de pe diferite platforme vor fi unificate într-un singur profil de influencer (ex. profile de jurnaliști, celebrități, demnitari). Unificarea se va face în baza unor atribute comune sau a gradului de similaritate al imaginilor de profil.

Listare top 10 influenceri pentru diferite subiecte / categorii.

Cei mai populari autori

  • Scopul acestei secțiuni este de oferi utilizatorilor posibilitatea de a identifica cele mai populare profile care menționează cuvintele și frazele cheie monitorizate.
  • Un autor influent cu o acoperire socială considerabilă are cu siguranță un public uriaș, cu o expunere masivă în media virtuală și, pur și simplu, ajung la mai mulți oameni care ar putea fi interesanți și merită verificați.
  • Secțiunea va include o listă cu cei mai populari 50 de autori, în funcție de scorul de influență și acoperirea socială (cu posibilitatea de vizualizare a întregii liste).

Sumar al celor mai importante metrici

Scopul acestei secțiuni este de a oferi utilizatorilor posibilitatea de a vedea un sumar al celor mai importante valori (volumul postărilor în timp, tipul stărilor induse, utilizatori etc.) legate de proiectul / cuvintele cheie monitorizate.

Sumarul va include următoarele metrici:

  • Număr mențiuni – numărul total de mențiuni / fire de discuții descoperite în intervalul de timp selectat;
  • Mențiuni social media – numărul total de mențiuni / fire de discuții descoperite pe platformele de comunicare virtuală în intervalul de timp selectat;
  • Mențiuni non-social media – numărul total de mențiuni / fire de discuții descoperite în afara rețelelor de de comunicare virtuală (de exemplu forumuri, bloguri, etc.)
  • Acoperirea pe rețelele de comunicare virtuală – numărul estimat de persoane care ar fi putut avea contact cu mențiunile respective de pe rețelele de comunicare virtuală care conțin expresia (frazele) monitorizată(e). Acoperirea estimată pe rețelele de comunicare virtuală se bazează pe numărul de autori care vorbesc despre frazele monitorizate în rețelele de comunicare virtuală, numărul de adepți /abonați / prieteni ai acestora;
  • Acoperirea non-social media – numărul estimat de afișări cu mențiunile relevante (care conțin cuvintele cheie monitorizate);
  • Este necesar să fie luate în calcul numărul de domenii care menționează frazele monitorizate și raportul de vizibilitate pentru aceste mențiuni (procentajul expunerii cuvintelor cheie monitorizate pe un anumit domeniu: URL, titlu, conținut, comentarii etc.);
  • Interacțiuni social media – numărul de interacțiuni generate care conțin cuvintele / frazele monitorizate pe platformele de comunicare virtuală.
  • Conținut generat de utilizatori – numărul de mențiuni generate de către utilizatorii platformelor de comunicare virtuală, forumurilor, blogurilor etc.
  • Aprecieri social media – numărul de aprecieri ale postărilor care includ cuvintele cheie monitorizate.
  • Număr de videoclipuri – numărul de mențiuni video descoperite pe rețelele de comunicare virtuală.
  • Mențiuni favorabile – numărul de mențiuni ale cuvintelor cheie monitorizate cu sentiment potențial favorabil (valoare numerică și procent din numărul total)
  • Mențiuni nefavorabile – numărul de mențiuni ale cuvintelor cheie monitorizate cu sentiment potențial nefavorabil.
  • Mențiuni neutre

Top profile publice

  • Numele profilului – platforma – procent acoperire – influența
  • Procent acoperire – ce procent al întregii discuții a fost generat de autorul selectat (utilizator, profil, pagina etc.)
  • Influența – numărul estimat de vizualizări generate de autorul selectat care conține frazele monitorizate. Influența se bazează pe numărul de mențiuni, numărul de adepți / abonați / prieteni
  • Secțiunea este necesar să includă și link către profilul respectiv.
  • Posibilitatea de a șterge din lista de monitorizare autorul (în cazul în care nu este relevant pentru scopul proiectului respectiv), pentru a permite o analiză cât mai precisă.

Cele mai active profile

  • Numele profilului – platforma – audiență – mențiuni
  • Audiența – numărul de utilizatori la care s-a distribuit postarea care include frazele monitorizate.
  • Mențiuni – numărul de mențiuni ale profilului care includ frazele monitorizare
  • Secțiunea este necesar să includă și link către profilul respectiv.
  • Posibilitatea de a șterge din lista de monitorizare autorul (în cazul în care nu este relevant pentru scopul proiectului respectiv), pentru a permite o analiză cât mai precisă.

Cele mai active site-uri

O listă cu cele mai active site-uri care conțin frazele monitorizare

– Numele site-ului

– Numărul de mențiuni

Se pot afișa primele 10 site-uri, cu posibilitatea de a deschide lista completă.

Cele mai influente site-uri

O listă cu cele mai influente domenii care conțin frazele monitorizate

– Numele domeniului

– Scorul de influență

– Numărul estimat de vizitatori

Metrice

Sistemul este necesar să includă următoarele metrice:

  • Sentiment, sentiment count
  • Scor influencer
  • Volum postări, articole, distribuiri în ultima oră, zi, lună etc.
  • Număr mediu de postări pe minut / oră pentru anumite subiecte / cuvinte cheie
  • Cele mai distribuite hashtag-uri și link-uri
  • Utilizatorii cei mai menționați în postări
  • Raportul postărilor / distribuirilor
  • Creșterea evoluției într-o anumită perioadă
  • Viralizare – bazat pe link-uri, distribuiri și comentarii

Termenul limită pentru primirea ofertelor sau a cererilor de participare la această licitație este 17 iulie 2023. În aceeași zi va avea loc și ședința de deschidere a ofertelor.

Citiți și:
Raport: Armata britanică a urmărit și monitorizat persoanele sceptice cu privire la lockdown-uri
Dictatura digitală a tehnocrației este tot mai aproape

 

yogaesoteric
4 iulie 2023

 

Spune ce crezi

Adresa de email nu va fi publicata

Acest site folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More