Infrastructura digitală pentru politica socială
Infrastructura tehnică trebuie să ofere un mediu sigur de stocare a datelor și să permită integrarea unei game de instrumente analitice și seturi de date din mai multe surse, respectând totodată cerințele legislative și etice (Sivarajah şi colab., 2017). Există provocări semnificative asociate cu încorporarea big data în politica socială și încercetare. Creșterea exponențială a big data într-o perioadă atât de scurtă înseamnă că există cercetări limitate asupra modului în care big data poate îmbunătăți efectiv serviciile guvernamentale (Hong et al. 2019). În special, cum să cântărim beneficiile potențiale ale big data în politica socială și cercetarea privind resursele tehnice și organizaționale semnificative necesare pentru a le integra în siguranță și securizat rămâne o întrebare deschisă (Carney,2019).
În timp ce utilizarea big data necesită o proiectare atentă a infrastructurii, multe instituţii publice pot avea fonduri limitate, cunoștințe tehnice limitate pentru a ajuta la dezvoltarea infrastructurii digitale necesare (Oussous şi colab., 2018). Infrastructura moștenită a unei instituții publice poate duce la necesitatea de a integra mai multe sisteme tehnice diferite în departamente destul de divergente, cu mai multe regimuri de conformitate și aplicații diferite (Coultonet şi colab., 2015). Structurile organizaționale sau prioritățile politice pot interfera cu capacitatea de a integra în mod eficient big data în politici(Hong şi colab., 2019), precum și cu capacitatea de a evalua proiecte sau de a încorpora date noi pentru a perfecționa modele și politici(Archenaa și Anita 2015).
În plus, lipsa protocoalelor tehnice de gestionare a datelor după utilizare ar putea duce fie la identificarea involuntară prin agregarea datelor, fie la reutilizarea datelor cu încălcarea acordurilor de consimțământ privind datele. Astfel, există riscuri considerabile legate de integrarea în condiții de siguranță a big data în politica socială. Prin urmare, la începutul fiecărui proiect, este nevoie ca factorii de decizie să pornească de la primele principii și să verifice care sunt resursele lor de infrastructură existente, ce cerințe tehnice sunt necesare pentru a integra în siguranță big data în proiectul lor, ce beneficii vor avea și ce riscuri vor întâmpina. Multe considerații tehnice vor fi, de asemenea, influențate de factori precum resursele disponibile și abilitățile personalului de care dispune instituția.
Cercetătorii au analizat o gamă de proiecte de infrastructură tehnică pentru utilizarea big data în diverse contexte. (Labrinidis & Jagadish 2012). Cu toate acestea, aceste soluții sunt adesea foarte tehnice și specifice capacităților de infrastructură existente. În practică, mulți factori de decizie în domeniul politicilor sociale și administraţiei publice vor funcționa în diverse instituții cu diferite tipuri de infrastructură și constrângeri tehnice unice pentru situația lor. În plus, este posibil ca unii factori de decizie socială și manageri publici să nu aibă nicio pregătire în abilități de calcul sau proiectare tehnică în afara statisticilor standard (Coulton şi colab., 2015).
Prima componentă care trebuie luată în considerare în politica socială care implică big data este de a specifica ce date sunt necesare, cum pot fi achiziționate și unde vor fi stocate. În timp ce politica socială a folosit în mod tradițional date obținute din surse „structurate”, cum ar fi dosarele fiscale, marea majoritate a datelor disponibile astăzi sunt „nestructurate”(Cukier 2010). Datele nestructurate nu sunt neapărat organizate în structura tradițională și pot avea o dimensiune copleșitoare. Exemplele includ datele din rețelele sociale(Labrinidis & Jagadish 2012), care copleșesc rapid capacitățile de stocare ale bazelor de date simple utilizate în trecut (Sivarajah şi colab., 2017).
Proiectele în care urmează să fie utilizate big data nestructurate trebuie mai întâi să stabilească:
1. care și cum vor fi achiziționate aceste date specifice și dacă:
2. infrastructura digitală existentă va putea stoca și facilita procesarea unor volume totmai mari de date și seturi de date mai complexe (Padgavankar & Gupta 2014).
O gamă de noi opțiuni de stocare de la furnizorii comerciali sunt acum disponibile,ceea ce permite utilizatorilor să extindă stocarea rapid după cum este necesar și să aibă spațiu de stocare practic nelimitat. Cu toate acestea, costurile pot fi prohibitive și necesită încă abilități tehnice în dezvoltarea protocoalelor și algoritmilor de stocare (Yang şi colab., 2017).
Factorii politici trebuie, de asemenea, să ia în considerare modul în care doresc să acceseze datele. În general, organizarea logică și transferul datelor se face într-un „depozit de date”. Un depozit de date este un sistem de stocare centralizat în care datele din mai multe sisteme administrative sunt reunite, legate și stocate într-un depozit centralizat. Depozitele de date pot stoca volume mari de date eterogene și potențial sensibile, cum ar fi tranzacții financiare, date din rețelele sociale și proceduri medicale, care trebuie să fie agregate împreună (Sivarajahet şi colab., 2017).
Indiferent dacă este utilizat un sistem centralizat sau cloud/portal, managerul de date trebuie să se asigure că datele sunt stocate și disponibile pentru a fi utilizate în scopuri de politică publică (socială) într-un mod compatibil cu specificațiile acordului de partajare a datelor.
A doua componentă se referă la considerente tehnice asociate cu integrarea datelor. Integrarea datelor necesită minimizarea datelor redundante, consolidarea datelor și asigurarea coerenței datelor (Mosely şi colab., 2009). Poate fi un proces complex, care încorporează selectarea și standardizarea datelor, împreună cu verificări pentru calitatea și caracterul complet al datelor (Vatsalan şi colab., 2013).
Acest proces devine deosebit de dificil din punct de vedere tehnic dacă proiectul necesită agregarea și integrarea datelor structurate și nestructurate în volume mari în infrastructurile instituționale existente (Oussous şi colab., 2018).
Integrarea datelor poate avea loc în funcție de nevoi, periodice sau continue. Având în vedere că integrarea datelor este complexă și are loc în întregul sistem de big data de la început până la sfârșit, integrarea eficientă este esențială pentru maximizarea valorii din big data. Integrarea inadecvată a datelor poate avea un impact grav dacă datele și metadatele sunt de calitate scăzută, dacă volumul de date depășește capacitatea infrastructurii sau dacă sunt inconsecvente și imprecise. Integrarea de calitate slabă poate afecta semnificativ capacitatea sistemelor de infrastructură de a extrage informații utile în primul rând (Chen & Zhang 2014) și poate duce la operaționalizarea potențial incorectă a politicii (Clarke, 2016).
A treia componentă este cea a accesului la date. Odată ce datele sunt selectate, corelate și identificate, se realizează operaţiile tehnice legate de acces. Există numeroase beneficii în urma partajării și accesării datelor, deoarece accesarea informațiilor derivate din integrarea datelor mari este un domeniu cheie al furnizării de informații valoroase în domeniul politicii sociale (Coulton şi colab., 2015).
Există două opțiuni principale pentru furnizarea de date integrate: gateway-uri centralizate sau puncte de acces descentralizate. Gateway-urile centralizate pot exista intern în organizație sau în mediul cloud computing și permit acces securizat, controlat, în conformitate cu politicile de guvernanță și management. Aceste gateway-uri pot facilita gestionarea și accesul la date (Miranda şi colab., 2015) și pot asigura că numai cei cu permisiunea prealabilă pot accesa datele relevante pentru politica lor sau pentru proiectul lor (Sivarajah şi colab., 2017). Într-un mediu de acces descentralizat, instituţiile pot folosi o serie de mecanisme pentru a se asigura că partajarea datelor este controlată și că acordurile de partajare a datelor sunt respectate. Acestea includ asigurarea că protocoalele de securitate sunt încorporate în sistemul de gestionare a datelor, ceea ce permite apoi un proces robust pentru identificarea și urmărirea utilizatorilor care accesează datele(Kennedy & Moss 2015).
Aceste mecanisme pot reduce accesul nesigur și pot oferi informaţii pentru investigarea accesului sau a utilizării neautorizate a datelor. Pe lângă determinarea drepturilor și protocoalelor de acces, utilizatorii trebuie să fie capabili să interogheze și să recupereze în mod eficient datele de care au nevoie (Peek şi colab., 2014). Prin urmare, sistemele de acces ar trebui să permită utilizatorilor să vizualizeze și să caute o serie de seturi de date disponibile și ar trebui să includă descrieri a datelor (metadate) și a editorului pentru a verifica autenticitatea sursei (Lnenicka & Machov a 2015).
Cercetări recente subliniază adoptarea tot mai mare a mediilor de furnizare a informațiilor bazate pe cloud pentru o serie de utilizări ale politicii sociale (Singh şi colab., 2020). Acest lucru se datorează parțial pentru că aceste medii pot fi mai sigure, pot oferi un acces mai ușor de utilizat pentru anumite tipuri de date și pot fi rapid scalabile pe măsură ce nevoile de stocare și procesare a datelor se schimbă.
Analiza datelor ca şi a patra componentă implică utilizarea instrumentelor de analiză, cum ar fi software-ul de procesare a limbajului natural, și tehnici de analiză, cum ar fi statisticile inferențiale și modelarea predictivă. O serie de instrumente și tehnici de analiză diferite sunt folosite pentru a analiza date complexe la scară largă pentru diverse aplicații, iar acest număr crește continuu.
Două considerații tehnice specifice se referă la această problemă. În primul rând, factorii de decizie trebuie să se asigure că există o capacitate de infrastructură suficientă pentru a efectua analize cu volume mari de date. În al doilea rând, trebuie să se asigure că infrastructura lor tehnică este capabilă să aplice algoritmi analitici corespunzători, care pot face față diversității și complexității big data (Peek şi colab., 2014).
Componenta cinci abordează considerațiile tehnice legate de utilizarea rezultatelor analizei datelor pentru a informa semnificativ, echitabil și etic propuneri de politici. În timp ce un număr mare de cercetări evidențiază potențialul ca interpretările părtinitoare ale datelor să apară în rezultatele analitice ale big data (Turner şi Resnick, 2019), proiectarea infrastructurii tehnice poate permite testarea rezultatelor și vizualizarea semnificativă pentru a reduce probabilitatea unei interpretări greșite.
Este important ca proiectarea infrastructurii tehnice să sprijine testarea rezultatelor analizei datelor. Acest lucru se poate realiza prin stabilirea de sisteme pentru a întreprinde simulări de politici bazate pe rezultatele analizei medii în care se pot rula simulări pentru a verifica rezultate părtinitoare sau pentru a testa impactul negativ neprevăzut înainte de implementarea politicii (Olshannikova şi colab., 2015). Vizualizarea adecvată necesită componente cheie ale infrastructurii, și anume o interfață pentru filtrarea sau eșantionarea datelor înainte de vizualizare, capacitatea de procesare, instrumente de analiză vizuală simple și intuitive și portaluri pentru partajarea rezultatelor (Reda şi colab., 2013).
Fără comentarii