Title : | Assessment of the impact of data quality for improvement of e-services in government institutions : doctoral studies-third cycle | Material Type: | printed text | Authors: | Genc Hamzaj, Dissertant ; Zamir Dika, Thesis advisor | Publisher: | Tetovo : Faculty of Contemporary Social Sciences - SEEU | Publication Date: | 2022 | Pagination: | 164 p. | Layout: | ill. | Size: | 30 cm | General note: | Includes bibliographical references
Includes bibliographical footnotes
Includes appendix | Languages : | English (eng) Original Language : English (eng) | Abstract: | Abstract
Provision of data in appropriate level in aspect of quality is one of the key goals for raising the quality of services that will be provided for citizens. Most public administration services, which previously were only able to be realized physically, now can be achieved online since practically every citizen now uses Internet services or has access to the internet, which has huge importance as a necessary condition before government institutions attempt to offer electronic services for citizens. Due to the increasing number of databases created with the aim to provide electronic services for public administration and the lack of data harmonization or interoperability between these databases, this process caused that the quality of the data has decreased as a result of numerous mistakes that were done and also inconsistencies in the data in these databases. In addition, due to the extremely high volume of data as well as the numerous diverse data sources and data structures that we have now because of the rapid expansion of IoT devices, evaluating and enhancing the quality of data is becoming very challenging. The whole process for Assessment and Improvement of Data Quality Approach by the government institutions will be constructed by evaluating the most significant dimensions, metrics, and current most important frameworks, including the relevant assessment and improvement procedures, which is the main objective of this dissertation. Increasing data quality using different dimensions and adequate approaches is a prerequisite for achieving high quality e-services. The main dimensions of the qualitative research method that will be implemented in this dissertation with aim to treat the quality of the data are completeness, uniqueness, timeliness, alidity, accuracy, and consistency. Due to the extremely huge volume of data and several data sources with various data structures, evaluating and enhancing the quality of data by matching and linking records becomes very challenging. Our focus will be on algorithms that handle large amounts of data, such as Damerau-Levenshtein distance (DL) algorithm and Levenshtein distance (LV) algorithm. In order to compare the effectiveness and quality of the data using the specified algorithms, through this dissertation we will conduct experiments in huge datasets with more than 1 million records. Additionally, we will perform a data cleansing process by analyzing and identifying inaccurate data in datasets, including: order dependency violations, delayed reported issues, anomalous data within certain periods, etc. We will utilize the Power BI tool to evaluate datasets from various sources, making improvements by implementing suitable dimensions and techniques for increasing the quality of the data. Finally, through this dissertation we will evaluate the e-Services delivered by the Kosovo government portal by using the provided data quality dimensions to evaluate the data quality in the chosen datasets. Additionally, the effectiveness of implementing user-friendly, data quality criteria and dimensions into a single government portal is evaluated with the goal of providing better and improved G2C (Government to Citizens) services. In addition, we will demonstrate a microservice architectural integration model for implementing e-services in the Kosovo government portal.
Abstrakt
Sigurimi i të dhënave në nivelin e duhur në aspektin e cilësisë është një nga qëllimet kryesore për ngritjen e cilësisë së shërbimeve që do të ofrohen për qytetarët. Pjesa më e madhe e shërbimeve të administratës publike, të cilat më parë mund të realizoheshin vetëm fizikisht, tani mund të arrihen online pasi praktikisht çdo qytetar tani përdor shërbimet e internetit ose ka akses në internet, gjë që ka një rëndësi të madhe si kusht i domosdoshëm përpara se institucionet qeveritare të tentojnë të ofrojnë shërbime elektronike për qytetarët. Për shkak të rritjes së numrit të bazave të të dhënave të krijuara me qëllim të ofrimit të shërbimeve elektronike për administratën publike dhe mungesës së harmonizimit apo ndërveprimit të të dhënave ndërmjet këtyre bazave të të dhënave. Ky proces bëri që cilësia e të dhënave të ulet si rezultat i gabimeve të shumta që janë bërë si dhe mospërputhjet në të dhënat në këto baza të të dhënave. Për më tepër, për shkak të vëllimit jashtëzakonisht të lartë të të dhënave, si dhe burimeve të shumta të larmishme të të dhënave dhe strukturave të të dhënave që kemi tani si rezultat i zgjerimit të shpejtë të pajisjeve IoT, vlerësimi dhe rritja e cilësisë së të dhënave po bëhet shumë sfiduese. I gjithë procesi për Vlerësimin dhe Përmirësimin e Përqasjes së Cilësisë së të Dhënave nga institucionet qeveritare do të ndërtohet duke vlerësuar dimensionet më të rëndësishme, metrikat dhe kornizat më të rëndësishme aktuale, duke përfshirë edhe procedurat përkatëse të vlerësimit dhe përmirësimit, që është objektivi kryesor i këtij disertacioni. Rritja e cilësisë së të dhënave duke përdorur dimensione të ndryshme dhe qasje adekuate është një parakusht për arritjen e shërbimeve elektronike me cilësi të lartë. Dimensionet kryesore të metodës së kërkimit cilësor që do të zbatohet në këtë disertacion me qëllim trajtimin e cilësisë së të dhënave janë: Completeness, Uniqueness, Timeliness, Validity, Accuracy, dhe onsistency. Për shkak të vëllimit jashtëzakonisht të madh të të dhënave dhe burimeve të shumta të të dhënave me struktura të ndryshme të dhënash, vlerësimi dhe rritja e cilësisë së të dhënave përmes përputhjes dhe lidhjes së të dhënave bëhet shumë sfiduese. Fokusi ynë do të jetë në algoritmet që trajtojnë sasi të mëdha të dhënash, të tilla si algoritmi i distancës Damerau-Levenshtein (DL) dhe algoritmi i distancës Levenshtein (LV). Për të krahasuar efektivitetin dhe cilësinë e të dhënave duke përdorur algoritmet e specifikuara, përmes këtij disertacioni do të kryejmë eksperimente në grupe të mëdha të dhënash me më shumë se 1 milion regjistrime. Për më tepër, ne do të kryejmë procesin e pastrimit të të dhënave duke analizuar dhe identifikuar të dhëna të pasakta në grupet e të dhënave, duke përfshirë shkelja e varësisë së renditjes, problemi i raportimit të vonuar, të dhëna anormale në periudha të caktuara kohore etj. Ne do të përdorim mjetin Power BI për të vlerësuar grupet e të dhënave nga burime të ndryshme, duke bërë përmirësime duke zbatuar dimensione dhe teknika të përshtatshme për rritjen e cilësisë së të dhënave. Së fundi, përmes këtij disertacioni ne do të vlerësojmë shërbimet elektronike të ofruara nga portali i qeverisë së Kosovës duke përdorur dimensionet e ofruara të cilësisë së të dhënave për të vlerësuar cilësinë e të dhënave në grupet e të dhënave të zgjedhura. Për më tepër, efektiviteti i zbatimit të kritereve dhe dimensioneve të cilësisë së të dhënave miqësore për përdoruesit në një portal të vetëm qeveritar vlerësohet me synimin për të ofruar shërbime më të mira dhe të përmirësuara G2C (Qeveria për qytetarët). Përveç kësaj, ne do të demonstrojmë një model të integrimit arkitektonik të mikroshërbimeve për implementimin e shërbimeve elektronike në portalin e qeverisë së Kosovës.
Апстракт
Обезбедувањето на податоци на соодветно ниво од аспект на квалитет е една од клучните цели за подигнување на квалитетот на услугите што ќе им се даваат на граѓаните. Најголемиот дел од услугите на јавната администрација, кои досега можеа да се реализираат само физички, сега можат да се постигнат преку Интернет, бидејќи практично секој граѓанин сега користи интернет услуги или има пристап до интернет, што има огромна важност како неопходен услов пред владините институции да се обидат да понудат електронски услуги за граѓаните. Поради зголемениот број на бази на податоци создадени со цел да се обезбедат електронски услуги за јавната администрација и недостатокот на усогласеност на податоците или интероперабилност помеѓу овие бази на податоци, овој процес предизвика намалување на квалитетот на податоците како резултат на многубројните грешки што беа направени а исто така и недоследности во податоците во овие бази на податоци. Дополнително, поради екстремно високиот обем на податоци, како и бројните разновидни извори на податоци и структури на податоци што ги имаме сега како резултат на брзата експанзија на IoT уредите, оценувањето и подобрувањето на квалитетот на податоците станува многу предизвик. Целиот процес за проценка и подобрување на пристапот на квалитетот на податоците од страна на владините институции ќе биде конструиран преку евалуација на најзначајните димензии, метрика и актуелните најважни рамки, вклучувајќи ги и соодветните процедури за проценка и подобрување, што е лавната цел на оваа дисертација. Зголемувањето на квалитетот на податоците со користење на различни димензии и соодветни пристапи е предуслов за постигнување висококвалитетни е-услуги. Главните димензии на методот на квалитативно истражување што ќе се имплементира во оваа дисертација со цел да се третира квалитетот на податоците се комплетноста, единственоста, навременоста, валидноста, точноста и конзистентноста. Поради екстремно огромниот обем на податоци и неколку извори на податоци со различни структури на податоци, оценувањето и подобрувањето на квалитетот на податоците преку усогласување и поврзување на записите станува многу предизвик. Нашиот фокус ќе биде на алгоритми кои ракуваат со големи количини на податоци, како што се алгоритам за растојание Дамерау-Левенштајн (DL) и алгоритам за растојание Левенштајн (LV). Со цел да се споредат ефективноста и квалитетот на податоците користејќи ги наведените алгоритми, преку оваа дисертација ќе спроведеме експерименти во огромни збирки на податоци со повеќе од 1 милион записи. Дополнително, ќе извршиме процес на чистење на податоците со анализа и идентификување неточни податоци во збирките на податоци, вклучувајќи: прекршувања на зависноста од нарачки, одложени пријавени проблеми, аномални податоци во одредени периоди итн. Ќе ја користиме алатката Power BI за проценка на збирки податоци од pазлични извори подобрувања со имплементација на соодветни димензии и техники за зголемување на квалитетот на податоците. Конечно, преку оваа дисертација ќе ги евалуираме е-услугите испорачани од порталот на косовската влада со користење на дадените димензии на квалитетот на податоците за да се оцени квалитетот на податоците во избраните збирки на податоци. Дополнително, се оценува ефективноста на имплементирањето на критериумите и димензиите за квалитет на податоци кои се прифатливи за корисниците и димензии во единствен владин портал со цел да се обезбедат подобри и подобрени G2C (Влада за граѓаните) услуги. Дополнително, ќе демонстрираме модел на архитектонска интеграција на микросервис за имплементација на е-услуги во порталот на косовската влада. | Link for e-copy: | https://repository.seeu.edu.mk/sites/thesis/ThesisSharedDocs/MA_126149.pdf | Record link: | https://library.seeu.edu.mk/index.php?lvl=notice_display&id=22078 |
|