Affordable Access

Modely strojového učení pro identifikaci vzorů a prediktivní analýzu / Machine Learning Models for Pattern Identification and Predictive Analytics

Authors
  • aziz, zagroz abdulkhaliq
Publication Date
Mar 17, 2024
Source
Digital Library of the Czech Technical University in Prague
Keywords
License
Unknown

Abstract

V posledních desetiletích zaznamenalo množství generovaných dat exponenciální růst. Rychlý růst dat vedl techniky dolování dat k tomu, aby hrály významnou roli při stanovování základních linií, měřítek, cílů, analýzy a lepšího porozumění konceptům. Získávání užitečných informací v datech však vyžaduje příslušné techniky a postupy. Naproti tomu proces identifikace vzoru v entitách nezpracovaných dat se stává náročnější. Vzorce jsou klíčem k porozumění, analýze, předpovídání a rozhodování. Na druhou stranu, hledání vzorců vyžaduje nejprve analýzu dat, strojové učení, umělou inteligenci a statistické modely. Tento proces se nazývá prediktivní analytika, což je proces využívání dat k předpovídání budoucích výsledků. V této práci byly představeny různé nové případové studie s použitím různých datových sad. Každá datová sada prošla předzpracováním. Předzpracování dat zahrnuje extrakci dat, sběr, profilování, redukci, hádky, obohacení a validaci před tím, než jsou studována. Každá případová studie představuje určitéproblémy a poskytuje řešení, přináší lepší analytické porozumění, vylepšení systému, zlepšení výsledků a přesnosti. Kromě toho bylo k řešení trendů a vzorců v datech použito několik statistických algoritmů a modelů a algoritmů strojového učení. Dále poskytujeme statistickou analýzu pomocí různých metodologií k identifikaci vzorců provozu, indikaci výkonu sítě a kvality služeb. Kromě toho jsme navrhli chování, detekci a predikci anomálií, které pomáhají provozovatelům sítí porozumět a předvídat takové chování sítě. Všechny tyto studie byly vyhodnoceny a posouzeny pomocí několika výkonnostních metrik a parametrů. / In the last decades,the amount of data generated has seen exponential growth.The rapid growth of data led the data mining techniques to play a significant role in establishing base lines, benchmarks, objectives, analyzing and better understanding concepts. However,mining useful information in data requires relevant techniques and procedures. Incontrast,the process of pattern identification in the raw data entities becomes more challenging. Patterns are the key to understanding, analyzing, predicting and decision making. On the other hand, finding patterns needs first data analysis, machine learning, artificial intelligence, and statistical models.This process is called predictive analytics, which is the process of employ in data to forecast future outcomes. In this thesis, different novel case studies have been introduce dusing different datasets. Each dataset has gone through preprocessing. Data preprocessing includes data extraction, collection, profiling, reduction, wrangling, enrichment and validation before being studied. Every case study introduces certain problems and provides solutions, brings in better analytical understanding, system enhancement,outcomes and accuracy improvement. In addition, several statistical and machine learning algorithms and model shave been employed to address the trends and patterns in the data.Furthermore, we provide a statistical analysis using different methodologies to identify traffic patterns, indicate the network performance and quality of service. Moreover,we projected anomaly behavior, detection and prediction that helps network operators to understand and fore cast such network behaviors. All these studies have been evaluated and assessed using several performance metrics and parameters.

Report this publication

Statistics

Seen <100 times