Techniky data miningu • Clustering: Analýza klastrov alebo zhlukovanie je úloha zoskupenia množiny objektov takým spôsobom, že objekty v rovnakej skupine (nazývané klastra) sú navzájom viac podobné (v určitom zmysle alebo inom) navzájom než tým v iných skupinách (klastre). Je to hlavná úloha prieskumného získavania údajov a bežnej techniky analýzy štatistických údajov, ktorá sa používa v mnohých oblastiach vrátane strojového učenia, rozpoznávania vzorov, analýzy obrazu, získavania informácií, bioinformatiky, kompresie dát a počítačovej grafiky. • Klasifikácia: klasifikácia je problém určenia, ku ktorému súboru kategórií (subpopulácií) patrí nové pozorovanie na základe tréningového súboru údajov obsahujúcich pozorovania (alebo inštancie), ktorých členstvo v kategórii je známe. Príkladom by bolo priradenie daného e-mailu do tried "spam" alebo "nevyžiadanej pošty" alebo pridelenie diagnózy danému pacientovi, ako je opísané v pozorovaných charakteristikách pacienta (pohlavie, krvný tlak, prítomnosť alebo absencia určitých symptómov atď. ). Klasifikácia je príklad rozpoznávania vzorov • Prediction: It is an umbrella term for supervised machine learning techniques that involves predicting structured objects. • Detekcia anomálií: Ide o identifikáciu položiek, udalostí alebo pozorovaní, ktoré nezodpovedajú očakávanému vzoru alebo iným položkám v súbore údajov.