Τεχνικές εξόρυξης δεδομένων • Ομαδοποίηση: Ανάλυση συμπλεγμάτων ή ομαδοποίηση είναι το καθήκον της ομαδοποίησης ενός συνόλου αντικειμένων με τέτοιο τρόπο ώστε τα αντικείμενα της ίδιας ομάδας (που ονομάζεται σύμπλεγμα) να είναι πιο παρόμοια (σε κάποια έννοια ή άλλο) μεταξύ τους παρά με εκείνα σε άλλες ομάδες (συστάδες). Πρόκειται για ένα βασικό καθήκον διερευνητικής εξόρυξης δεδομένων και μιας κοινής τεχνικής για την ανάλυση στατιστικών δεδομένων που χρησιμοποιείται σε πολλούς τομείς, συμπεριλαμβανομένης της μηχανικής μάθησης, της αναγνώρισης προτύπων, της ανάλυσης εικόνων, της ανάκτησης πληροφοριών, της βιοπληροφορικής, της συμπίεσης δεδομένων και των γραφικών υπολογιστών. • Ταξινόμηση: η ταξινόμηση είναι το πρόβλημα της αναγνώρισης σε ποιο σύνολο κατηγοριών (υποπληθυσμών) ανήκει μια νέα παρατήρηση, με βάση ένα σύνολο εκπαιδευτικών δεδομένων που περιέχουν παρατηρήσεις (ή περιπτώσεις) των οποίων η ιδιότητα μέλους είναι γνωστή. Ένα παράδειγμα θα ήταν η ανάθεση ενός δεδομένου ηλεκτρονικού ταχυδρομείου σε τάξεις "spam" ή "μη spam" ή η διάθεση μιας διάγνωσης σε έναν συγκεκριμένο ασθενή όπως περιγράφεται από τα παρατηρούμενα χαρακτηριστικά του ασθενούς (φύλο, πίεση αίματος, παρουσία ή απουσία ορισμένων συμπτωμάτων κλπ. ). Η ταξινόμηση είναι ένα παράδειγμα αναγνώρισης προτύπων • Πρόβλεψη: Πρόκειται για έναν όρο ομπρέλα για τις εποπτευόμενες τεχνικές εκμάθησης μηχανών που περιλαμβάνει την πρόβλεψη δομημένων αντικειμένων. • Ανίχνευση ανωμαλιών: Είναι η ταυτοποίηση αντικειμένων, συμβάντων ή παρατηρήσεων που δεν συμμορφώνονται με ένα αναμενόμενο πρότυπο ή άλλα στοιχεία σε ένα σύνολο δεδομένων.