Παραθέτω μια εργασιούλα που έχουμε αναλάβει μήπως κάποιος μπορεί να μας βοηθήσει.Ότι γνωρίζει και μπορεί να ασχοληθεί λίγο παραπάνω ας μας το πει.
(A) Υλοποιείστε συνάρτηση γέννησης συνόλων εκπαίδευσης για δύο κλάσεις,
σύμφωνα με τις ακόλουθες προδιαγραφές: κάθε σύνολο εκπαίδευσης αποτελείται
από διανύσματα δύο χαρακτηριστικών που είναι μεταξύ τους στατιστικώς ανεξάρτη-
τα και κάθε χαρακτηριστικό ακολουθεί την κανονική κατανομή. Οι τέσσερις μέσες
τιμές και οι τέσσερις τιμές διασποράς δίνονται ως ορίσματα εισόδου της συνάρτη-
σης. Επιπλέον, η συνάρτηση δέχεται είσοδο το πλήθος των σημείων για την κάθε
κλάση, έστω M1 και M2.
Η συνάρτηση επιστρέφει δύο πίνακες, διαστάσεων 3 × M1 και 3 × M2, όπου οι
δύο πρώτες γραμμές αφορούν τις τιμές των χαρακτηριστικών και η τρίτη γραμμή
την ετικέτα (label) της κλάσης, δηλαδή 1 για την πρώτη κλάση και 2 για τη δεύ-
τερη. Καλέστε τη συνάρτηση για N11(2, 1),N12(2, 1),N21(4, 2),N22(4, 2) (όπου
Nik είναι η κανονική κατανομή για το k−οστό χαρακτηριστικό της i−οστής κλά-
σης). Σχεδιάστε τα προκύπτοντα σύνολα εκπαίδευσης ως σημεία στο καρτεσιανό
επίπεδο. Θεωρείστε ότι τα σημεία της πρώτης κλάσης αποδίδονται με το χαρακτήρα
+ και της δεύτερης με το χαρακτήρα o.
Σημείωση: σχετικές συναρτήσεις στο Matlab είναι οι randn και mvnrnd.
(B) Κατασκευάστε συνάρτηση που υλοποιεί τον Bayesian ταξινομητή όταν οι
κλάσεις υπακούουν στις προδιαγραφές του θέματος (Α). Η συνάρτηση θα δέχεται
είσοδο και τις a priori πιθανότητες των δύο κλάσεων. Θα επιστρέφει τιμή 1 ή 2,
ανάλογα με την κλάση στην οποία ταξινομείται το προς αναγνώριση διάνυσμα.
Στη συνέχεια, αξοποιείστε τη συνάρτηση του ταξινομητή για να σχεδιάσετε τις
περιοχές απόφασης (decision regions) για τις δύο κλάσεις. Για να το επιτύχετε,
θεωρείστε ότι οι κλάσεις σχεδιάζονται στο καρτεσιανό επίπεδο (όπως στο θέμα
Α) και δειγματοληπτείστε τους άξονες x1 και x2 με βήμα 0.01 για 0 x1 6,
0 x2 6. Δώστε είσοδο κάθε προκύπτον σημείο στον Bayesian ταξινομητή. Αν
ο ταξινομητής επιστρέψει 1, σχεδιάστε + στο αντίστοιχο σημείο, αλλιώς σχεδιάστε
o.
Για να παρουσιάσετε τα αποτελέσματα, σχεδιάστε τις περιοχές απόφασης για
N11(2, 1),N12(2, 2),N21(4, 1),N22(4, 2) και a priori ισοπίθανες κλάσεις. Να επαναλά-
βετε το πείραμα όταν οι εκ των προτέρων πιθανότητες είναι 1/4 και 3/4.
Σημείωση: σχετική συνάρτήση στο Matlab είναι η normpdf και η mvnpdf.
(G) Εστω ο πρακάτω αλγόριθμος ταξινόμησης για πρόβλημα δύο κλάσεων,
όπου τα διανύσματα χαρακτηρηστικών είναι διδιάστατα:
1. Υπολογείστε τις ευκλείδειες αποστάσεις του προς ταξινόμηση διανύσματος
x με όλα τα διανύσματα στο σύνολο εκπάιδευσης της πρώτης κλάσης.
2. Υπολογείστε τις ευκλείδειες αποστάσεις του προς ταξινόμηση διανύσματος
x με όλα τα διανύσματα στο σύνολο εκπάιδευσης της δεύτερης κλάσης.
3. Ταξινομείστε τις παραπάνω ευκλείδειες αποστάσεις κατά αύξοντα τρόπο (συμ-
μετέχουν και οι δύο κλάσεις στην ταξινόμηση).
4. ΄Εστω περιττός ακέραιος k, π.χ., k = 3. Μετά την ταξινόμηση μετρήστε στις
k μικρότερες ευκλείδειες αποστάσεις, πόσες προέρχονται από την πρώτη και
πόσες από τη δεύτερη κλάση. Το διάνυσμα ταξινομείται στην κλάση με τις
περισσότερες εμφανίσεις.
Ο παραπάνω αλγόριθμος ταξινόμησης είναι γνωστός και ως αλγόριθμος των
k-πλησιέστερων γειτόνων (k-nearest neighbors). Καλείστε να δώσετε υλοποίηση
του αλγορίθμου αυτού. Το k θα είναι παράμετρος εισόδου της συνάρτησης, όπως
και το προς ταξινόμηση διάνυσμα και τα δύο σύνολα εκπαίδευσης. Παρουσιάστε
αποτελέσματα για σύνολα εκπαίδευσης και άγνωστα διανύσματα της επιλογής σας,
για k = 3 και k = 5.
Σημείωση: δεν μπορείτε να χρησιμοποιήσετε τη συνάρτηση knnclassify του Matlab.
Σημείωση: Το μήνυμα αυτό γράφτηκε 17 χρόνια πριν. Ο συντάκτης του πιθανόν να έχει αλλάξει απόψεις έκτοτε.