binary classifier -> δυαδικός ταξινομητής, δυαδικός κατηγοριοποιητής

dominotheory

  • Hero Member
  • *****
    • Posts: 2022
binary classifier -> δυαδικός ταξινομητής, δυαδικός κατηγοριοποιητής

Binary classification is the task of classifying the elements of a given set into two groups (predicting which group each one belongs to) on the basis of a classification rule. Contexts requiring a decision as to whether or not an item has some qualitative property, some specified characteristic, or some typical binary classification include:

    Medical testing to determine if a patient has certain disease or not – the classification property is the presence of the disease.

    A "pass or fail" test method or quality control in factories, i.e. deciding if a specification has or has not been met – a go/no go classification.

    Information retrieval, namely deciding whether a page or an article should be in the result set of a search or not – the classification property is the relevance of the article, or the usefulness to the user.

Binary classification is dichotomization applied to practical purposes, and in many practical binary classification problems, the two groups are not symmetric – rather than overall accuracy, the relative proportion of different types of errors is of interest. For example, in medical testing, a false positive (detecting a disease when it is not present) is considered differently from a false negative (not detecting a disease when it is present).
https://www.wikiwand.com/en/Binary_classification

Most classification problems have only two classes in the target variable; this is a binary classification problem. The accuracy of a binary classification is evaluated by analyzing the relationship between the set of predicted classifications and the true classifications. Four outcome states are defined for binary classification models. The term “true” refers to one binary class (i.e., 1), and the term “false” refers to the other binary class (0):

1. True-positives—outcome observed as true and predicted as true
2. True-negatives—outcome observed as false and predicted as false
3. False-positives—outcome observed as false but predicted as true
4. False-negatives—outcome observed as true but predicted as false
Robert Nisbet, Gary Miner & Ken Yale (2018), Handbook of Statistical Analysis and Data Mining Applications (Second Edition), London: Academic Press, https://www.sciencedirect.com/topics/computer-science/binary-classification

Ένα πρόβλημα μάθησης με δυαδική τιμή εξόδου αναφέρεται ως πρόβλημα δυαδικής ταξινόμησης (binary classification). Ένα πρόβλημα με ένα πεπερασμένο αριθμό από κατηγορίες αναφέρεται ως πρόβλημα ταξινόμησης πολλαπλών κατηγοριών (multi-class classification). Ένα πρόβλημα με πραγματικούς αριθμούς ως έξοδο αναφέρεται ως παλινδρόμηση (regression).
[...]
Το πρόβλημα της ταξινόμησης (classification) συνίσταται στην εκμάθηση μιας συνάρτησης στόχου ικανής να αντιστοιχεί άγνωστα αντικείμενα σε προκαθορισμένο σύνολο κατηγοριών. Στόχος της διαδικασίας μάθησης είναι η δημιουργία ενός μοντέλου πρόβλεψης της μη παρατηρούμενης ιδιότητας που είναι το διακριτικό (όνομα/τιμή) της κατηγορίας ενός αγνώστου αντικειμένου, βάσει των τιμών των χαρακτηριστικών που το προσδιορίζουν. Τυπικά παραδείγματα εφαρμογών ταξινόμησης αποτελούν η αυτόματη ταξινόμηση μηνυμάτων ηλεκτρονικού ταχυδρομείου σε κατηγορίες που καθορίζονται από τον χρήστη, ο διαχωρισμός καλοηθών από κακοήθεις όγκους μέσω της παρατήρησης των αποτελεσμάτων ιατρικών εξετάσεων, κ.ά.. Για την αντιμετώπιση του συγκεκριμένου προβλήματος προϋποτίθεται η συγκέντρωση ενός αριθμού από αντιπροσωπευτικά για κάθε κατηγορία παραδείγματα (στιγμιότυπα του προβλήματος), τα οποία έχουν ταξινομηθεί από τον άνθρωπο-εκπαιδευτή. Στην συνέχεια, τα εν λόγω στιγμιότυπα (σώμα δεδομένων
εκπαίδευσης) δίνονται σε έναν αλγόριθμο μηχανικής μάθησης, ο οποίος, κατόπιν της παρατήρησης των χαρακτηριστικών τους, παράγει ως έξοδο ένα εκτιμώμενο μοντέλο, ικανό να αντιστοιχίζει άγνωστα στιγμιότυπα στις προδιαγεγραμμένες κατηγορίες. Το τελικό προϊόν της εκπαίδευσης καλείται ταξινομητής (classifier).
Νικόλαος Α. Τρογκάνης (2006), Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά (Διπλωματική Εργασία), Επιβλέπων: Τιμολέων Σελλής, Αθήνα: Ε.Μ.Π. (Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών - Τομέας Tεχνολογίας Πληροφορικής & Υπολογιστών), http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14634

3.1.1 Δυαδική Κατηγοριοποίηση (Binary Classification)
Η πιο απλή μορφή κατηγοριοποίησης είναι η δυαδική κατηγοριοποίηση. Στη δυαδική κατηγοριοποίηση, η κατηγορία στόχος έχει δύο μόνο τιμές. Για παράδειγμα, εάν θέλουμε να προβλέψουμε την πραγματοποίηση ή όχι ενός αθλητικού αγώνα με βάση τα χαρακτηριστικά του καιρού (όπως θερμοκρασία, υγρασία, εάν είναι θυελλώδης ή όχι) θα πρέπει να οριστούν δύο κλάσεις. Οι κλάσεις μπορεί να οριστούν με τα σύμβολα “Θ” ή “Α” όπου το “Θ” δηλώνει ΘΕΤΙΚΟ, δηλαδή ότι ο αγώνας θα πραγματοποιηθεί, ενώ το “Α” δηλώνει ΑΡΝΗΤΙΚΟ δηλαδή ότι ο αγώνας δεν θα πραγματοποιηθεί.
Μπλερίνα Π. Λίκα (2013), Aυτόματη Κατηγοριοποίηση Χρηστών ως Μέθοδος Επίλυσης του Προβλήματος Ψυχρής Εκκίνησης (Διπλωματική Εργασία), Επιβλέποντες: Ευστάθιος Χατζιευθυμιάδης& Κωνσταντίνος Κολομβάτσος, Αθήνα: ΕΚΠΑ (Σχολή Θετικών Επιστημών - Τμήμα Πληροφορικής & Τηλεπικοινωνιών), http://ipac.di.uoa.gr/resources/Lika_MscThesis.pdf
« Last Edit: 29 Jun, 2020, 15:42:22 by dominotheory »


 

Search Tools