Author Topic: επεξεργασία φυσικής γλώσσας (ΕΦΓ) -> natural language processing (NLP)  (Read 365 times)

spiros

  • Administrator
  • Hero Member
  • *****
  • Posts: 690962
  • Gender: Male
  • point d’amour
    • spiros.doikas
    • greektranslator
    • doikas
    • 102094522373850556729
    • lavagraph
    • Greek translator CV
επεξεργασία φυσικής γλώσσας (ΕΦΓ) -> natural language processing (NLP)
επεξεργασία φυσικού λόγου, επεξεργασία του φυσικού λόγου

Η επεξεργασία φυσικής γλώσσας (ΕΦΓ) είναι ένας διεπιστημονικός κλάδος της επιστήμης της πληροφορικής, της τεχνητής νοημοσύνης και της υπολογιστικής γλωσσολογίας και ασχολείται με τις αλληλεπιδράσεις μεταξύ των υπολογιστών και των ανθρώπινων (φυσικών) γλωσσών. Κατά συνέπεια, η ΕΦΓ συνδέεται στενά με την αλληλεπίδραση ανθρώπου-υπολογιστή. Προκλήσεις στην ΕΦΓ περιλαμβάνουν την κατανόηση φυσικής γλώσσας, δηλαδή την προσπάθεια να καταστούν ικανοί οι υπολογιστές να εξάγουν νοήματα από ανθρώπινα ή γλωσσικά δεδομένα, αλλά και την παραγωγή φυσικής γλώσσας.

Η παρακάτω λίστα καταγράφει τα συχνότερα πεδία έρευνας στην επεξεργασία φυσικής γλώσσας. Κάποια από τα πεδία έρευνας έχουν εφαρμογές στην καθημερινή ζωή, ενώ άλλα υφίστανται ως υποπεδία που υποβοηθούν την επίλυση μεγαλύτερων ζητημάτων. Το κριτήριο που ξεχωρίζει τα παρακάτω πεδία έρευνας από άλλα πιθανά και πραγματικά πεδία της ΕΦΓ είναι το γεγονός ότι για το καθένα από αυτά υπάρχει επίσημα ένας καλά ορισμένος χώρος εργασιών και επίλυσης ζητημάτων, ένα καθιερωμένο μετρικό σύστημα για την αξιολόγηση του πεδίου, κάποια δεδομένα σώματα κειμένων πάνω στα οποία κάθε πεδίο αξιολογείται και διαγωνισμοί αφιερωμένοι στο κάθε πεδίο.

Ανάλυση λόγου: Είναι μία ρουμπρίκα που περιλαμβάνει ποικίλες μελέτες, Μία μελέτη αναφέρεται στην αναγνώριση της δομής του λόγου ενός συνδεόμενου κειμένου π.χ. την φύση των σχέσεων του λόγου μεταξύ δύο προτάσεων (π.χ. επεξήγηση, αντίθεση κτλ.). Μία άλλη πιθανή μελέτη είναι η αναγνώριση και η κατηγοριοποίηση των γλωσσικών πράξεων σε ένα κομμάτι κειμένου.
Αυτόματη αναγνώριση ομιλίας: Η αυτόματη μετατροπή του προφερόμενου ανθρώπινου λόγου σε κείμενο από τους τους υπολογιστές.
Αυτόματη ερωταπόκριση: Η αναζήτηση της σωστής απάντησης σε μία δεδομένη ερώτηση διατυπωμένη σε ανθρώπινη γλώσσα.
Αυτόματη μορφολογική τεμαχιοποίηση: Η κατάτμηση των λέξεων στα μορφήματά τους καθώς και η αναγνώριση και κατηγοριοποίηση αυτών των μορφημάτων. Η δυσκολία του συγκεκριμένου πεδίου μελέτης εξαρτάται σε μεγάλο βαθμό από την περιπλοκότητα της μορφολογίας της εκάστοτε φυσικής γλώσσας υπό εξέταση.
Αυτόματη περίληψη: Η παραγωγή μίας αναγνώσιμης περίληψης ενός κειμένου. Συχνά χρησιμοποιείται για να παρέχει περιλήψεις σε κείμενα γνωστής διάταξης, όπως άρθρα στο οικονομικό μέρος μίας εφημερίδας.
Εξαγωγή πληροφοριών: Η ανάκτηση πληροφοριών από μη δομημένα ή ημιδομημένα δεδομένα (τυπικά κείμενα γραμμένα σε φυσική γλώσσα, ιστοσελίδες κ.α.)
Επίλυση σχέσεων συναναφοράς: Η αναζήτηση του ποιες λέξεις (αναφορές) αναφέρονται στα ίδια υποκείμενα (οντότητες) σε μία δεδομένη πρόταση ή ένα μεγαλύτερο κομμάτι κειμένου. Η επίλυση σχέσεων αναφοράς είναι ένα συγκεκριμένο παράδειγμα αυτού του πεδίου και αναφέρεται συγκεκριμένα στην σύνδεση των αντωνυμιών με τα ουσιαστικά ή τα ονόματα στα οποία αναφέρονται.
Επισήμανση των μερών του λόγου: Ο αυτόματος καθορισμός των μερών του λόγου σε μία δεδομένη πρόταση και η επίλυση της συντακτικής αμφισημίας.
Κατανόηση φυσικής γλώσσας: Η μετατροπή κομματιών κειμένου σε πιο τυπικές αναπαραστάσεις όπως σε δομές λογικής πρώτου βαθμού, οι οποίες μπορούν να μεταχειριστούν ευκολότερα από τους υπολογιστές.
Μηχανική μετάφραση: Η αυτόματη μετάφραση ενός κειμένου από μία ανθρώπινη γλώσσα σε μία άλλη.
Οπτική αναγνώριση χαρακτήρων: Ο προσδιορισμός του αντίστοιχου κειμένου από μία δεδομένη εικόνα που αναπαριστά κάποιο τυπωμένο κείμενο.
Παραγωγή φυσικής γλώσσας: Η μετατροπή των πληροφοριών από υπολογιστικές βάσεις δεδομένων σε αναγνώσιμο φυσικό λόγο.
Σύνθεση ομιλίας: Η αυτόματη, τεχνητή παραγωγή του ανθρώπινου λόγου από τους υπολογιστές.
Συντακτική ανάλυση: Ο αυτόματος καθορισμός του συντακτικού δέντρου μίας δεδομένης πρότασης και η επίλυση των οποιοδήποτε συντακτικών αμφισημιών. Εξαιτίας των πιθανών αμφισημιών που πιθανόν να φέρει μία πρόταση, είναι δυνατόν η εν λόγω πρόταση να αναλυθεί σε παραπάνω από ένα συντακτικά δέντρα.
https://el.wikipedia.org/wiki/%CE%95%CF%80%CE%B5%CE%BE%CE%B5%CF%81%CE%B3%CE%B1%CF%83%CE%AF%CE%B1_%CF%86%CF%85%CF%83%CE%B9%CE%BA%CE%AE%CF%82_%CE%B3%CE%BB%CF%8E%CF%83%CF%83%CE%B1%CF%82

Natural language processing (NLP) is a subfield of computer science, information engineering, and artificial intelligence concerned with the interactions between computers and human (natural) languages, in particular how to program computers to process and analyze large amounts of natural language data.

Challenges in natural language processing frequently involve speech recognition, natural language understanding, and natural language generation.
https://en.wikipedia.org/wiki/Natural_language_processing
« Last Edit: 22 Jul, 2019, 14:10:46 by spiros »