Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

banned8

Εξομολόγηση ιερόσυλου:

Λοιπόν, επειδή η μετάφραση, μ’ όλη την αγάπη που της έχω, δεν ήταν ποτέ η κύρια ασχολία μου, δεν απέκτησα και κανένα από τα επίσημα εργαλεία του μεταφραστή, Trados και τα τοιαύτα. Άλλωστε, είμαι της παλιάς σχολής, όταν το πιο εξελιγμένο εργαλείο που μπορούσες να έχεις (ακόμα θυμάμαι τη χαρά που έκανα όταν το απέκτησα) ήταν μια ΙΒΜ με πολλά μπαλάκια! Που μετά αναβαθμίστηκαν σε μαργαρίτες!

Να σας πω τι κάνω εγώ και μπορείτε να εφαρμόσετε στις απλές δουλειές σας όσοι δεν είστε έτοιμοι να ξηλωθείτε για ακριβά εργαλεία. Όταν πρέπει να μεταφράσω ή να διορθώσω κάποια δουλειά που υπάρχει σε Word (αν υφίσταται μόνο σε τυπωμένη μορφή, την περνάω από ένα OCR πρόγραμμα και την κάνω αρχείο του Word), δημιουργώ ένα DOC με δύο στήλες (και ένα οριζόντιο κελί, row). Στην αριστερή στήλη ρίχνω το πρωτότυπο και στη δεξιά αυτό που πρέπει να διορθώσω (ή εκεί μεταφράζω). Φροντίζω, πατώντας Enter όπου χρειάζεται, να είναι πάντοτε αντικριστά τα δύο κείμενα. Και πολύ με διευκολύνει που δεν χρειάζεται να έχω κάπου πέρα από την οθόνη μου ένα πρωτότυπο κείμενο όπου πρέπει συνέχεια να παρακολουθώ σε ποιο σημείο βρίσκομαι.

Εκτός από τα διάφορα προσωπικά γλωσσάρια που διατηρώ (εγώ με δικό μου πρόγραμμα, εσείς με όποιον άλλο τρόπο θέλετε πρότεινα το Excel), υπάρχουν τώρα και διάφορα δωρεάν εργαλεία όπως το Google Desktop Search και το Copernic Desktop Search, που ευρετηριάζουν τα αρχεία σας και μπορείτε να κάνετε αναζητήσεις όπως κάνετε στο Google για τις διαδικτυακές σελίδες.

Και βέβαια, επειδή έχω γερά μάτια και δεν χρειάζομαι σαν τον Σπύρο να βλέπω μεγάλα και καθαρά τα γράμματα : ) , έχω ανάλυση οθόνης 1600x1200 και, εκτός από το Word, χωράω και δυο-τρία λεξικά στην ίδια επιφάνεια της οθόνης!

ΥΓ. Δεν χρειάστηκε να αναβαθμιστώ στα Windows, Σπύρο, γιατί τα εργαλεία στο DOS, όταν κάνουν τη δουλειά σου, είναι πολύ πιο γρήγορα από αντίστοιχα των Windows. Μου λείπουν βέβαια οι δυνατότητες για γραμματοσειρές, αλλά και πάλι δεν θα άλλαζα με τίποτε την ταχύτητα.

spiros

Εάν όντως έχεις πολλές μεταφράσεις αντικρυστά σε κελιά πίνακα του Word τότε πολύ εύκολα μπορείς να τα μετατρέψεις σε μεταφραστική μνήμη! Όσον αφορά για τα εργαλεία: το Wordfast είναι δωρεάν μέχρι 500 μεταφραστικές μονάδες στη μνήμη (σε καλύπτει για δουλειές 3.000-5.000 λέξεων) και κοστίζει 180 ευρώ εάν θες πλήρη έκδοση. Το Metatexis κοστίζει 79 ευρώ και έχεις 60 μέρες δωρεάν δοκιμή με όλες τις δυνατότητες!

Πίστεψέ με, η χρήση ενός τέτοιου εργαλείου σού γλυτώνει πολύ χρήμα και χρόνο - η μέθοδος που περιέγραψες δεν σου βγάζει αυτόματα μία πρόταση όταν έχεις ήδη μεταφράσει την ίδια ή μια παρόμοια!

Για εργαλείo ευρετηρίασμου, για το είδος της εργασίας που περιγράφεις, θα πρότεινα το dtSearch Desktop (το οποίο βέβαια κοστίζει περίπου όσο το Wordfast)! Εγώ χρησιμοποιώ ιδιαίτερα και το search and replace (κοστίζει μόνο 25 δολάρια). Ανάλυση παρόμοιων εργαλείων θα βρεις στο Google Desktop Search and beyond: More applications that search your hard drive!.

diceman

Νομίζω ότι μόλις στο τελευταίο μήνυμα έγινε σαφής η διαφορά μεταξύ της μεθόδου του Νίκου και της χρήσης μεταφραστικών μνημών. Στο περιβάλλον εργασίας που προτείνει ο Νίκος, η αναζήτηση όρων στα διάφορα γλωσσάρια γίνεται από τον ίδιο το μεταφραστή. Με τις μνήμες η αναζήτηση γίνεται αυτόματα και έτσι κερδίζουμε πολύ χρόνο.

Σημαντική διευκρίνιση: άλλο μεταφραστική μνήμη και άλλο γλωσσάριο. Στη μεταφραστική μνήμη αποθηκεύονται φράσεις ή προτάσεις του πρωτοτύπου μαζί με τις μεταφράσεις τους, σε ζεύγη που ονομάζονται μεταφραστικές μονάδες. Στο γλωσσάριο (το οποίο αποτελεί μια ορολογική μνήμη), αποθηκεύονται όροι, ακρωνύμια, επωνυμίες οργανισμών κ.λπ.). Όταν χρησιμοποιούμε μία μνήμη, η αυτόματη αναζήτηση γίνεται και στη μεταφραστική μνήμη (σε επίπεδο φράσης / πρότασης) και στην ορολογική (σε επίπεδο ορολογίας). Άρα το όφελος είναι διπλό. (Τριπλό, αν κανείς λάβει υπόψη του και τα placeables).

Τέλος, προσθέτω κάτι που χάθηκε με το crash. Και με το MultiTerm iX μπορεί κανείς να φτιάξει γλωσσάρια: μονόγλωσσα, πολύγλωσσα, όσο απλά ή όσο σύνθετα θέλει. Βέβαια, όπως ορθά λέει ο Σπύρος, το πρόγραμμα απαιτεί μια κάποια επένδυση χρόνου από το χρήστη. Από την άλλη πλευρά, όμως, το πρόγραμμα είναι δωρεάν! Η Trados μπορεί να μην το "διαφημίζει" αυτό, αλλά το demo που προσφέρει είναι η πλήρης έκδοση του προγράμματος, χωρίς περιορισμούς όσον αφορά το μέγεθος ή τη διάρκεια χρήσης! Επιπλέον, ενσωματώνεται με το Word, μπορεί να μετατρέψει αυτόματα τα γλωσσάρια μας σε ιστοσελίδες, φύλλα του Excel, tab-delimited text files και πλήρως σελιδοποιημένα έντυπα λεξικά, υποστηρίζει την ταυτόχρονη αναζήτηση σε πολλά γλωσσάρια κ.ά. Και δεν κοστίζει ούτε ένα λεπτό!

banned8

Πήγα εγώ ο φτωχός θεράπων της μεταφραστικής να ρίξω μερικές ιδέες για άλλους φτωχούς που ήθελαν να φτιάξουν ένα απλό γλωσσάρι και να κάνουν μια απλή μετάφραση και μου την έπεσαν οι επιστήμονες και μ’ άρχισαν στα περί διαγραμμάτων.

Δεν αμφισβήτησα τη χρησιμότητα όλων των μεταφραστικών εργαλείων στο επίπεδο του επαγγελματία μεταφραστή, συνήθως τεχνικών μεταφράσεων, που απαντά συχνά στο δρόμο του τους ίδιους όρους και τις ίδιες διατυπώσεις και είναι άκρως παραγωγικό να του κάνει τη μισή δουλειά κάποιο έξυπνο πρόγραμμα.

Ωστόσο, ο φτωχός φοιτητής που αποφάσισε να μελετήσει ξενόγλωσση βιβλιογραφία και να στήσει ένα μικρό γλωσσάρι οικονομικών όρων για να καταλαβαίνει τι διαβάζει και να εμπλουτίζει το λεξιλόγιό του, επιμένω ότι μπορεί να κάνει τη δουλειά του με το Excel. Και ο φτωχός μεταφραστής που μεταφράζει βιπεράκια ή Σέλεϊ, μπορεί να εξυπηρετηθεί από τα μεταφραστικά προγράμματα περίπου όσο κι από το Systran.

Να μη δώσουμε την εντύπωση ότι τούτος εδώ ο διαδικτυακός τόπος και τούτο εδώ το φόρουμ απευθύνονται μονάχα σε μεταφραστές εγχειριδίων, προδιαγραφών και κοινοτικών οδηγιών.

Φίλοι μεταφραστές που έχετε σαν μοναδικό εργαλείο σας τη φαντασία σας (άντε και μερικά καλά λεξικά), να ξέρετε ότι εδώ θα βρείτε ό,τι τραβά η ψυχή σας. Και μάθετε να κάνετε καλή ορθοπεταλιά στο ποδήλατο πριν πάρετε το διαστημόπλοιο να πάτε στο φεγγάρι.

spiros

Νικ,

Αναμφισβήτητα τα εργαλεία δεν κάνουν τον μεταφραστή, ούτε όλοι οι μεταφραστές μεταφράζουν κείμενα με υψηλή επαναληψιμότητα, αλλά όπως ξέρεις και εσύ υπάρχει κάποια "ποίηση" στα "μαθηματικά" της υποβοηθούμενης μετάφρασης από υπολογιστή και των διαθέσιμων εφαρμογών.

Όσον αφορά τα λογοτεχνικά κείμενα και εκεί τα εργαλεία μπορούν να βοηθήσουν. Π.χ. μπορεί κανείς να συμβουλευτεί ένα μονόγλωσσο/δίγλωσσο ηλεκτρονικό σώμα κειμένων για τη χρήση μίας λέξης ή έκφρασης ως ένα βήμα πέρα από τη χρήση λεξικών.

Π.χ. εάν μεταφράζει κανείς Shakespeare και έχει μία βάση σε μεταφραστική μνήμη από όλες τις μεταφράσεις του Shakespeare στα ελληνικά τότε η εργασία του επιταχύνεται σημαντικά. (Για φαντάσου να χρειαζόταν να έχει ανοικτά 4-5 βιβλία και να ψάχνει για χωρία που να έχουν τη λέξη που χρησιμοποιεί...).

Υπάρχει άλλωστε ένας γνωστικός τομέας που ονομάζεται Computers in the Humanities ή Humanities Computing και έχει παράξει σημαντικό ερευνητικό έργο. Δες π.χ. το εργαλείο δημιουργίας συμφραστικών πινάκων όπως έχει χρησιμοποιηθεί για τα έργα του... Shelley (τον οποίο αναφέρεις) καθώς και για άλλους.

banned8

You're preaching to the converted. Απλώς εσύ υποστηρίζεις τα μήλα σου, κι εγώ τα πορτοκάλια μου. Η συζήτηση ξεκίνησε από ένα απλό αίτημα κάποιου επισκέπτη. Και ο τίτλος της σειράς είναι "Πώς στήνουμε πρόχειρα γλωσσάρια".

Μου άρεσε περισσότερο η επισήμανση για τα ηλεκτρονικά σώματα κειμένων. Και αυτή τη στιγμή το Google, με σωστή αξιοποίησή του, είναι από τα πιο πολύτιμα εργαλεία, ακόμα και για την απλούστερη μεταφραστική δουλειά, ακόμα και για την αναζήτηση απλών "συνταγμάτων" που λένε οι γλωσσολόγοι. Το όνειρό μου είναι να μπορούσα να έχω το Google σε μορφή γλωσσικής τράπεζας, όπως π.χ. το British National Corpus.

Τα περί Σέξπιρ, καλό είναι να τα ακούει και ο συνομιλητής μας που ξέχασε ότι το "What's in a name" ανήκει στην Ιουλιέτα.

spiros

Το British National Corpus ανήκει στα λεγόμενα tagged corpora, δηλαδή είναι ένα ηλεκτρονικό σώμα κειμένων με γλωσσικές ετικέτες οι οποίες "χαρακτηρίζουν" το κείμενο. Π.χ. υπάρχουν διαφορετικές ετικέτες και μέρη του λόγου, ονοματικές φράσεις, ρηματικές φράσεις κ.ο.κ. Αυτή η εργασία γίνεται σε μεγάλο βαθμό χειρωνακτικά - για αυτό και θα ήταν αδύνατο να γινόταν το ίδιο με το Google. Εξάλλου, για να το χωρέσεις θα χρειαζόσουν υπερυπολογιστή της ΝΑΣΑ. Αυτή είναι και η μαγεία του Διαδικτύου: πιο γρήγορα ψάχνεις τα άπειρα δεδομένα του Διαδικτύου απ' ό,τι τον σκληρό σου δίσκο.

Δείγμα από το σύνολο ετικετών του BNC

AJ0 Adjective (general or positive) (e.g. good, old, beautiful)

AJC Comparative adjective (e.g. better, older)

AJS Superlative adjective (e.g. best, oldest)

AT0 Article (e.g. the, a, an, no) [N.B. no is included among articles, which are defined here as determiner words which typically begin a noun phrase, but which cannot occur as the head of a noun phrase.]

AV0 General adverb: an adverb not subclassified as AVP or AVQ (see below) (e.g. often, well, longer (adv.), furthest. [Note that adverbs, unlike adjectives, are not tagged as positive, comparative, or superlative.This is because of the relative rarity of comparative and superlative adverbs.]

AVP Adverb particle (e.g. up, off, out) [N.B. AVP is used for such "prepositional adverbs", whether or not they are used idiomatically in a phrasal verb: e.g. in 'Come out here' and 'I can't hold out any longer', the same AVP tag is used for out.

AVQ Wh-adverb (e.g. when, where, how, why, wherever) [The same tag is used, whether the word occurs in interrogative or relative use.]

CJC Coordinating conjunction (e.g. and, or, but)

CJS Subordinating conjunction (e.g. although, when)

banned8

Μίλησα για ένα όνειρό μου, Σπύρο, και κατάφερες να το μετατρέψεις σε χίμαιρα. Δεν θα μπορούσα να ονειρευτώ τα περιεχόμενα των δίσκων του Google σε τέτοια μορφή. Αναφερόμουν περισσότερο στη δυνατότητα της συχνότητας εμφάνισης, να μπορούμε δηλαδή να βρούμε πιο επίθετο μπαίνει πιο συχνά μπροστά από τον «πολιτικό». Αλλά εδώ δεν έχει αποφασίσει το Google να κάνει κάτι για τους τόνους μας και για να βρούμε μια ελληνική λέξη πρέπει συχνά να κάνουμε τρεις αναζητήσεις (Κάρολου, Καρόλου, ΚΑΡΟΛΟΥ), για να μην πούμε και για το πρόβλημα της πολυτυπίας που μας υπενθύμισε η Ελευθερία.

diceman

Quote from: nickel on 17 Apr, 2005, 17:33:00

Να μη δώσουμε την εντύπωση ότι τούτος εδώ ο διαδικτυακός τόπος και τούτο εδώ το φόρουμ απευθύνονται μονάχα σε μεταφραστές εγχειριδίων, προδιαγραφών και κοινοτικών οδηγιών.

Φίλοι μεταφραστές που έχετε σαν μοναδικό εργαλείο σας τη φαντασία σας (άντε και μερικά καλά λεξικά), να ξέρετε ότι εδώ θα βρείτε ό,τι τραβά η ψυχή σας. Και μάθετε να κάνετε καλή ορθοπεταλιά στο ποδήλατο πριν πάρετε το διαστημόπλοιο να πάτε στο φεγγάρι.

Φίλε Νίκο,

(Επίτρεψέ μου την οικειότητα, αν και δεν σε γνωρίζω προσωπικά.)
Δεν είσαι μόνος! Θα σε ξάφνιαζα αν σου έλεγα ότι η λογοτεχνία είναι η μεγάλη μου αγάπη και ότι μεταφράζω σχεδόν αποκλειστικά λογοτεχνικά έργα (και όχι εγχειρίδια κ.λπ.); Καλά είναι και τα τεχνικά κείμενα, αλλά γεμίζουν μόνο την τσέπη και όχι την ψυχή. Παρόλα αυτά, πιστεύω ότι όποια κι αν είναι η δουλειά σου, αν υπάρχει τρόπος να την κάνεις γρηγορότερα και αποτελεσματικότερα, καλό είναι να τον ξέρεις.
Γενικώς, σε αυτό το forum πρέπει να να μοιραζόμαστε τη γνώση μας είτε αφορά την ορθοπεταλιά είτε την πηδαλιούχηση ενός διαστημοπλοίου.

spiros

Νίκο, μιλάς για εμφάνιση αποτελεσμάτων διαδικτύου σε μορφή συμφραστικού πίνακα. Για αυτό υπάρχουν εργαλεία που χρησιμοποιούν το API του Google όπως το http://www.webcorp.org.uk.

Όσον αφορά για τις πολλαπλές αναζητήσεις η εφαρμογή είναι εύκολη, ονομάζεται accent insensitive search (το case insensitive ήδη εφαρμόζεται στο google) και μπορεί να το έχω σε μία εφαρμογή που ετοιμάζω.

Όσον αφορά για την πολυτυπία το altavista υποστήριζε αναζήτηση με μπαλαντέρ στη λέξη, δηλαδή το παραγωγ* θα έβρισκε παραγωγικός, παραγωγική, παραγωγικό, παραγωγικότητα, κ.ο.κ. Δεν το υποστηρίζει όμως πλέον! Αντίθετα όλες οι μηχανές αναζήτησης έχουν στραφεί στο λεγόμενο stemming το οποίο βέβαια δεν καλύπτει τα ελληνικά.

Quote

Stemming:
The use of linguistic analysis to get to the root form of a word. Search engines that use stemming compare the root forms of the search terms to the documents in its database. For example, if the user enters "viewer" as the query, the search engine reduces the word to its root ("view") and returns all documents containing the root - like documents containing view, viewer, viewing, preview, review etc.
http://www.searchenginedictionary.com/terms-stemming.shtml

banned8

Μπράβο, Σπύρο. Αποκάλυψη. Δεν τους ήξερα αυτούς τους webcorp. Ενδιαφέρον φαίνεται, παρότι αργό και δεν νομίζω να φτιάχνει το είδος του συμφραστικού πίνακα βάσει συχνότητας που θα ήθελα να δω, αλλά θα το ψάξω περισσότερο. Αναφέρομαι πάντως σε κάτι σαν κι αυτό το παράδειγμα που σου δίνω από το BNC. Νομίζω ότι ούτε το ilsp δεν δίνει κάτι τέτοιο.

Ετοιμάζεις φίλτρο για το Google ή καλύτερα για το MSN Search; Σ' αυτό το δεύτερο μπορείς να φτιάξεις ένα ωραίο macro για να κάνει κάτι σαν accent insensitive search. Μίλα στον Γ.Μ. για να το παντρέψετε μετά με την Ελληνομάθεια και να κάνετε πολυτυπική αναζήτηση. Wow!

Και πράγματι, τι έπαθαν οι Altavista; Είχαν ένα πλεονέκτημα έναντι των άλλων ψαχτηριών και το απεμπόλησαν έτσι, από τη μια μέρα στην άλλη;

Δείγμα BNC

spiros

Το σώμα κειμένων του ΙΕΛ εκτελεί τέτοια αναζήτηση. Δες συννημένο.

banned8

Δεν ήμουν σαφής. Πρόσεξε, Σπύρο, πώς με το BNC μπορώ να ταξινομήσω τα αποτελέσματα, π.χ. εδώ με τη λέξη που προηγείται του polticians, και έτσι να βρω, για παράδειγμα, ποιο επίθετο συντάσσεται συχνότερα με τη λέξη μου. (Δεν θέλω να πω τίποτε με το παράδειγμα για τους politicians. Θου, Κύριε, φυλακήν τω στόματί μου.)

Νομίζω, ωστόσο, ότι ξεστράτισε εντελώς η συζήτηση από τα απλά γλωσσάρια. Moderator, moderate!

spiros

Στο ΙΕΛ μπορείς να βάλεις πρώτη, δεύτερη και τρίτη λέξη και να ορίσεις πόσο θα απέχουν μεταξύ τους εάν αυτό εννοείς. Και μέρος του λόγου μπορείς να ορίσεις καθώς είναι tagged corpus. Π.χ. στο συνημμένο, έχω όρισει πρώτη λέξη ως "επίθετο" και δεύτερη ως "πολιτικός". Και στατιστικά σου βγάζει, νομίζω όμως πρέπει να είσαι μέλος για ορισμένες προχωρημένες λειτουργίες.

Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

banned8

Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

spiros

Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

diceman

Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

banned8

Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

spiros

Re: Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

banned8

Re: Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

spiros

Re: Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

banned8

Re: Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

diceman

Re: Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

spiros

Re: Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

banned8

Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

spiros

Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

banned8

Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.

spiros

Re: Περί μεθοδολογίας μετάφρασης με υπολογιστή, μνήμες, σώματα κειμένων κ.ά.