clarinshare2cmdi.xsl2015-11-10http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3@format=cmdiclarin.eu:cr1:p_1610707853702CLARIN:EL CatalogueLandingPagehttp://hdl.handle.net/11500/ATHENA-0000-0000-2369-3Metadatahttp://hdl.handle.net/11500/ATHENA-0000-0000-2369-3@format=cmdi 2015-08-04 2022-06-20 http://w3id.org/meta-share/meta-share/CLARIN-SHARE Pouli Kanella Pouli Kanella Αποθετήριο ΕΚ ΑΘΗΝΑ ATHENA RC Repository http://inventory.clarin.gr JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses) JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses) Το JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses) είναι ένα παράλληλο σώμα κειμένων για τα σλοβακικά και ελληνικά που αποτελεί υποσύνολο του JRC-Acquis Multilingual Parallel Corpus.Το JRC-Acquis είναι ένα πολύγλωσσο σώμα κειμένων, στοιχισμένο σε επίπεδο πρότασης, σε 22 γλώσσες, που περιλαμβάνει συνολικά 1 δισεκατομμύριο λέξεις. Αυτή η συλλογή εγγράφων και οι χειρωνακτικά παραγόμενες μεταφράσεις τους μπορούν να χρησιμοποιηθούν για πολλούς σκοπούς, όπως η εκπαίδευση συστημάτων στατιστικής αυτόματης μετάφρασης, η εκπαίδευση και ο έλεγχος εφαρμογών εξόρυξης κειμένου (text mining), κα. Λεπτομέρειες για τον πόρο υπάρχουν στο: http://ipsc.jrc.ec.europa.eu/?id=198. Γλώσσες: βουλγαρικά, τσεχικά, δανικά, ολλανδικά, αγγλικά, εσθονικά, γερμανικά, ελληνικά, φινλανδικά, γαλλικά, ουγγρικά, ιταλικά, λεττονικά, λιθουανικά, μαλτέζικα, πολωνικά, πορτογαλικά, ρουμανικά, σλοβακικά, σλοβενικά, ισπανικά, σουηδικά. Ημερομηνία πρώτης διάθεσης: Μάιος 2006. The JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses) is a parallel subcorpus for Slovene and Greek, subset of the JRC-Acquis Multilingual Parallel Corpus. The JRC-Acquis is a multilingual sentence-aligned parallel corpus in 22 languages, containing a total of over 1 billion words. This collection of documents and their manually produced translations can be used for many purposes, including the training of statistical machine translation systems, the training and testing of text mining applications, and more. Details on this resource can be found at the URL: http://ipsc.jrc.ec.europa.eu/?id=198. Languages: Bulgarian, Czech, Danish, Dutch, English, Estonian, German, Greek, Finnish, French, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovene, Spanish, Swedish. Date of first release: May 2006. http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3 3.0 Κοινό Κέντρο Ερευνών - Ευρωπαϊκή Επιτροπή (2015). JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses). Version 3.0. [Dataset (Text corpus)]. CLARIN:EL. http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3 Joint Research Centre - European Commission (2015). JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses). Version 3.0. [Dataset (Text corpus)]. CLARIN:EL. http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3 https://ec.europa.eu/jrc/en/language-technologies/jrc-acquis δίγλωσσο bilingual παράλληλο parallel διοικητικά κείμενα administrative texts επίσημο official στοίχιση alignment Computer Science, Information & General Works DDC000 Law DDC340 Medicine & Health DDC610 Agriculture DDC630 Economics DDC330 Political Science DDC320 general Clarin_Domain003 Κοινό Κέντρο Ερευνών Joint Research Centre https://ec.europa.eu/jrc/en/about/jrc-site/ispra The JRC-Acquis: A multilingual aligned parallel corpus with 20+ languages Steinberger Ralf, Bruno Pouliquen, Anna Widiger, Camelia Ignat, Tomaž Erjavec, Dan Tufis, Dániel Varga (2006). The JRC-Acquis: A multilingual aligned parallel corpus with 20+ languages. Proceedings of the 5th International Conference on Language Resources and Evaluation (LREC'2006). Genoa, Italy, 24-26 May 2006. https://www.aclweb.org/anthology/L06-1196/ JRC-Acquis.3.0 unspecified corpus annotatedCorpus text bilingual parallel el el sl sl administrative texts ClarinEl_TT008 official PAROLE_G009 Alignment1 sentence automatic Automatically extracted from the JRC-Acquis, aligned by the Hunalign aligner in moses format sentence aligned one sentence per line, in two files, one for the sentences of language xx and another for the sentences of language yy. This aligned corpus, derived from the equivalent xml file, only contains 1:1 alignments one sentence from language xx is aligned to only one sentence in language yy and does not contain any duplicates each pair [source sentence]-[target sentence] is unique. This process was responsibility of ILSP/Athena RC downloadable http://www.hiddenLocation.org http://fixme.com JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses). Δημιουργός: Κοινό Κέντρο Ερευνών - Ευρωπαϊκή Επιτροπή. Άδεια: Creative Commons Attribution 4.0 International (https://creativecommons.org/licenses/by/4.0/legalcode, https://creativecommons.org/licenses/by/4.0/). Πηγή: http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3 (CLARIN:EL) JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses) by Joint Research Centre - European Commission used under Creative Commons Attribution 4.0 International (https://creativecommons.org/licenses/by/4.0/legalcode, https://creativecommons.org/licenses/by/4.0/). Source: http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3 (CLARIN:EL) MOSESFormat UTF-8 787458.0 sentence1 Creative Commons Attribution 4.0 International https://creativecommons.org/licenses/by/4.0/legalcode https://creativecommons.org/licenses/by/4.0/ attribution allowsDirectAccess allowsProcessing public CC-BY-4.0 false false