clarinshare2cmdi.xsl2015-11-10http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3@format=cmdiclarin.eu:cr1:p_1610707853702CLARIN:EL CatalogueLandingPagehttp://hdl.handle.net/11500/ATHENA-0000-0000-2369-3Metadatahttp://hdl.handle.net/11500/ATHENA-0000-0000-2369-3@format=cmdi
2015-08-04
2022-06-20
http://w3id.org/meta-share/meta-share/CLARIN-SHARE
Pouli
Kanella
Pouli
Kanella
Αποθετήριο ΕΚ ΑΘΗΝΑ
ATHENA RC Repository
http://inventory.clarin.gr
JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses)
JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses)
Το JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses) είναι ένα παράλληλο σώμα κειμένων για τα σλοβακικά και ελληνικά που αποτελεί υποσύνολο του JRC-Acquis Multilingual Parallel Corpus.Το JRC-Acquis είναι ένα πολύγλωσσο σώμα κειμένων, στοιχισμένο σε επίπεδο πρότασης, σε 22 γλώσσες, που περιλαμβάνει συνολικά 1 δισεκατομμύριο λέξεις. Αυτή η συλλογή εγγράφων και οι χειρωνακτικά παραγόμενες μεταφράσεις τους μπορούν να χρησιμοποιηθούν για πολλούς σκοπούς, όπως η εκπαίδευση συστημάτων στατιστικής αυτόματης μετάφρασης, η εκπαίδευση και ο έλεγχος εφαρμογών εξόρυξης κειμένου (text mining), κα. Λεπτομέρειες για τον πόρο υπάρχουν στο: http://ipsc.jrc.ec.europa.eu/?id=198. Γλώσσες: βουλγαρικά, τσεχικά, δανικά, ολλανδικά, αγγλικά, εσθονικά, γερμανικά, ελληνικά, φινλανδικά, γαλλικά, ουγγρικά, ιταλικά, λεττονικά, λιθουανικά, μαλτέζικα, πολωνικά, πορτογαλικά, ρουμανικά, σλοβακικά, σλοβενικά, ισπανικά, σουηδικά. Ημερομηνία πρώτης διάθεσης: Μάιος 2006.
The JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses) is a parallel subcorpus for Slovene and Greek, subset of the JRC-Acquis Multilingual Parallel Corpus. The JRC-Acquis is a multilingual sentence-aligned parallel corpus in 22 languages, containing a total of over 1 billion words. This collection of documents and their manually produced translations can be used for many purposes, including the training of statistical machine translation systems, the training and testing of text mining applications, and more. Details on this resource can be found at the URL: http://ipsc.jrc.ec.europa.eu/?id=198. Languages: Bulgarian, Czech, Danish, Dutch, English, Estonian, German, Greek, Finnish, French, Hungarian, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovene, Spanish, Swedish. Date of first release: May 2006.
http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3
3.0
Κοινό Κέντρο Ερευνών - Ευρωπαϊκή Επιτροπή (2015). JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses). Version 3.0. [Dataset (Text corpus)]. CLARIN:EL. http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3
Joint Research Centre - European Commission (2015). JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses). Version 3.0. [Dataset (Text corpus)]. CLARIN:EL. http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3
https://ec.europa.eu/jrc/en/language-technologies/jrc-acquis
δίγλωσσο
bilingual
παράλληλο
parallel
διοικητικά κείμενα
administrative texts
επίσημο
official
στοίχιση
alignment
Computer Science, Information & General Works
DDC000
Law
DDC340
Medicine & Health
DDC610
Agriculture
DDC630
Economics
DDC330
Political Science
DDC320
general
Clarin_Domain003
Κοινό Κέντρο Ερευνών
Joint Research Centre
https://ec.europa.eu/jrc/en/about/jrc-site/ispra
The JRC-Acquis: A multilingual aligned parallel corpus with 20+ languages
Steinberger Ralf, Bruno Pouliquen, Anna Widiger, Camelia Ignat, Tomaž Erjavec, Dan Tufis, Dániel Varga (2006). The JRC-Acquis: A multilingual aligned parallel corpus with 20+ languages. Proceedings of the 5th International Conference on Language Resources and Evaluation (LREC'2006). Genoa, Italy, 24-26 May 2006.
https://www.aclweb.org/anthology/L06-1196/
JRC-Acquis.3.0
unspecified
corpus
annotatedCorpus
text
bilingual
parallel
el
el
sl
sl
administrative texts
ClarinEl_TT008
official
PAROLE_G009
Alignment1
sentence
automatic
Automatically extracted from the JRC-Acquis, aligned by the Hunalign aligner in moses format sentence aligned one sentence per line, in two files, one for the sentences of language xx and another for the sentences of language yy. This aligned corpus, derived from the equivalent xml file, only contains 1:1 alignments one sentence from language xx is aligned to only one sentence in language yy and does not contain any duplicates each pair [source sentence]-[target sentence] is unique. This process was responsibility of ILSP/Athena RC
downloadable
http://www.hiddenLocation.org
http://fixme.com
JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses). Δημιουργός: Κοινό Κέντρο Ερευνών - Ευρωπαϊκή Επιτροπή. Άδεια: Creative Commons Attribution 4.0 International (https://creativecommons.org/licenses/by/4.0/legalcode, https://creativecommons.org/licenses/by/4.0/). Πηγή: http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3 (CLARIN:EL)
JRC-Acquis subcorpus EL-SL (Hunalign aligned-Moses) by Joint Research Centre - European Commission used under Creative Commons Attribution 4.0 International (https://creativecommons.org/licenses/by/4.0/legalcode, https://creativecommons.org/licenses/by/4.0/). Source: http://hdl.handle.net/11500/ATHENA-0000-0000-2369-3 (CLARIN:EL)
MOSESFormat
UTF-8
787458.0
sentence1
Creative Commons Attribution 4.0 International
https://creativecommons.org/licenses/by/4.0/legalcode
https://creativecommons.org/licenses/by/4.0/
attribution
allowsDirectAccess
allowsProcessing
public
CC-BY-4.0
false
false