Matches in SemOpenAlex for { <https://semopenalex.org/work/W2988391256> ?p ?o ?g. }
Showing items 1 to 41 of
41
with 100 items per page.
- W2988391256 abstract "<p class=Body>Korpus paralel memiliki peran yang sangat penting dalam mesin penerjemah statistik (MPS). Korpus paralel yang diperoleh berbagai sumber biasanya memiliki kualitas yang kurang baik, sedangkan kuantitas korpus paralel merupakan tuntutan utama bagi hasil penerjemahan yang baik. Penelitian ini bertujuan untuk mengetahui efek ukuran dan kualitas korpus paralel di MPS. Penelitian ini menggunakan metode <em>bilingual</em> <em>evaluation understudy</em> (BLEU) untuk mengklasifikasikan pasangan kalimat paralel sebagai kalimat berkualitas tinggi atau buruk. Metode ini diterapkan ke korpus paralel yang berisi 1,5 M pasangan kalimat Inggris-Indonesia paralel dan memperoleh 900K pasangan kalimat paralel berkualitas tinggi. Beberapa sistem MPS dengan berbagai ukuran korpus paralel mentah dan korpus berkualitas tinggi yang difilter dilatih dengan MOSES dan dievaluasi kinerjanya. Hasil percobaan yang dilakukan menunjukkan bahwa ukuran korpus paralel merupakan faktor utama dalam kinerja terjemahan. Selain itu, kinerja terjemahan yang lebih baik dapat dicapai dengan korpus berkualitas tinggi yang lebih kecil menggunakan metode filter berkualitas. Hasil eksperimen pada MPS bahasa Inggris-Indonesia menunjukkan bahwa dengan menggunakan 60% kalimat yang kualitas terjemahannya baik, kualitas terjemahan dapat meningkat sebesar 7,31%.</p><p class=Body> </p><p class=Body><em><strong>Abstract</strong></em></p><p class=Abstract><em>The parallel corpus has a very important role in the statistical machine translator (SMT) system. The parallel corpus obtained by various sources usually has poor quality, while the quantity of parallel corpus is the main demand for good translation results. This study aims to determine the effect of the size and quality of parallel corpus at SMT. This study uses the bilingual evaluation understudy (BLEU) method to classify pairs of parallel sentences as high-quality or bad sentences. This method is applied to a parallel corpus containing 1.5 M parallel English-Indonesian sentence pairs and obtaining 900K pairs of high-quality parallel sentences. Some SMT systems with various sizes of raw parallel bodies and high-quality corpus filtered are trained with MOSES and evaluated for performance. The experimental results show that the size of the parallel corpus is a major factor in translation performance. In addition, better translation performance can be achieved with a smaller high-quality corpus using a quality filter method.The experimental results in the English-Indonesian SMT show that by using 60% of sentences whose translation quality is good, the quality of the translation can increase by 7.31%.</em></p><p class=Body><em><strong><br /></strong></em></p>" @default.
- W2988391256 created "2019-11-22" @default.
- W2988391256 creator A5071117671 @default.
- W2988391256 date "2020-05-22" @default.
- W2988391256 modified "2023-09-26" @default.
- W2988391256 title "Peningkatan Akurasi Mesin Penerjemah Bahasa Inggris - Indonesia dengan Memaksimalkan Kualitas dan Kuantitas Korpus Paralel" @default.
- W2988391256 doi "https://doi.org/10.25126/jtiik.2020732076" @default.
- W2988391256 hasPublicationYear "2020" @default.
- W2988391256 type Work @default.
- W2988391256 sameAs 2988391256 @default.
- W2988391256 citedByCount "0" @default.
- W2988391256 crossrefType "journal-article" @default.
- W2988391256 hasAuthorship W2988391256A5071117671 @default.
- W2988391256 hasBestOaLocation W29883912561 @default.
- W2988391256 hasConcept C142362112 @default.
- W2988391256 hasConcept C15708023 @default.
- W2988391256 hasConcept C28490314 @default.
- W2988391256 hasConcept C33923547 @default.
- W2988391256 hasConcept C41008148 @default.
- W2988391256 hasConceptScore W2988391256C142362112 @default.
- W2988391256 hasConceptScore W2988391256C15708023 @default.
- W2988391256 hasConceptScore W2988391256C28490314 @default.
- W2988391256 hasConceptScore W2988391256C33923547 @default.
- W2988391256 hasConceptScore W2988391256C41008148 @default.
- W2988391256 hasLocation W29883912561 @default.
- W2988391256 hasOpenAccess W2988391256 @default.
- W2988391256 hasPrimaryLocation W29883912561 @default.
- W2988391256 hasRelatedWork W1619002 @default.
- W2988391256 hasRelatedWork W2218946 @default.
- W2988391256 hasRelatedWork W2308727 @default.
- W2988391256 hasRelatedWork W2578345 @default.
- W2988391256 hasRelatedWork W2864082 @default.
- W2988391256 hasRelatedWork W5457946 @default.
- W2988391256 hasRelatedWork W5952272 @default.
- W2988391256 hasRelatedWork W6397387 @default.
- W2988391256 hasRelatedWork W6657867 @default.
- W2988391256 hasRelatedWork W7082836 @default.
- W2988391256 isParatext "false" @default.
- W2988391256 isRetracted "false" @default.
- W2988391256 magId "2988391256" @default.
- W2988391256 workType "article" @default.