RSS

Category Archives: Maters

My Master’s Thesis

Injected Linguistic Tags Approach to Improve Phrase Based Statistical Machine Translation

Thesis Submitted to Computer Science Department in Partial Fulfillment of the Requirements for Obtaining the Degree of  MASTER of Science in Computer Science.
Please find the abstract of the work in both English and Arabic below:
Abstract

Statistical machine translation (SMT) has proven to give good results between languages with high similarity in morphological and grammatical nature like English and French. However, SMT still needs improvements when used to translate text between languages that have different morphology and syntax structure, especially between poor and rich morphological languages like English and Arabic. In this thesis, Injected Linguistic Tags approach is presented which improves the phrase based statistical machine translation (PBSMT). This approach has been applied to “English to Arabic translation”. The Injected Tags (ITs) approach is language independent and can be used with any language pair. The proposed approach incorporating English-Arabic languages using the state-of-the-art PBSMT system is presented. This approach presents a method to enrich and expand the SMT parallel corpus to allow more capabilities and vocabularies. The proposed approach has been evaluated and a comparison between its results with several online MT services has been presented. It has shown good improvement of the translation quality of at least 13% increase of BLEU score. The experiments reveal that the results achieved by this approach considered significant enhancements over PBSMT. Further more, the experiments show that for the translation system that uses the proposed approach, an increases of the noun/verb gender-number agreement of the translated text are recorded.


Published Work

This thesis has resulted in original work published as follows:

Waleed Oransa, Mohamed Kouta and Mohamed Sakre. “Injected Linguistic Tags to Improve Phrase Based SMT”. In t he 2nd International Conference on Computer and Automation Engineering , ICCAE, Singapore, 2010. [Download from IEEEXplore]

ملخص الرسالة باللغة العربية

لقد أعطت نظم الترجمة المبنية على الترجمة الإحصائية نتائج جيدة بين اللغات التي تمتاز بتقارب في طريقة الصرف والقواعد النحوية مثل اللغة الانجليزية والفرنسية. هذه النظم مازالت تحتاج إلى تحسين عندما يتم استخدامها للترجمة بين اللغات المختلف ، بشكل كبير، في طريقة الصرف و البناء اللغوي ، خاصة بين اللغات الفقيرة بالتصريفات واللغات الغنية بالتصريفات كالانجليزية والعربية. هذه الرسالة تناقش طريقة مقترحة للإثراء اللغوي لنظم الترجمة الإحصائية المعتمدة على المقاطع. هذه الطريقة تم تطبيقها للترجمة من اللغة الانجليزية إلى اللغة العربية لكنها تعتبر طريقة مستقلة عن اللغة فيمكن استخدامها لتحسين الترجمة بين أي لغتين.

هذه الرسالة تعرض نظام ترجمة آلية من اللغة الانجليزية للغة العربية باستخدام أحدث نظم الترجمة الإحصائية المفتوحة المصدر “موسى”. وتضيف هذه الرسالة وسيلة لإثراء نظم الترجمة الإحصائية عن طريق تعزيز قدراتها ومفرداتها بمفردات خارج الجمل المتوازية التي استخدمت في مرحلة تدريبها. تم تقييم الطريقة المقترحة ومقارنة النتائج مع خمس نظم ترجمة آلية متاحة على الانترنت وكانت نتائج الترجمة للعربية أفضل خاصة في قواعد مطابقة الاسم من ناحية التذكير والتأنيث والعدد مع الفعل والصفة.

أظهرت نتائج التجارب على نظام الترجمة الذي يستخدم طريقة الإثراء اللغوي تحسنا في النص المترجم للعربية مقارنة مع النظام الأساسي الذي لم يستخدم هذه الطريقة. كما أعطى “التقييم الآلي لجودة الترجمة” باستخدام مقياس “بلو” ومقياس “إن آي إس تي” ارتفاعا كان حده الأدنى بنسبة 13% مقارنة بالنظام الأساسي. كذلك تم تسجيل تحسن في مطابقة الاسم في التذكير والتأنيث والمفرد والجمع والمثنى والعدد مع بقية مكونات الجملة كالأفعال والصفات عنها في النظام الأساسي.

Advertisements
 
2 Comments

Posted by on 24/04/2010 in Maters

 

I got my Masters degree in CS

Asalam alikom,

I would like to share with you a good news. Yesterday was my Masters seminar. The thesis title is

“Injected Linguistic Tags Approach to Improve Phrase Based Statistical Machine Translation”

“طريقة الإثراء اللغوي لتحسين نظم الترجمة الآلية الإحصائية المعتمدة على المقاطع”

In the masters degree program from Arab Academy for Science and Technology & Maritime Transport, College of Computing & Information Technology

and elhamdoleAllah I got my Masters degree in computer science, It was a lot of hard work and research effort. I feel I did something useful to improve English into Arabic machine translation.

Acknowledgement

I would like to express my gratitude to Prof. Dr. Mohamed Kouta for his supervision of my thesis and his great support along my thesis work.

I am deeply indebted to my supervisor Dr. Mohamed Sakr whose help, stimulating suggestions and encouragement, helped me in all the time of research and writing of this thesis.

Also I would like to thank my examiners Prof. Dr. Mohamed Esam Khalifa and Prof.Dr.Mohamed Sharawy .

Also, I would like to thank my brother Osama Oransa for his help in J2ME related issues.

Especially, I would like to give my special thanks to my parents and my wife whose patient love and encouragement enabled me to complete this work.