مقاله یکپارچه سازی اطلاعات زبانی
مدلهایی که ما در اینجا مورد بحث و بررسی قرار میدهیم از روش شناسی نحوی[1] استفاده نمیکنند. هم مدلهای مبتنی بر کلمه[2] (فصل 4) و هم مدلهای مبتنی بر عبارت[3] (فصل 5) بر اساس شکل ظاهری کلمه عمل میکنند. ما در این فصل و فصل بعدی درباره روشهایی به بحث و بررسی میپردازیم که در آنها تلاش بر این است تا کیفیت ترجمه ماشینی[4] آماری به واسطه روششناسی نحوی به روشهای مختلف بهبود پیدا کنند. این فصل بر روی روشهایی تمرکز دارد که روش مبتنی بر عبارت را گسترش میدهد و در فصل بعدی نیز چهارچوب جدیدی معرفی میشود که مبتنی بر نوع ساختار درختی و گرامر میباشد، ساختاری که استفاده بسیار رایجی در نظریه نحوی دارند.
محصول سیستمهای مبتنی بر عبارت میتواند به شکل زیر باشد (ترجمه زبان فرانسه با استفاده از دیتای یوروپارل):
«ما به خوبی میدانیم که پیمانها و عهدنامه های کنونی کافی نیستند و نیز به خوبی میدانیم که ایجاد ساختار موثرتر و متفاوت از اتحادیه در آینده امری ضروری خواهد بود، ساختاری مشروع که روشن میکند صلاحیت کشورهای عضو در چیست و اتحادیه چه قدرتهایی دارد».
درحالیکه همه کلمه های متن به درستی ترجمه شدهاند و به نظر میرسد که جملات در سطح مکانی منسجم[5] میباشند، مشکلاتی در رابطه با شکل دستوری[6] کلی وجود دارند. مشکلاتی در رابطه با جایگذاری[7] فعلها[8] و صفتها[9] وجود دارد که باعث میگردند این محصول به سختی خوانده شود.
فهرست مطالب
1-10). ترانویسی
1-1-10). اعداد و اسامی
2-1-10). ترجمه اسم
3-1-10). روش حالت محدود[1] برای ترانویسی
مدل کلمه انگلیسی
مدل تلفظ انگلیسی
مدل تبدیل صدای انگلیسی به صدای خارجی :
مدل هجی خارجی[1] :
4-1-10). منابع:
5-1-10). ترانویسی عطفی[1] و ترجمه:
2-10). تکواژشنا
1-2-10). تکواژ[1]
2-2-10). سادهسازی تکواژشناسی غنی
زبان آلمانی
زبان ترکی
زبان عربی
3-2-10). ترجمه تکواژشناسی غنی
4-2-10). تقسیم کلمه
3-10). بازسازی نحوی[1]
1-3-10). مرتبسازی مجدد مبتنی بر نحو زبان ورودی
2-3-10). یادگیری قوانین مرتبسازی مجدد
3-3-10). مرتبسازی مبتنی بر نشانههای ادات سخن
4-3-10). مرتبسازی مبتنی بر درختهای نحوی[1]
5-3-10). گزینههای حفظ