Skip to Content

Meedan Releases the World's First Open Access Arabic/English Translation Memory

linuxawy's picture

I'll leave you now with their press release:


5 November, 2009: San Francisco, United States and Toronto, Canada

Today, Meedan, is releasing the first publicly available open licensed Arabic/English Translation Memory (TM). This release comes as a part of Meedan's ongoing commitment to improving the state of Arabic language machine processing research and supporting translators and machine translation researchers.

The new translation memory, called MeedanMemory, contains around one million words in aligned Arabic and English sentence pairs. It constitutes an invaluable resource for translation professionals, Arabic linguistic researchers, academics and volunteer communities, and is the first translation memory of such size and sophistication to be released under an open access license.

MeedanMemory is packaged as a standards-compliant Translation Memory Exchange (TMX) file, which facilitates its integration with most computer assisted translation tools and translation memory managers.

Professional translators can utilize MeedanMemory to support their translation work and improving its efficiency, and to increase consistency and quality in the translation outcome. Researchers can use this resource in designing and implementing their research activities into Arabic computer linguistics and machine language processing, which will lead to the development of better text search engines and document analysis tools and applications. And community organizations, non-profits and volunteer communities can leverage MeedanMemory to facilitate translation between Arabic and English of the content they produce for lower costs, lower turnaround times and higher quality.

The MeedanMemory is released under the Open Database License, which permits the use, copy and distribution of the translation memory, produce work using it, and to modify, transform and build upon the translation memory.

Meedan is pleased to announce this first release of MeedanMemory, and will continue to release data generated from the Meedan translation community into this open repository. We also hope that other organizations will contribute to the growth of this unique and valuable resource for the Arabic language and Arabic digital content that holds great potential for supporting Arabic content projects and initiatives.

For more information about MeedanMemory, please contact: [email protected]

Meedan Cross-language Arabic-English Social Networking: beta.meedan.net

About Meedan:

Meedan is a leading advocate for open linguistic data and open source tools and is innovating approaches to social translation, data aggregation, data visualization, and tagging in the context of Arab Region use cases.

نشرة إعلامية

ميدان تطلق أول ذاكرة ترجمة مفتوحة المصدر للغتين العربية والإنكليزية

6 تشرين الثاني: سان فرانسيسكو، الولايات المتحدة وتورونتو، كندا

تطلق ميدان اليوم أول ذاكرة ترجمة مفتوحة المصدر للغتين العربية والإنكليزية، ويأتي هذا الحدث تجسيداً لالتزام ميدان المستمر بتطوير أبحاث المعالجة الآلية للغة العربية ودعم المترجمين والباحثين في مجال الترجمة الآلية.

تحتوي ذاكرة الترجمة الجديدة والتي سميت (ذاكرة ميدان) ما يقارب المليون كلمة، مرتبة ضمن أزواج من الجمل المترجمة بين العربية والإنكليزية. وتوفر هذا الذاكرة مصدراً قيماً للمترجمين المحترفين والباحثين في مجال اللغويات العربية ومجتمعات المتطوعين، كما تعتبر أول ذاكرة ترجمة بهذا الحجم والتطور يتم إطلاقها ضمن إتفاقية ترخيص مفتوحة.

يمكن الحصول على ذاكرة ميدان بصيغة ملف متوافق مع معايير Translation Memory Exchange (TMX) مما يسهل تضمينها في معظم أدوات الترجمة بمعونة الحاسب أو أدوات إدارة ذاكرة الترجمة.

يمكن للمترجمين المحترفين استثمار ذاكرة ميدان لدعم عملهم في الترجمة وتحسين أدائه، بالإضافة إلى زيادة مستوى الإتساق والجودة لنتاج ترجمتهم. كما يمكن للباحثين أيضاً الإعتماد على هذا المورد أثناء تصميم وتنفيذ أنشطتهم البحثية في مجالات حوسبة اللغة العربية والمعالجة الآلية للغة العربية، مما سيتمخض بدوره عن تطوير جيل جديد من محركات البحث وأدوات وتطبيقات تحليل ومعالجة النصوص والوثائق يتميز بقدرته على التعامل بكفاءة مع خصوصيات اللغة العربية. كما يمكن للجمعيات الأهلية وغير الربحية وتجمعات المتطوعين الاعتماد على ذاكرة ميدان لتسهيل عملية الترجمة بين اللغتين العربية والإنكليزية لما ينتجوه من محتوى بكلفة أقل وزمن أقصر وجودة أعلى.

أطلقت ذاكرة ميدان ضمن إتفاقية ترخيص قواعد البيانات المفتوحة والتي تتيح للمستخدم إستثمار ونسخ وتوزيع هذه الذاكرة واستخدامها في إنتاج أية أعمال وتعديلها وتحويرها والبناء عليها.

يسر ميدان اليوم أن تعلن عن إطلاق هذا الإصدار الأول من ذاكرة ميدان، والتي سيليها المزيد من إصدار البيانات التي يعمل مجتمع الترجمة في ميدان على إنتاجها وإتاحتها ضمن هذا المورد المفتوح. كما نأمل أن تنضم إلينا المؤسسات والمنظمات الأخرى المهتمة بهذا الموضوع في إغناء وتنمية هذا المورد الفريد والقيم لخدمة اللغة العربية والمحتوى الرقمي العربي، والذي يعد بالدعم الوفير لمشاريع ومبادرات المحتوى العربي.

للمزيد من المعلومات عن ذاكرة ميدان، يرجى الإتصال بعنوان البريد الإلكتروني التالي: [email protected]

الموقع الإلكتروني لشبكة ميدان الإجتماعية العابرة للغات: beta.meedan.net

عن ميدان

ميدان (وتعني بالعربية "ساحة البلدة") هي مؤسسة غير ربحية تهدف إلى نشجيع تبادل المعرفة والمحادثات عبر الحواجز اللغوية والثقافية، وتركز حالياً على اللغتين العربية والإنكليزية. تقوم ميدان بتخديم مستخدمي الإنترنت المهتمين بتبادل الآراء والأفكار من خلال موقعنا beta.meedan.net، كما توفر منصات للتشبيك الإجتماعي وتبادل المعرفة والترجمة التشاركية لشبكة من شركائها. أسست ميدان في العام 2006، ومقرها الرئيسي سان فرانسيسكو. يتوزع فريق عمل ميدان (والذي يطلقون على أنفسهم لقب "ميدانيين") للهندسة والتصميم والترجمة فيما بين القاهرة ودمشق ولندن وبيروت والضفة الغبية وقطاع غزة وجدة والرباط وعمان وتورونتو وبورتلاند.

تعتبر ميدان أحد رواد حركة البيانات اللغوية المفتوحة وأدوات المصادر المفتوحة وتعمل جاهدة على تطوير أساليب مبتكرة للترجمة التشاركية وتجميع وتصنيف البيانات وتمثيلها بيانياً في سياق استخدام شبكة الإنترنت في العالم العربي



Dr. Radut | blog