تاريخ تطوير مترجمو AI@goodchinabrand.com

في منتدى بواو لآسيا في عام 2018 ، وبصرف النظر عن جدول الأعمال الرئيسي ، كان أكثر النقاط الساخنة إثارة للانتباه هو إدخال الذكاء الاصطناعي للترجمة الشفهية في الوقت الفعلي في الاجتماع لأول مرة ، ومع ذلك ، لم يظهر الذكاء الاصطناعي في "صناعة الترجمة الفورية الفورية الفورية" الأصلية. في مواجهة خطر البطالة الوشيكة ، على العكس من ذلك ، فإن نتيجة الترجمة لأخطاء خطيرة ، على العكس من ذلك ، أعفت المترجمين الفوريين في الوقت الحقيقي ، ويبدو أن هذا الخط ما زال يمكن تناوله لفترة طويلة.

"الكتاب المقدس العهد القديم سفر التكوين" وصفها في الفصل 11، بعد تراجع الطوفان العظيم، وهذا العالم البشري هم أبناء نوح، يتحدثون نفس اللغة عندما بدأ البشر للتعاون وبناء يسمى برج بابل بابل برج. أزعجت تحرك الله، لذلك دعونا الله البشر في جميع أنحاء العالم وبدأ أن يكون لها لغة مختلفة، كان الجنس البشري لم يعد التعاون موحد. جعلت بابل انتهت خطط بالفشل، عندما تصبح الاختلافات اللغوية أيضا أكبر التواصل الإنساني عقبة. ربما كان الدم لا تزال ترغب في حلم إعادة بناء برج بابل، لذلك أصبحت الترجمة التركيز على المشاريع الثقافية البشرية على مدى آلاف الماضية السنين من التاريخ في التطور.

ليس من السهل كسر الحاجز اللغوي ، وعلى وجه الخصوص ، من الضروري فهم المفهوم نفسه عبر اللغات ، وللمرة الأولى في تاريخ البشرية ، أنتجت روزيتا ستون ، التي تم إنتاجها عام 196 قبل الميلاد. تم استخدام النصوص المصرية القديمة واليونانية القديمة والعامية المحلية لتسجيل الكتاب المقدس المنقوش للملك بطليموس من الملك المصري القديم ، وهذا أيضا معلم رئيسي في الترجمة.

ترجمة آلية قائمة على القواعد

أما بالنسبة للترجمة الآلية المصدر، يمكن أن ترجع إلى عام 1949، اقترح نظرية المعلومات باحث وارن نسج رسميا مفهوم الترجمة الآلية. وبعد خمس سنوات، أي في عام 1954، IBM بالتعاون مع جامعة جورج تاون أعلن الأولى في العالم الترجمة الآلية IBM-701. أنها قادرة على ترجمة الروسية إلى الإنجليزية، على الرغم من أنه لديه الهيئة العظيمة، والتي في الواقع أنها بنيت فقط ستة أحكام قواعد القانون، فضلا عن 250 كلمة. ولكن على الرغم من ذلك، لا يزال هذا طفرة تكنولوجية كبرى، في ذلك الوقت ، بدأ البشر يشعرون بأنهم قادرون على كسر جدار اللغة بسرعة.

كان من الممكن أن الله قد لاحظ شيئًا مختلفًا وصب دلوًا من الماء البارد على خطة إعادة البناء البشري لبرج بابل ، وفي عام 1964 ، أنشأت الأكاديمية الأمريكية للعلوم اللجنة الاستشارية لمعالجة اللغات تلقائيًا (ALPAC). في التقرير المقدم ، يعتبر أن الترجمة الآلية لا تستحق الاستمرار في الاستثمار ، لأن هذا التقرير جعل الولايات المتحدة تكاد تقضي بإيقاف دراسة الترجمة الآلية تقريبًا في السنوات العشر القادمة.

منذ مولد أول جهاز ترجمة لشركة IBM إلى ثمانينيات القرن العشرين ، كان التيار التكنولوجي الرئيسي في ذلك الوقت هو الترجمة الآلية المستندة إلى القواعد ، والطريقة الأكثر شيوعًا هي ترجمة الكلمات بشكل مباشر وفقًا للقاموس ، على الرغم من أن بعض الأشخاص اقترحوا لاحقًا إضافة قواعد النحو لتصحيحها. ولكن لكي نكون صادقين ، تبين أن النتائج محبطة للغاية ، لأنها تبدو غبية ، لذلك ، بحلول الثمانينات من القرن العشرين ، اختفت هذه الممارسات.

لماذا لا تنطبق اللغات القواعد؟ لأن اللغات معقدة للغاية وأنظمة غامضة ، من الغموض الكلامي إلى البلاغة ، من المستحيل استنفاد جميع القواعد ، ولكن المثير للاهتمام أن العديد من الابتكارات الحديثة في اللغة الطبيعية الشركة ، لا تزال تحاول حل دلالات الصينية مع قواعد شاملة ، ولكن هذه الفكرة بالتأكيد تنتهي بالفشل.

سوف أعطي مثالا لتوضيح سبب عدم جدوى القواعد ، لا تذكر تعقيد الترجمة بلغتين ، فقط من المنظور الصيني ، مفهوم التوصيل السريع سريع ، فكم عدد أنواع التعاليم التي يمكنك التفكير فيها؟ 10 أنواع أو 100 نوع؟ وفقا لإحصائيات اللغة الطبيعية التي قمنا بها من قبل ، قد يكون هناك 3600 نوع من التعاليم في مجموع ، وهذا العدد يجب أن يزداد مع مرور الوقت ، ويمكن أن تكون الجملة بمثل هذا المفهوم البسيط بالنسبة إلى نظام معقد من القواعد ، إذا كنت تستخدم الترجمات ، فأنا أخشى أن تكون كمية القواعد رقمًا فلكيًا مذهلاً ، لذلك ، فإن فكرة الترجمة الآلية المستندة إلى القواعد ستصبح زهرة صفراء أمس.

الترجمة الآلية المستندة إلى المثيل

في الوقت الذي انخفض فيه العالم كله في المرحلة المنخفضة من الترجمة الآلية ، هناك بلد لديه هواجس قوية للترجمة الآلية ، تلك هي اليابان ، حيث يعاني اليابانيون من براعة ضعيفة في اللغة الإنجليزية ، وبالتالي لديهم طلب قوي صارم على الترجمة الآلية.

اقترح البروفيسور Nagao Shinretsu من جامعة كيوتو في اليابان ترجمة آلية على سبيل المثال ، أي التوقف عن التفكير في السماح للآلات بالترجمة من الصفر ، فنحن نحتاج فقط إلى تخزين جمل أمثلة كافية ، حتى لو واجهنا جملًا لا تتطابق تمامًا ، يمكنك أيضاً مقارنة الجمل المثالية ببساطة عن طريق استبدال ترجمة الكلمات المختلفة ، وهذا النوع من التفكير الساذج هو بالتأكيد ليس أفضل بكثير من الترجمة الآلية المستندة إلى القواعد ، لذلك لم يسبب موجة ، ولكن سرعان ما كان الأمل في إعادة البناء البشري لبرج بابل يبدو لرؤية الفجر مرة أخرى.

الترجمة الآلية الإحصائية

فجر الإحصائي ازدهار الترجمة الآلية أو IBM، في اقترحت "الترجمة الآلية رياضية نظرية" ورقة صادرة في عام 1993 نموذج إحصائي يتكون من خمس وحدات في كلمة واحدة، ودعا "IBM نموذج 1" إلى "5 نموذج IBM".

ويترجم الأفكار نموذج إحصائي في شكل سؤال من الاحتمالات. ومن حيث المبدأ هو الحاجة إلى استخدام جسم مواز، ثم حرفيا الإحصاءات. على سبيل المثال، على الرغم من أن الجهاز لم يكن يعرف ما هي "المعرفة" من اللغة الإنجليزية، ولكن بعد أكثر من الاحصاءات الإحضار، وسوف تجد طالما هناك معرفة الجملة يبدو، فإن الجمل الإنجليزية المقابلة ستكون "المعرفة" تظهر الكلمة في هذه الطريقة، حتى من دون صيانة مصطنعة من القواميس وقواعد النحو ولكن أيضا جعل آلات فهم معنى الكلمة.

هذا المفهوم ليس جديدا، حيث اقترح أقرب ارن نسج مفهوم مماثل، ولكن ليس هناك ما يكفي من الوقت وكان جسم مواز ضعيفة للغاية وقدرة محدودة آلة حاسبة، لذلك ليس هناك تنفيذها. الحديثة الترجمة الآلية الإحصائية من أين تجد "حجر رشيد الحديث" يعني؟ في الواقع، المصدر الأكثر أهمية هو الأمم المتحدة، لأن قرارات الأمم المتحدة والإعلان سيكون إصدارات اللغات فرادى الدول الأعضاء، ولكن بخلاف ذلك، وتريد أن تجعل جسم مواز الخاصة ل الآن تترجم تكلفة الترجمة البشرية إلى معرفة أن هذه التكلفة عالية بشكل مدهش.

في السنوات العشر الماضية ، كان الجميع على دراية بترجمة Google على أساس الترجمة الآلية الإحصائية.سماع هذا ، يجب أن يكون واضحا أن نموذج الترجمة الإحصائية غير قادر على تحقيق السبب العظيم للبرج ، في المطبوعات ، تبقى الترجمة الآلية فقط في درجة "مفيدة" بدلا من "مفيدة".

الترجمة الآلية للشبكة العصبية

بحلول عام 2014 ، بشرت الترجمة الآلية في التغيير الأكثر ثورية في التاريخ - "التعلم العميق"!

الشبكات العصبية ليست جديدة ، في الواقع ، إن الاختراعات الشبكية العصبية كانت موجودة منذ أكثر من 80 عامًا ، ومع ذلك ، استمر التعلم العميق منذ أن حسن جيفري هينتون (دراسة عميقة للآلهة الثلاث الكبرى) أوجه القصور القاتلة في تحسين الشبكة العصبية في عام 2006. ظهرت العديد من النتائج مثل المعجزات بشكل متكرر في حياتنا ، ففي عام 2015 ، أدركت الأجهزة التعرف على الصور أكثر من البشر لأول مرة ؛ ففي عام 2016 ، فازت ألفا غو على الملوك الشطرنج في العالم ؛ وفي عام 2017 ، تجاوزت عملية التعرف على الكلام مفسقي البشر ؛ في عام 2018 ، يتخطى فهم القراءة للإنجليزية إلى ما وراء البشر للمرة الأولى ، وبالطبع ، بدأ هذا الحقل من الترجمة الآلية يزدهر بسبب التعلم العميق لهذا الأسمدة الفائقة.

يوشع بينغيو من إله التعلم العميق في عام 2014 ، وضع لأول مرة البنية الأساسية لتكنولوجيا التعلم العميق للترجمة الآلية ، ويستخدم بشكل أساسي شبكة عصبية متكررة قائمة على تسلسل (RNN) ، بحيث يمكن للجهاز التقاط الجمل تلقائيًا ميزة الكلمة ، والتي بدورها يمكن ترجمتها تلقائيًا إلى نتيجة ترجمة لغة أخرى ، ويظهر هذا المقال أن Google قد فازت بالكنز ، وبعد فترة وجيزة ، قدمت Google بارودًا وافرًا ومباركة عظيمة لله ، أعلنت Google رسميًا في عام 2016 كانت جميع الترجمات الآلية الإحصائية متوقفة عن الرف ، وأصبحت ترجمات أجهزة الشبكات العصبية هي التيار المطلق للترجمة الآلية الحديثة.

إن أكبر ميزة في الترجمة الآلية للشبكة العصبية من Google هي إضافة الانتباه ، وفي الحقيقة ، فإن آلية الانتباه هي أن تجتذب العيون أولاً عند محاكاة الترجمة البشرية ، ثم اختيار بعض الكلمات الأساسية لتأكيد دلالات الألفاظ. العملية (الشكل 2). بالتأكيد ، وبفضل آلية الاهتمام ، ازدادت القوة بشكل كبير ، وتزعم Google أنه في اللغات الإنجليزية - الفرنسية ، والإنجليزية - الصينية ، واللغات الإنجليزية - الغربية ، تغير معدل الخطأ. يتم تخفيض نظام الترجمة الآلية الإحصائية بنسبة 60٪.

وبالرغم من أن الشبكة العصبية يمكن أن تتعلم من المجموعة المتوازية الموجودة وأن تفهم الملامح اللغوية الخفية للجملة ، إلا أنها ليست مثالية ، حيث تنشأ المشكلة الكبرى من الكمية الكبيرة من البيانات المطلوبة وعدم فهمها كصندوق أسود ، وهذا يعني ، لا توجد طريقة لارتكاب الأخطاء ، ولكن فقط لتوفير مجموعة صحيحة لتصحيح "التعلم العميق" ، لذلك ، يمكن أن يكون لنفس نمط الجملة نتائج ترجمة مختلفة تمامًا.

فبراير 2018، ومايكروسوفت (مايكروسوفت) لديك لجعل لغة الآلة يفهم على الفور بعد مبادرات جديدة تتجاوز الإنسان. 14 مارس، أعلنت شركة مايكروسوفت للبحوث آسيا ومعهد ريدموند الباحثون أن أبحاثها وتطوير نظم الترجمة الآلية المشتركة أنباء على الاختبار المنصوص عليها في الترجمة الإنكليزية لاختبار تحديد Newstest2017، يمكن أن تصل إلى مستويات مماثلة مع الترجمة البشرية. وبطبيعة الحال، هذه الشبكة العصبية هي الترجمة الآلية من نصر عظيم، وبطبيعة الحال، لديه الكثير من الابتكار في الهندسة المعمارية، وأبرز هو إدراج تعليم المزدوج (التعلم المزدوج) وشبكة التدقيق (شبكات التداول).

التعلم المزدوج لإيجاد حل لمشكلة جسم مواز محدودة، وبشكل عام، يجب توفير عمق التعلم إلى إجابات الجهاز، وبالتالي فإن الجهاز يكون قادرا على أساس الفرق بين الترجمات والجواب تصحيح يستمر التحسن. أما بالنسبة لشبكة التدقيق تحاكي أيضا عملية الترجمة البشرية عادة الترجمة البشرية سوف نقوم به أولا ترجمة الخام، ومن ثم ضبط المحتوى الدقيق للترجمة الثانية، في الواقع، قد تجد أنه بغض النظر عن ذكاء الشبكات العصبية، سوف لا تزال في نهاية المطاف على سطح إشارة من المخلوقات الأكثر ذكاء، الذي هو الهيئة للإنسانية نحن.

لا يمكن استخدام اللغة خارج السياق

تطوير الترجمة الآلية لا يعني أن مستقبل مهنة الترجمة لن يكون هناك لشراء الطعام. وتجدر الإشارة إلى أن عرض مايكروسوفت شدد على "اختبار وضع تقارير عالمية Newstest2017 الخبر" "الإنجليزية اختبار مجموعة،" مجموعة البيانات الأداء الجيد والتنوع لن تكون قادرة على الاستفادة من علامة المساواة، والتي أيضا قد يفسر لماذا تينسنت يونيو الواضح الترجمة المعتادة كانت جيدة، ولكن لماذا هو الأداء غير دقيق في بواو في الوقت الحقيقي التفسير.

يمكن أن يقال أن الترجمة الفورية هي تتويجا لمهمة الترجمة ، بالإضافة إلى امتلاك فهم صحيح للجملة الأصلية ، يجب أن يتم تحويلها إلى لغات أخرى خلال فترة زمنية محدودة ، وتذكر أن المتحدث لن يعطيك أي وقت للترجمة ، لذا فهو يعادل التعرف على الكلام. يجب أن تتم معالجة الترجمة الآلية بشكل متزامن ، إلى جانب الضجيج على الفور ، والتعبير عن المتحدث ، وإدخال كلمات مشروطة ، وما إلى ذلك ، وكلها قد تسبب سوء التقدير من قبل الماكينة.

من وجهة نظري ، قد يتم إلقاء اللوم على ترجمة تينسنت للملك على أنه قد لا يكون العمل كافيًا ، ولا يتم إدخال الأسماء الصحيحة الرئيسية ، وهذا سيؤدي إلى "خطأ كلاسيكي" في "طريق سريع وحزام".

يمكن أيضًا رؤية فارق مثير للاهتمام في الشكل 3. لماذا يتم وضع الترجمة الآلية الغربية في غير محلها ، ولكن الترجمة الآلية في البلد الأم هي دائمًا في وضع السيطرة ، وهذا لأن اللغة لا يمكن أن توجد بدون الخروج من سيناريوهات الاستخدام البشري ، أي أننا نتعلم اللغة الصينية في كثير من الأحيان. السياق ، الذي يأتي من ثقافتنا السابقة ، يتكون من ذكريات شائعة في الماضي ، جوجل ، التي لم تقرأ شعر تانغ ، بطبيعة الحال لا يمكن أن نفهم جوهر هذه القصيدة.اللغة يمكن أن تكون الحاجز البشري الأخير في عصر الذكاء الاصطناعي ل سوف تتغير اللغات باستمرار بسبب استخدام البشر ، وهذا بديل صعب للغاية عن الآلات.

مع تقدم التكنولوجيا ، في يوم من الأيام ، ستتغير الترجمة الآلية من كونها "مفيدة" إلى "مفيدة" ثم تتطور إلى "مفيدة". ولكن كما قلت دائماً ، فإن الآلات لن تحرم الناس من عملهم. نحن البشر فقط عاطلون عن العمل ، كيف نستفيد من الذكاء الاصطناعي لنصبح أداة خاصة بك ، ونسحب نفسك من العمل الشاق ، هذا هو الموقف الصحيح للمستقبل.