تاریخچه توسعه ای از مترجمان AI@goodchinabrand.com

در مجمع Boao برای آسیا در سال 2018، بدون توجه به دستور کار اصلی، نقطه عطفی چشمگیر، معرفی هوش مصنوعی برای ترجمه همزمان گفتاری در زمان واقعی برای اولین بار بود. با این وجود، هوش مصنوعی در «صنعت فوری صنعت سریع در زمان واقعی» ظاهر نشد. در مقابل تهدید بیکاری قریب الوقوع، برعکس، نتیجه ترجمه اشتباهات جدی، در واقع مترجمان واقعی را تسکین می دهد. به نظر می رسد که این خط هنوز هم می تواند برای مدت طولانی خورده شود.

در فصل 11 کتاب مقدس، عهد عتیق، پیدایش، پس از سیلاب بزرگ از بین رفت، مردم این دنیا نسل نوح بودند و زبان مشابهی داشتند. در آن زمان، انسان شروع به همکاری و ساختن یک برج بابل کرد. برج های برج. این حرکت به خدا هشدار داد، به طوری که خداوند انسان ها را در جهان شروع به زبان های مختلف کرد و از آنجا که انسان ها قادر به همکاری نیستند، طرح ساخت برج آسمان به شکست افتاد و تفاوت های زبان بزرگترین موانع. شاید در خون برای بازسازی برج بابل وجود داشته باشد. بنابراین ترجمه به یک پروژه کلیدی فرهنگی برای تکامل مداوم بشریت در طول هزار سال گذشته تبدیل شده است.

مانع زبانی برای شکستن آن بسیار آسان نیست. به ویژه، لازم است که مفهوم همان مفهوم را در زبان ها درک کنیم. برای اولین بار در تاریخ بشر، یک سلسله موازی متقابل زبان توسط Rosetta Stone ساخته شده در 196 قبل از میلاد ساخته شده است. زبان های باستانی مصر، یونان باستان و متون محاوره ای محلی برای ضبط مقالات حک شده پادشاه پادشاه بطلمیوس پادشاه باستان مصر استفاده شده است. این یک نقطه عطف در ترجمه است.

نسخه ماشین بر اساس قانون

به گفته وارن ووف، پژوهشگر تئوری اطلاعات، مفهوم ترجمه ماشین را به طور رسمی پیشنهاد کرد. پنج سال بعد، در سال 1954، IBM و دانشگاه جورج تاون در ایالات متحده اولین دستگاه ترجمه در جهان را اعلام کردند. IBM-701 توانست روسیه را به زبان انگلیسی ترجمه کند، به جز اینکه یک بدن بزرگ داشت. در واقع تنها شش دستورالعمل گرامری و 250 کلمه ساخته شده بود. اما حتی این هم یک پیشرفت تکنیکی بود. در آن زمان انسان شروع به احساس کرد که باید بتواند دیوار زبان را سریع شکست دهد.

ممکن بود که خدا چیز دیگری را متوجه شده بود و یک سطل آب سرد را در برنامه بازسازی انسانی برج بابل ریخت. در سال 1964، آکادمی علوم آمریکایی کمیته مشورتی کمکی پردازش اتوماتیک (ALPAC) را تاسیس کرد. دو سال بعد در کمیته در گزارش ارائه شده، در نظر گرفته شده است که ترجمه ماشین برای ادامه سرمایه گذاری ارزش ندارد، زیرا این گزارش باعث شد تا ایالات متحده در ده سال آتی تقریبا تمام مطالعات ترجمه دستگاه را متوقف کند.

از زمان تولد نخستین دستگاه ترجمه ی IBM به دهه 1980، جریان اصلی تکنولوژی در آن زمان ترجمه ی ماشین بر اساس قانون بود. شایع ترین روش ترجمه مستقیم کلمات به ترتیب فرهنگ لغت است، اگرچه بعضی از افراد بعدا پیشنهاد دادند قوانین نحوی را برای اصلاح آنها اضافه کنند. اما برای صادق بودن، نتایج بسیار ناخوشایند بود، زیرا به نظر می رسد احمقانه است. بنابراین، تا دهه 1980 چنین شیوه هایی ناپدید شدند.

چرا زبانها قوانین را اعمال می کنند؟ از آنجا که زبان ها بسیار پیچیده و مبهم هستند، از ابهام در لغت به لفاظی ها، تمام قوانین ممنوع است. اما جالب توجه است، بسیاری از نوآوری های اخیر در زبان طبیعی این شرکت هنوز سعی دارد معانی چینی را با قواعد جامع حل کند اما این ایده قطعا به شکست منجر خواهد شد.

من نمونه ای برای نشان دادن این که چرا قوانین غیرقابل اجتناب هستند، نمی آورم. پیچیدگی ترجمه را در دو زبان ذکر نکنید. فقط از منظر چینی، مفهوم تحویل سریع سریع است. چگونه بسیاری از انواع تعالیم را می توان به آن فکر کرد؟ 10 نوع یا 100 نوع؟ با توجه به آمار زیستی طبیعی ما قبلا انجام داده ایم، 3600 نوع از تعالیم در مجموع وجود دارد و این تعداد در طول زمان باید افزایش یابد. جمله ای با چنین مفهومی ساده می تواند باشد برای یک نظام پیچیده قوانین، اگر از ترجمه استفاده می کنید، می ترسم مقدار قوانین یک عدد نجومی شگفت آور باشد. بنابراین، ایده ترجمه ترجمه ماشین بر اساس قانون، دیروز تبدیل به گل زرد می شود.

نسخه ماشین بر اساس نمونه

در حالی که تمام جهان به مرحله پائین ترجمه دستگاه رفته است، کشوری است که وسواس زیادی برای ترجمه ماشین دارد. این ژاپن است. ژاپنی ها مهارت کم زبان انگلیسی دارند و به همین دلیل تقاضای قوی برای ترجمه ماشین را در اختیار دارند.

دانشگاه کیوتو استاد ماکوتو Nagao مبتنی ترجمه ماشینی است برای متوقف کردن ماشین از ابتدا و می خواهید برای ترجمه، تا زمانی که ما به تعداد کافی از جمله نگه دارید، حتی در مواجهه کند دقیقا مطابقت با حکم نیست، ما همچنین می تواند به جملات در مقایسه، ترجمه است که همان زمانی که جایگزینی کلمه می تواند نمی شود. این البته ساده و بی تکلف از ترجمه ماشینی مبتنی بر قواعد نیست که چگونه بسیاری باهوش، آن را ناشی از مشکل نمی شود. اما قبل از اینکه طولانی، انسان امید به بازسازی برج بابل به نظر می رسد به طلوع دوباره ببینید.

بر اساس ترجمه ماشینی آماری

منفجر آماری رونق ترجمه ماشینی یا آی بی ام، در "ترجمه ماشینی ریاضی نظریه" کاغذ صادر شده در 1993 پیشنهاد یک مدل آماری متشکل از پنج واحد و در یک کلام، به نام "آی بی ام مدل 1" به "5 مدل IBM."

ایده های مدل آماری است به عنوان یک سوال از احتمالات ترجمه شده است. در اصل نیاز به استفاده از مجموعه موازی است، و پس از آن به معنای واقعی کلمه آمار. به عنوان مثال، اگر چه دستگاه نمی دانست چه «علم» به زبان انگلیسی است، اما پس از ترین آمار لاشه، شما را پیدا خواهد کرد تا زمانی که دانش از جمله وجود دارد به نظر می رسد، مربوط به جملات انگلیسی خواهد بود "دانش" کلمه به نظر می رسد. در این راه، حتی بدون تعمیر و نگهداری مصنوعی از فرهنگ و قواعد دستور زبان، بلکه ماشین آلات درک معنای کلمه.

این مفهوم است که جدید، از اولین وارن بافت یک مفهوم مشابه ارائه شده، اما وجود ندارد و زمان کافی لاشه موازی بیش از حد ضعیف بود و ماشین حساب ظرفیت محدود است، بنابراین هیچ اجرا شده است. مدرن ترجمه ماشینی آماری از وجود دارد که در آن برای پیدا کردن "سنگ مدرن روزتا" چیست؟ در واقع، مهم ترین منبع سازمان ملل متحد است، چرا که قطعنامه های سازمان ملل و اعلام خواهد نسخه های زبان کشورهای عضو فردی، اما دیگر از آن، شما می خواهید مطمئن لاشه موازی خود را به در حال حاضر هزینه ترجمه انسانی در شرایط از آنچه آن هزینه خواهد شد به این شگفت انگیز است.

در ده سال گذشته، هر کس با ترجمه گوگل آشنا است بر مبنای ترجمه ماشین آماری است.شما باید این را بفهمید که مدل ترجمه آماری نمیتواند علت بزرگی از برج را انجام دهد. درجه "مفید" و نه "مفید".

ترجمه دستگاه شبکه عصبی

تا سال 2014، ترجمه ماشین به تغییر انقلابی ترین در تاریخ تبدیل شد - "یادگیری عمیق"!

شبکه های عصبی است که جدید نیست، در واقع شبکه های عصبی اختراع 80 سال پیش بوده است، اما از آنجایی که در سال 2006 جفری هینتون (اولین مطالعه سه عمق زیادی از خدا) بهبود شبکه عصبی بهینه سازی نقص کشنده است خیلی آهسته، یادگیری عمیق ادامه خواهد داد 2017، بیش از القلم تشخیص صدا انسان؛ همراه با انواع دستاوردهای معجزه آسا اغلب در زندگی ما ظاهر در سال 2015، دستگاه برای اولین بار فراتر از به رسمیت شناختن تصویر انسان ؛. 2016، آلفا برو قهرمان شطرنج جهان ضرب و شتم 2018، دستگاه خواندن انگلیسی برای اولین بار فراتر از درک انسان است. البته، ترجمه ماشینی را در این زمینه بلکه به دلیل عمق و شروع به یادگیری این شکوفایی کود فوق العاده.

Yoshua Bengio مطالعه عمق از سه خدای در مقاله سال 2014، برای اولین بار پایه معماری از عمق از فن آوری های یادگیری برای ماشین ترجمه شد. او است که عمدتا در عود توالی شبکه عصبی (RNN) بر اساس، به طوری که دستگاه به طور خودکار می تواند بین جملات گرفتن ویژگی کلمه، و سپس به طور خودکار به ترجمه به زبان دیگری نوشته شده است. این مقاله یکی، گنج گوگل. خیلی به سرعت، عرضه کافی باروت تحت نعمت خدا را به عنوان بزرگ در گوگل، گوگل رسما در سال 2016 اعلام کرد در تمام آمار قاب ترجمه ماشینی، میزبان شبکه ترجمه ماشینی عصبی، برای تبدیل شدن به جریان اصلی مطلق ترجمه ماشینی مدرن است.

بزرگترین ویژگی ترجمه ماشین ماشین شبکه عصبی Google این است که توجه داشته باشید. در واقع، مکانیسم توجه به ابتدایی است که شبیه سازی ترجمه انسان را از بین می برد و سپس چند واژه کلیدی را برای تأیید معانی آن انتخاب می کند. فرآیند (شکل 2) به اندازه کافی خوب است، با توجه به مکانیزم نعمت، قدرت به میزان قابل توجهی افزایش یافته است. گوگل ادعا می کند که در زبان های انگلیسی، فرانسوی، انگلیسی، چینی و زبان انگلیسی، میزان خطا تغییر کرده است. سیستم ترجمه آماری دستگاه 60٪ کاهش می یابد.

اگر چه شبکه عصبی می تواند از ساختار موازی موجود یاد بگیرد و ویژگی های ظریف زبان زایی را درک کند، اما کامل نیست. بزرگترین مشکل ناشی از مقدار زیادی اطلاعات مورد نیاز و عدم پذیرش آن به عنوان یک جعبه سیاه است. هیچ راهی برای اشتباه کردن وجود ندارد، اما فقط برای ارائه صحیح تربیت برای اصلاح "یادگیری عمیق" وجود دارد. بنابراین، همان الگوی حکم می تواند نتایج ترجمه های بسیار متفاوت داشته باشد.

فوریه 2018، مایکروسافت (مایکروسافت) را به زبان ماشین را بلافاصله پس از طرح های جدید فراتر از انسان درک مارس 14، محققان در موسسه ردموند مایکروسافت پژوهش آسیا و اعلام کرد که تحقیق و توسعه خود از سیستم های ترجمه ماشینی مشترک اخبار در آزمون را در ترجمه انگلیسی از مجموعه آزمون Newstest2017، می تواند سطح قابل مقایسه با ترجمه انسانی برسد. به طور طبیعی، این شبکه عصبی یک ترجمه ماشینی از یک پیروزی بزرگ است، البته، تا به بسیاری از نوآوری در معماری، قابل توجه ترین این با شبکه های یادگیری و گفتگو دوگانه پیوسته است.

یادگیری دو برای حل این مشکل از لاشه موازی محدود، به طور کلی، عمق یادگیری باید به پاسخ دستگاه ارائه می شود، به طوری که ماشین به در تفاوت بین ترجمه خود را بر اساس و پاسخ اصلاح پایدار بهبود قادر خواهد بود که برای شبکه بررسی همچنین فرایند ترجمه انسانی تقلید معمولا انسان ترجمه برای اولین بار انجام خواهد داد ترجمه خشن، و سپس تنظیم محتوای دقیق از دوم ترجمه، در واقع، شما ممکن است دریابید که هیچ شبکه های عصبی ماده هوشمند، هنوز هم به پایان خواهد رسید در سطح مرجع از موجودات باهوش ترین، است که در آن بدن ما به عنوان انسان.

زبان می تواند زمینه استفاده فرار نیست

توسعه ترجمه ماشینی این معنا نیست که آینده حرفه ترجمه خواهد شد بدون غذا برای خوردن دارم. لازم به ذکر است که ارائه مایکروسافت با تاکید بر "مجموعه آزمون گزارش جهانی Newstest2017 اخبار" از "انگلیسی ترجمه مجموعه آزمون،" مجموعه داده عملکرد خوب و تطبیق پذیری است قادر به قرعه کشی در از علامت مساوی، که ممکن است توضیح دهد که چرا Tencent به ژوئن به وضوح معمول ترجمه خوب بود، اما چرا عملکرد نادرست در Boao تفسیر در زمان واقعی است.

زمان واقعی تفسیر ترجمه می توان گفت نقطه اوج کار این است، ما باید درک صحیح از دادرسی حکم اصلی، بلکه تبدیل برای مدت زمان محدود برای زبان های دیگر است. و آیا سخنرانان را فراموش نکنید خواهد هر زمان برای ترجمه، تشخیص صدا و بنابراین برابر صبر نمی دهد ترجمه ماشینی باید هماهنگ شود، به علاوه در محل سر و صدا، عبارت بلندگو، تن از اصوات کلمه و عوامل مداخله گر، به احتمال زیاد منجر به سقط جنین و عدالت از ماشین است.

به نظر من، ژوئن ترجمه Tencent به، می توان از نقاط متهم ممکن است فقط کار سخت به اندازه کافی نیست، ما اسم مناسب ورود کلیدی، که خواهد شد "یک بزرگراه و کمربند" اتفاق می افتد قرار داده است "اشتباه کلاسیک است."

همچنین می توانید از شکل 3 دیده می شود تفاوت جالب توجه، چرا غرب ترجمه ماشینی به طرز کاملا آشکاری اشتباه، ترجمه ماشینی بود، اما این کشور است که تقریبا قادر به استاد قصد آن است زیرا زبان انسان نمی تواند طلاق حالات استفاده وجود داشته باشد که ما اغلب یادگیری زبان تاکید بر بافت (بافت)، که از فرهنگ گذشته ما می آید، وجود دارد خاطرات گذشته مطرح شده است. تنگ بود گوگل به طور طبیعی به عنوان خوانده شده نمی تواند ماهیت این شعر را درک کند. موانع زبان خواهد بود آخرین دوره از هوش مصنوعی انسان است، چرا زبان ممکن است تغییر به دلیل استفاده از انسان به طور مداوم، دشوار است برای دستگاه جایگزین مناسب است.

با پیشرفت فن آوری، یک روز، ترجمه و ماشین آلات از "تخریب" را به "مفید" و سپس به "آسان است." تکامل یافته اما به عنوان استدلال من همیشه این بوده است، دستگاه از کار بشر به سرقت نمی شود، اجازه می دهد تغییر خواهد کرد در واقع، انسان بیکار تنها خود ما. چگونه به استفاده مناسب از هوش مصنوعی برای تبدیل شدن به ابزار خود را، خود را از خستگی خسته کننده از کار برداشت، این وضعیت صحیح به چهره آینده است.