AI interpreti della storia ufficiale di sviluppo

Nel 2018 Boao Forum per l'Asia, oltre al programma principale, in particolare l'introduzione di un punto caldo è la prima traduzione lingua parlata in tempo reale conferenza intelligenza artificiale. Tuttavia, non v'è stato alcun AI precedente arbitrariamente dichiarato "Lasciate che l'industria interpreti in tempo reale stiamo per affrontare la minaccia della disoccupazione ", al contrario, il risultato di gravi errori nella traduzione, e infatti gli interpreti in tempo reale impiegato sollevato, sembra che questa linea può anche mangiare il riso per un lungo periodo.

"La Bibbia Antico Testamento Genesi" descritto nel capitolo 11, dopo la grande alluvione si allontanava, questo mondo umano sono i figli di Noè, parlare la stessa lingua quando gli esseri umani hanno cominciato a collaborare, costruire chiamò Babele Torre di Babele torre. la mossa allarmato il Dio, così Dio lascia gli esseri umani in tutto il mondo ha cominciato ad avere una lingua diversa, la razza umana non era più cooperazione unita. Babel fatto piani fallirono, quando le differenze linguistiche diventano anche la più grande comunicazione umana ostacolo. forse il sangue ancora voglia di sognare di ricostruzione della torre di Babele, quindi la traduzione è diventato il centro di progetti culturali umani negli ultimi migliaia di anni di storia in continua evoluzione.

La barriera linguistica non è così facile da rompere, in particolare è necessario comprendere lo stesso concetto attraverso le lingue: per la prima volta nella storia umana, un corpora parallelo è stato prodotto da Rosetta Stone, realizzato nel 196 aC. L'antica lingua egiziana, il greco antico e i testi colloquiali locali furono usati per registrare le scritture incise del re Tolomeo dell'antico re egiziano, ed è anche una pietra miliare nella traduzione.

Traduzione automatica basata su regole

Per quanto riguarda l'origine della traduzione automatica, che risale al 1949, il ricercatore della teoria dell'informazione Warren Weave ha proposto ufficialmente il concetto di traduzione automatica: cinque anni dopo, nel 1954, l'IBM e la Georgetown University negli Stati Uniti hanno annunciato la prima macchina di traduzione al mondo. IBM-701. Era in grado di tradurre il russo in inglese, per non parlare del fatto che aveva un corpo enorme: in realtà aveva solo sei regole grammaticali e 250 parole incorporate. Ma anche così, era ancora un importante passo avanti tecnologico. A quel tempo, gli umani cominciarono a sentire che dovevano essere in grado di rompere rapidamente il muro del linguaggio.

Era possibile che Dio avesse notato qualcosa di diverso e versato un secchio di acqua fredda sul piano per la ricostruzione umana della Torre di Babele.Nel 1964, l'American Academy of Sciences istituì il Comitato consultivo per l'elaborazione automatica delle lingue (ALPAC). Nel rapporto presentato, si ritiene che la traduzione automatica non valga la pena di continuare a investire, perché questo rapporto ha causato negli Stati Uniti la cessazione quasi totale dello studio di traduzione automatica nei prossimi dieci anni.

Dalla nascita della prima macchina di traduzione IBM agli anni '80, il mainstream tecnologico a quel tempo era la traduzione automatica basata su regole: il metodo più comune è tradurre direttamente le parole in base al dizionario, anche se alcune persone hanno proposto di aggiungere regole di sintassi per correggerle. Ma ad essere onesti, i risultati si sono rivelati molto frustranti, perché sembrano stupidi, pertanto, a partire dagli anni '80, tali pratiche sono scomparse.

Perché le lingue non possono applicare le regole? Perché le lingue sono sistemi estremamente complessi e vaghi, dall'ambiguità delle parole alla retorica, è impossibile esaurire tutte le regole. Ma, interessante, molte recenti innovazioni nel linguaggio naturale La compagnia, che sta ancora cercando di risolvere la semantica cinese con regole esaustive, ma questa idea finirà sicuramente nel fallimento.

Farò un esempio qui per spiegare perché le regole non sono fattibili, per non parlare della complessità della traduzione in due lingue: solo dal punto di vista cinese, il concetto di consegna espressa è veloce. A quanti tipi di insegnamenti puoi pensare? 10 tipi o 100 tipi? Secondo le statistiche del linguaggio naturale che abbiamo fatto prima, ci possono essere 3.600 tipi di insegnamenti in totale, e questo numero dovrebbe comunque aumentare con il tempo. Una frase con un concetto così semplice può essere così Per un complesso sistema di regole, se si usano le traduzioni, temo che la quantità di regole sia un numero astronomico sorprendente, pertanto l'approccio basato sulle regole alla traduzione automatica è diventato un ricordo del passato.

Traduzione automatica basata sull'istanza

Nel mondo della traduzione automatica nella bassa marea, c'è un paese per la traduzione automatica ha una forte ossessione, e questo è il Giappone. Giapponese inglese poveri universalmente noto, e quindi della macchina di traduzione non v'è una forte domanda di rigidità.

Il professor Nagao Shinretsu dell'Università di Kyoto in Giappone ha proposto una traduzione automatica basata su esempi, ovvero smettere di pensare di lasciare tradurre le macchine da zero. Dobbiamo solo memorizzare abbastanza frasi di esempio. Anche se incontriamo frasi che non corrispondono perfettamente, Puoi anche confrontare le frasi di esempio semplicemente sostituendo la traduzione di parole diverse Questo tipo di pensiero ingenuo non è certamente molto meglio della traduzione automatica basata su regole, quindi non ha causato un'ondata, ma presto, la speranza della ricostruzione umana della Torre di Babele Sembra di vedere di nuovo l'alba.

Traduzione automatica statistica

La detonazione del boom della traduzione automatica statistica è ancora IBM: nel documento "Teoria matematica della traduzione automatica" pubblicato nel 1993, sono stati proposti cinque modelli statistici basati su parole, vale a dire "Modello IBM 1" su "Modello 5 IBM".

Idee modello statistico è tradotto come una questione di probabilità. In linea di principio è la necessità di utilizzare il corpus paralleli, e quindi letteralmente statistiche. Ad esempio, anche se la macchina non sapeva che cosa "conoscenza" della lingua inglese è, ma dopo la maggior parte delle statistiche corpus, troverete Finché c'è una frase con conoscenza, la parola "Conoscenza" appare nella corrispondente frase di esempio inglese, in questo modo, anche se le regole del dizionario e della grammatica non vengono mantenute manualmente, la macchina può capire il significato della parola.

Questo concetto non è nuovo, perché Warren Weave ha proposto per la prima volta un concetto simile, ma in quel momento non c'era abbastanza corpo parallelo e la capacità di limitare la calcolatrice in quel momento era troppo debole e quindi non messa in pratica. dove trovare "moderna stele di Rosetta" significa? infatti, la fonte più importante sono le Nazioni Unite, perché le risoluzioni delle Nazioni Unite e l'annuncio avranno versioni linguistiche dei singoli Stati membri, ma a parte questo, si vuole rendere il proprio corpus parallelo a Ora il costo della traduzione umana si traduce nel sapere che questo costo è sorprendentemente alto.

Negli ultimi dieci anni, tutti sanno che la traduzione di Google si basa sulla traduzione automatica statistica. A questo punto, dovrebbe essere chiaro che il modello di traduzione statistica non è in grado di realizzare la grande causa della torre. Il grado di "utile" piuttosto che "utile".

Traduzione automatica della rete neurale

Entro il 2014, la traduzione automatica ha inaugurato il cambiamento più rivoluzionario della storia: "deep learning"!

Le reti neurali non sono nuove, infatti le invenzioni di reti neurali sono in circolazione da oltre 80 anni, ma l'apprendimento profondo è continuato da quando Geoffrey Hinton (studio approfondito dei tre grandi dei) ha migliorato le fatali carenze dell'ottimizzazione della rete neurale nel 2006. Vari risultati miracolosi sono comparsi spesso nelle nostre vite: nel 2015, le macchine hanno realizzato il riconoscimento dell'immagine al di là degli umani per la prima volta, nel 2016, Alpha Go ha battuto i re del mondo degli scacchi, nel 2017 il riconoscimento vocale ha superato gli stenografi umani; La comprensione della lingua inglese della macchina va per la prima volta oltre gli umani. Naturalmente, anche questo campo di traduzione automatica ha iniziato a prosperare grazie all'apprendimento profondo di questo super fertilizzante.

Yoshua Bengio studio approfondito dei tre dèi nel documento 2014, per la prima volta stabilito l'architettura di base della profondità di apprendimento tecnologie per la traduzione automatica. Egli si basa principalmente sulla recidiva sequenza di rete neurale (RNN), in modo che la macchina può catturare automaticamente tra le frasi funzione di parola, e quindi scritti automaticamente in un'altra lingua di traduzione. Questo articolo uno, Google tesoro. Molto rapidamente, adeguato apporto di polvere da sparo sotto la benedizione di Dio, così come di grandi dimensioni in Google, Google ha annunciato ufficialmente nel 2016 nel complesso telaio traduzione automatica statistica, l'host di rete neurale traduzione automatica, per diventare il mainstream assoluto della traduzione automatica moderna.

La più grande caratteristica della traduzione automatica della rete neurale di Google è l'aggiunta di Attenzione: infatti, il meccanismo dell'attenzione consiste nello spazzare gli occhi prima di simulare la traduzione umana, e quindi selezionare alcune parole chiave per confermare la semantica. Processo (figura 2): certo, con la benedizione del meccanismo di attenzione, la potenza è aumentata notevolmente, Google afferma che nelle lingue inglese-francese, inglese-cinese e inglese-occidentale, il tasso di errore è cambiato. Il sistema statistico di traduzione automatica è ridotto del 60%.

Sebbene la rete neurale possa imparare dal corpus parallelo esistente e comprendere le sottili caratteristiche linguistiche della frase, non è perfetta: il problema più grande deriva dalla grande quantità di dati necessari e dalla sua incomprensibilità come una scatola nera. Non c'è modo di commettere errori, ma solo di fornire un corpus più corretto per correggere "l'apprendimento profondo", pertanto lo stesso modello di frase può avere risultati di traduzione molto diversi.

Febbraio 2018, Microsoft (Microsoft) deve fare il linguaggio macchina capito subito dopo le nuove iniziative al di là umana. 14 marzo Microsoft Research Asia e Redmond Institute ricercatori annunciato che la sua ricerca e sviluppo di sistemi di traduzione automatica in comune Notizie sul set di prova nella traduzione inglese del test set Newstest2017, può raggiungere livelli paragonabili con la traduzione umana. Naturalmente, questa rete neurale è una traduzione automatica di una grande vittoria, ovviamente, ha un sacco di innovazione in architettura, il più noto dei e 'l'inserimento della doppia apprendimento (dual learning) e la rete di controllo (reti di deliberazione).

apprendimento duale per risolvere il problema della limitata corpus parallelo, in generale, la profondità di apprendimento deve essere fornita alle risposte della macchina, quindi la macchina potrà basa sulla differenza tra le definizioni e risposta corretta sostenuta miglioramento. Quanto rete controllo anche mimare il processo di traduzione umana solitamente traduzione umana farà prima una traduzione approssimativa, e quindi regolare il contenuto preciso della seconda traduzione, infatti, si potrebbe scoprire che non importa intelligente le reti neurali, sarà ancora finire sulla superficie di riferimento delle creature più intelligenti, che è il corpo noi, come esseri umani.

Il linguaggio non può sfuggire il contesto d'uso

Lo sviluppo della traduzione automatica non significa che le persone nel settore della traduzione non avranno cibo in futuro.Va notato che la pubblicazione di Microsoft ha enfatizzato il "set di test di traduzione cinese-inglese" del "Universal News Report Set Set Newstest 2017". Una buona performance potrebbe non essere all'altezza dell'universalità, che può anche spiegare perché il traduttore di Tencent Jun Mingming ha una buona reputazione, ma perché l'interpretazione in tempo reale a Boao è stata imprecisa.

Si può dire che l'interpretazione in tempo reale sia il culmine di un compito di traduzione, oltre ad avere una corretta comprensione dell'ascolto della frase originale, deve essere convertito in altre lingue entro un tempo limitato e ricordare che l'oratore non darà alcun tempo per la traduzione, quindi equivale al riconoscimento vocale. Traduzione automatica deve essere sincronizzato, più in loco rumore, espressioni altoparlanti, il tono delle parole e interiezioni fattori confondenti così, rischiano di provocare aborto spontaneo della giustizia della macchina.

Dal mio punto di vista, la traduzione del re da parte di Tencent può essere incolpata sul fatto che potrebbe non essere abbastanza lavoro, e non vengono inseriti i nomi propri della chiave, il che si tradurrà in un "errore classico" di "autostrada e cintura".

Una differenza interessante si può vedere anche in Fig. 3. Perché la traduzione automatica occidentale è malriposta, ma la traduzione automatica nel paese d'origine è quasi sempre sotto controllo? Questo perché la lingua non può esistere senza allontanarsi dagli scenari di utilizzo umano. Il contesto, che proviene dalla nostra cultura passata, consiste in ricordi che erano comuni nel passato.Google, che non ha letto la poesia Tang, naturalmente non può capire l'essenza di questo poema.La lingua può essere l'ultima barriera umana nell'era dell'intelligenza artificiale perché Le lingue cambieranno costantemente a causa dell'uso degli esseri umani, un sostituto molto difficile per le macchine.

L'avanzare della tecnologia, un giorno, traduzione automatica cambierà da "degradata" a "utile", e poi si è evoluta a "facile". Ma, come il mio argomento è sempre stato, la macchina non sarà derubato del lavoro umano, consentire infatti, umano disoccupati solo il nostro. come fare buon uso di intelligenza artificiale per diventare i propri strumenti, a ritirarsi dalla noia noioso di lavoro, questo è la postura corretta per affrontare il futuro.

2016 GoodChinaBrand | ICP: 12011751 | China Exports