बुद्धिमान के लिए मानसिक मंदता से | प्रकाश ध्वनि पहचान 100 साल बिताए

कुछ समय पहले, चीनी संस्करण Bixby ओपन बीटा, हालांकि यह नहीं है Bixby पहली रिलीज की, लेकिन इसका मतलब है कि नई आवाज विशाल हमारे परीक्षणों में पाया चीनी बाजार में प्रवेश करने लगे, Bixby एक अच्छी मान्यता दर प्राप्त करें, आप वॉयस अनलॉक, वॉयस टेक्स्ट रूपांतरण प्राप्त कर सकते हैं, और उपयोगकर्ता फ़ोन पाठ संदेश, सॉफ़्टवेयर नियंत्रण, तृतीय-पक्ष कंटेंट एक्सेस और अन्य ऑपरेशन के लिए कॉल कर सकते हैं। एक मायने में, फोन मानव आवाज की समझ हासिल की है

मानसिक मंदता से लेकर 100 वर्षों तक बुद्धिमान प्रकाश-से-वाक् पहचान की गई

जब हम विज्ञान कथा फिल्मों में देख मानवता के साथ कृत्रिम बुद्धि कर सकते हैं बातचीत लेकिन यह भी बहुत उच्च तकनीक, वास्तव में, आवाज सहायक पहले से ही चुपचाप हमारे जीवन में है, ताकि जब आप अब देखना अच्छा आवाज उत्पादों नहीं है था अपरिचित होगा, लेकिन हममें से अधिकतर इंप्रेशन में वॉइस सहायक अब भी एक 'मानसिक रूप से विकलांग' अस्तित्व है, जो वास्तव में इसे अस्वीकार नहीं करता है क्योंकि मशीन बुद्धिमान नहीं है, यह एक इंसान की तरह नहीं सोच सकता है या इसके पास नहीं है पर्याप्त यह बहुत बड़ा प्रणाली के बारे में सोच सकते हैं। लेकिन समान रूप से नकारा नहीं जा सकता भाषण मान्यता कृत्रिम बुद्धि पहले से ही एक काफी बड़े पैमाने है।

भाषण मान्यता महान सुविधा लाया गया है

एक बहुत ही आम उदाहरण के लिए, सबसे नेटवर्क टीवी अब आवाज खोज समारोह, महान सुविधा लाया गया है बैटरी अभी भी एक रिमोट कंट्रोल इनपुट डिवाइस है, क्योंकि टीवी का उपयोग करने के लिए है जो का समर्थन करता है, यह कीबोर्ड इनपुट दक्षता के साथ प्रतिस्पर्धा नहीं कर सकते, लेकिन समर्थन करता है आवाज, इतने लंबे समय के इनपुट आवाज टीवी के लिए आज्ञा देता है, तब तक आप इंटरैक्टिव, बहुत सुविधाजनक पूरा कर सकते हैं। इसके अलावा, इंटरैक्टिव आवाज की पहचान भी अंधा के उपकरणों के लिए एक वरदान है। अपनी भूमिका की अनदेखी नहीं की जानी चाहिए।

फोन आवाज सहायक (नेटवर्क से चित्र)

मेरा मानना है कि वहाँ भाषण मान्यता पाठकों पर चिंता का एक बहुत कुछ है इस सवाल नहीं हैं :? भाई, आप ऊब पैदा मजाक सिरी दो खींचो, घर पर स्मार्ट स्पीकर हैं, सामान्य आवाज सहायक, वास्तव में आप ज़ुआंहू के बारे में कैसे बात करते हैं? और स्मार्ट स्पीकर्स की कीमत महंगी नहीं है, कितना हाई-टेक इतना सस्ता होगा? इसके अलावा उल्लेख नहीं करने के लिए, यह वास्तव में एक आवाज सहायक बनाने के लिए एक छोटी परियोजना नहीं है, और आवाज सहायकों द्वारा अक्सर आना मुश्किल होता है, कम से कम जब आप अपनी आवाज़ को निर्देश देते हैं, IME विक्रेताओं आपसे शुल्क नहीं लेते हैं, अतः मजबूत धन के बिना इसे छड़ी करना कठिन है दिन का राजस्व

भाषण मान्यता कुछ बेस्वाद है (नेटवर्क से चित्र)

अब हम आवाज सहायक प्रचार के निर्माता को देखने जा रहे हैं, ये कह रहे हैं कि हमारी सटीकता कुछ प्रतिशत तक पहुंच गई है। अब के लिए, सटीकता की दर 90%उपरोक्त बहुत अच्छा है। यद्यपि हमारे पास इतनी सटीकता की उच्च दर है, लेकिन हम अभी भी बेस्वाद आवाज सहायकों में से कुछ महसूस करते हैं, जो कि भाषा की जटिलता है, तीसरे पक्ष के इंटरफेस का वर्तमान बुखार स्कूल की अखंडता के बीच एक महान रिश्ता है, हम आवाज मान्यता सिद्धांत की प्राप्ति के बारे में और साथ ही यथास्थिति और आवाज पहचान के भविष्य के विकास के बारे में बात करने के लिए, कल्पना करें कि जब कृत्रिम बुद्धि दुनिया पर शासन करेगी।

यह आलेख मूल लेख के अंतर्गत आता है, अगर पुनर्मुद्रित किया गया है, तो कृपया स्रोत का संकेत दें: बौद्धिक मंदता से लेकर बुद्धिमान प्रकाश तक और आवाज मान्यता से 100 साल बाद http://mobile.zol.com.cn/665/6656792.html

सिद्धांत प्राप्त करने के लिए वाक् पहचान: डेटाबेस

सारांश में, आवाज की पहचान सिद्धांत को समझने के लिए मुश्किल नहीं है, एक ही बड़े चेहरे और फिंगरप्रिंट मान्यता सिद्धांत: लक्ष्य डिवाइस एक आवाज एकत्र करने के लिए, और फिर लक्ष्य आवाज विशेषता जानकारी प्राप्त करने के आवाज प्रसंस्करण की एक श्रृंखला एकत्र, और फिर सुविधा देना डेटाबेस समानता खोज डेटा तुलना में सहेजी गई जानकारी, उच्च स्कोर मान्यता परिणाम तो अन्य प्रणालियों पर पहुंचकर वाक् पहचान डिवाइस पूरा करने के लिए इस्तेमाल किया जाता है।

एक संक्षिप्त पहचान प्रक्रिया

यदि आपको भाषण मान्यता में कोई दिलचस्पी नहीं है, तो सामान्य सिद्धांत का पता होना पर्याप्त है, वास्तव में, भाषण मान्यता की प्रक्रिया बहुत जटिल है। सबसे आम कारण यह है कि भाषण की जटिलता। इनपुट फिंगरप्रिंट सूचना के रूप में लंबे समय तक फ़िंगरप्रिंट पहचान पहचान को पूरा करने के लिए मिलान की जानकारी में संग्रहित डेटाबेस, डेटाबेस में केवल कुछ फ़िंगरप्रिंट जानकारी होती है, लेकिन आवाज पूरी तरह से अलग है।

"कांग्शी डिक्शनरी" (चीनी प्राचीन वस्तुएं नेटवर्क से उद्धृत)

कांग्शी शब्दकोश में चीनी अक्षर हैं 47035छह सालों तक तीस से अधिक प्रसिद्ध विद्वानों द्वारा संकलित किया गया था, जबकि चीनी केवल एक अलग चीनी चरित्र नहीं है, बल्कि भाषा में वृद्धि और गिरावट भी होती है, भावना की भावना और अलग-अलग शब्दों की एक अलग समझ होती है। उसी समय, नारंगी बोलना नहीं है, कई बोलियाँ हैं, आप एक आदर्श भाषा डेटाबेस बनाना चाहते हैं कि कितना मुश्किल कल्पना कर सकता है .चीन की जटिलता Bixby चीनी संस्करण बाद में कारण के अंग्रेजी संस्करण की तुलना में

उच्च-सटीकता भाषण मान्यता को एक विशाल क्लाउड-आधारित डेटाबेस (नेटवर्क से छवियों) के बिना अलग नहीं किया जा सकता है

कारण एक विशाल डेटाबेस मुश्किल भाषा मोबाइल टर्मिनल में जगह है, जो लगभग सभी मोबाइल फोन के आवाज नेटवर्किंग जरूरतों सहायक है जब वर्तमान विकास के लिए ध्वनि पहचान का उपयोग कर अपने ऑफ़लाइन संस्करण के बिना नहीं है, लेकिन हम आसानी से ऑफ़लाइन सटीकता ज्यादा है पा सकते हैं ऑनलाइन संस्करण की तुलना में कम। इसके अलावा, हमने अभी उल्लेख किया है कि कई आवाज निर्माताओं ने दावा किया है कि सटीकता की दर तक पहुंच गई है 90%इन सबसे ऊपर, यह बहुत बड़ा होने के लिए कहा जा सकता है, कोई अतिशयोक्ति कहना है कि इस समय हर उन्नयन 1सटीकता का प्रतिशत, एक गुणात्मक छलांग है। यह पूरा करने के लिए इस तरह के सटीकता स्वयं सीखने प्रणाली निष्कर्षण एल्गोरिदम के एक उच्च दक्षता की पहचान करने और राशि न केवल बहुत व्यापक डेटाबेस है।

बेशक, इस डेटा हम देखने की द्वंद्वात्मक बात करने के लिए चाहते हैं, तो कहावत है, एक सौ अलग अलग शब्द चीनी भाषा और गहरा के रूप में वर्णित किया जा सकता है कि, निर्माताओं देने के लिए और डेटा की सटीकता की जांच व्यापक है के लिए मुश्किल है, इसलिए कुछ उपयोगकर्ताओं वाक् पहचान का उपयोग करने के यह भी पाया गया कि यह मानसिक रूप से मंद 'है, यह सामान्य कार्य है।

यह लेख मूल लेख के अंतर्गत आता है, पुनर्मुद्रण चाहिए, स्त्रोत की ओर संकेत करें: मंद बुद्धि से बुद्धिमान ऑप्टिकल खर्च 100 साल के भाषण मान्यता http://mobile.zol.com.cn/665/6656792.html को

http://mobile.zol.com.cn/665/6657840.html mobile.zol.com.cn सच Zhongguancun ऑनलाइन http://mobile.zol.com.cn/665/6656792.html रिपोर्ट 1512 वाक् पहचान के सिद्धांत: डेटाबेस सारांश, आवाज की पहचान सिद्धांत को समझने के लिए, एक ही बड़े चेहरे और फिंगरप्रिंट मान्यता सिद्धांत मुश्किल नहीं है: लक्ष्य डिवाइस एक आवाज एकत्र करने के लिए, और फिर आवाज प्रसंस्करण की एक श्रृंखला एकत्र लक्ष्य प्राप्त करने के लिए आवाज फ़ीचर सूचना, और फिर सुविधा की जानकारी और समानता खोज और तुलना के लिए डेटाबेस संग्रहीत डेटा, सर्वोच्च स्कोर मान्यता परिणाम है।

सिद्धांत प्राप्त करने के लिए वाक् पहचान: एल्गोरिदम और आत्म-शिक्षा

हम सिर्फ निकालने और स्वयं सीखने प्रणाली, जहां हम केवल अपने काम की प्रक्रिया में लग सकता है के लिए मान्यता एल्गोरिथ्म का उल्लेख किया है: सबसे पहले, आवाज एकत्र pretreatment लक्षित करने के लिए भाषण मान्यता प्रणाली, इस प्रक्रिया बहुत जटिल हो गया है, आवाज संकेत नमूने होते हैं, विरोधी aliasing बैंड-पास फिल्टर, और प्रसंस्करण भाषण सुविधा निकासी के बाद उच्चारण उपकरण, पर्यावरण की वजह से शोर, आदि में व्यक्तिगत मतभेदों को हटा दें।

डिजिटल भाषण तरंग (नेटवर्क से चित्र)

हम जानते हैं कि ध्वनि की प्रकृति कंपन है, जो एक तरंग द्वारा दर्शाया जा सकता, तैयार लहरों के लिए की जरूरत है, एक राज्य का गठन करने तख्ते की अधिकता की पहचान है, तीन राज्यों एक स्वनिम गठन करते हैं। अंग्रेजी कार्नेगी मेलॉन विश्वविद्यालय के आम फोन सेट है द्वारा निर्धारित 39स्वनिम स्वनिम सब नाम के पहले अक्षर और स्वनिम के रूप में फाइनल के साथ आम तौर पर सीधे गठित चीनी, अतिरिक्त वाक् पहचान आगे स्वर atonal में बांटा गया। स्वनिम प्रणाली संश्लेषण शब्द या वर्ण के माध्यम से गुजर जाने के बाद। बेशक, मिलान और पोस्ट सामग्री प्रसंस्करण भी एक इसी की आवश्यकता है के बाद पूरा करने के लिए एल्गोरिदम

पहचान प्रक्रिया का आउटपुट टेक्स्ट फ़ॉर्म

प्रणाली, स्वयं सीखने अधिक डेटाबेस निर्देशित है। पाठ भाषण मान्यता में परिवर्तित भाषण प्रणाली दो डेटाबेस, एक ध्वनिक मॉडल डेटाबेस निकाली गई जानकारी के साथ मिलान किया जा सकता है दूसरा कोई मिलता-जुलता है पाठ भाषा डेटाबेस दोनों डेटाबेस प्रशिक्षण मॉडल विश्लेषण, भी स्वयं शिक्षा प्रणाली उपयोगी डेटा मॉडल को निकालने के लिए के रूप में जाना के अग्रिम में डेटा की बड़ी मात्रा की आवश्यकता होती है डेटाबेस होते हैं, इसके अलावा, मान्यता की प्रक्रिया में, स्वयं सीखने प्रणाली उपयोगकर्ताओं संक्षेप किया जाएगा आदतों और एक डेटाबेस के लिए तरीकों की पहचान और उसके बाद संक्षेप डेटा, उपयोगकर्ता के लिए अधिक बुद्धिमान पहचान प्रणाली की इजाजत दी।

फिर भी आगे संक्षेप में प्रस्तुत पूरी पहचान की प्रक्रिया: एक लक्ष्य आवाज संसाधित भाषण अधिग्रहण भाग एकत्रित महत्वपूर्ण जानकारी शामिल है - मान्यता शब्द की सबसे छोटी इकाई, वाक्य रचना विश्लेषण पूर्व निर्धारित व्यवस्था - - सजा अर्थगत विश्लेषण, सामग्री कुंजी कुंजी जानकारी निकालने सामग्री मामूली विचलन समग्र जानकारी संशोधन के अनुसार होता है - पाठ को समायोजित करने के लिए कॉन्फ़िगर व्यवस्था को विराम देंगे।

http://mobile.zol.com.cn/665/6657841.html mobile.zol.com.cn सच Zhongguancun ऑनलाइन http://mobile.zol.com.cn/665/6656792.html रिपोर्ट 1278 वाक् पहचान सिद्धांत: स्वयं सीखने एल्गोरिथ्म और मान्यता हम सिर्फ निष्कर्षण एल्गोरिदम और स्वयं सीखने प्रणाली, जहां हम केवल अपने काम की प्रक्रिया में लग सकता है उल्लेख किया है: सबसे पहले, भाषण मान्यता प्रणाली आवाज एकत्र pretreatment लक्षित करने के लिए, इस प्रक्रिया बहुत जटिल हो गया है, भाषण संकेत के नमूने, विरोधी aliasing बैंडपास फिल्टर शामिल हैं, और व्यक्तिगत मतभेदों उच्चारण उपकरण, पर्यावरण की दृष्टि से प्रेरित हटाने ...

आवाज मान्यता स्थिति और भविष्य

रेडियो रेक्स खिलौना कुत्ता

ऐ रात भर नहीं हो सकता पिछले दो साल में भड़क उठी, भाषण मान्यता अपवाद नहीं है। प्रारंभिक प्रोटोटाइप आवाज की पहचान से, अब तक 90%इसके बाद के संस्करण की सटीकता, वहाँ के बारे में किया गया है 100इतिहास के वर्षों रेडियो रेक्स पिछली सदी में खिलौना उत्पादन 20साल, इस खिलौने कुत्ते पॉप अप कर सकते हैं जब कहा जाता है, भाषण मान्यता के प्रवर्तक के रूप में माना जाता है। सही मायने में भाषण मान्यता अनुसंधान पिछली सदी में शुरू हुआ 50साल, एटी एंड टी बेल बनाने के लिए लैब Audry दस वाक् पहचान की अक्षरांकीय प्रणाली कार्यान्वयन।

और हाल ही में गर्म NPU तंत्रिका नेटवर्क, पीठ में 60यह एक आवाज की पहचान के लिए इस्तेमाल किया गया है। बड़े शब्दावली, निरंतर भाषण, स्पीकर स्वतंत्र विशेषता तीन में से एक के आधार पर गूढ़ व्यक्ति सिस्टम में पैदा हुआ था 80वर्ष का अंत 90के बाद से साल भाषण मान्यता, ध्यान दे सरकारी एजेंसियों के लिए ध्वनि पहचान प्रौद्योगिकी के विकास के लिए एकदम सही समय है, कई प्रसिद्ध कंपनियों के लिए इस क्षेत्र में भारी निवेश करने लगे हैं, उच्च स्तर के अनुसंधान संस्थानों में से एक बड़ी संख्या में भाषण मान्यता अनुसंधान के क्षेत्र में शामिल हो गए, एक समय महत्वपूर्ण उपलब्धि

आईईटीएफ़ आवाज़ श्रुतलेख

आज, भाषण मान्यता ने एक सफलता बना ली है 2017साल 8माह 20दिन ,माइक्रोसॉफ्ट भाषण मान्यता प्रणाली त्रुटि दर से 5.9%को कम करें 5.1%, पेशेवर आशुलिपिक के स्तर तक पहुंच सकता है, आवाज मान्यता के क्षेत्र में घरेलू नेता, ItexamTech आवाज शुद्धलेखन सटीकता पर पहुंच गया है 95%, अली, बैडु, टेनेंट और अन्य बड़ी कंपनियों जैसे खराब प्रदर्शन करने वाले प्रदर्शनकारियों ने भी अपनी आवाज पहचान बनाई है, एक आशाजनक होने की संभावना।

उड़ान मछली प्रणाली की आईईटीएफ़ आवाज सहायक आवाज (नेटवर्क से तस्वीर)

और आवाज पहचान प्रणाली न केवल बस के लिए मोबाइल फोन से पहले उल्लेख किया है बातचीत करने के लिए होगा बुद्धिमान वक्ता आदेश, खिलौने, फर्नीचर, घर, कार, न्यायिक,, चिकित्सा शिक्षा, औद्योगिक और कई अन्य क्षेत्रों, आवाज पहचान प्रणाली खेलेंगे नजरअंदाज नहीं किया जा सकता है कार्रवाई। सब के बाद, कृत्रिम बुद्धि के वर्तमान युग में अभी-अभी शुरुआत है, इससे पहले डिवाइस मानव विचारों का पता लगाने के लिए आसान नहीं किया जा सकता, भाषण बातचीत सबसे कुशल मानव-कंप्यूटर संपर्क है।

आखिरी में लिखा

यहाँ देखें, मेरा मानना है कि हम वाक् पहचान एक सामान्य समझ हम मोबाइल फोन, स्मार्ट वक्ता भाषण मान्यता पर देखते हैं, भाषण मान्यता केवल शुरुआत भर दिखाने किया है, और हम भविष्य में देखेंगे इस तरह के चालक रहित कारों के साथ आवाज की पहचान प्रणाली के रूप में दैनिक जीवन के सभी पहलुओं के लिए वाक् पहचान की अधिक रूपों,, जब तक कि आप कहते हैं कि कार के साथ जाना, कार स्वचालित रूप से आप अपने गंतव्य तक पहुंचने के लिए ले जाएगा।

कृत्रिम बुद्धि दुनिया पर राज करेगा, तो यह समस्या नहीं कहना है। ऐ यहां तक कि मानव भाषा की क्षमता के संबंध में प्राकृतिक भाषा के कौशल में महारत हासिल है, अभी भी प्राथमिक है, लेकिन जो खुद है कार्यक्रम के आधार पर उपयुक्त सामग्री, दिया गया है ज्ञान की स्थिति, एक अर्थ में, मानव बुद्धि कार्यात्मक एकीकरण की एक प्रमुख नींव आता है। लेकिन स्पष्ट रूप से यह, के बारे में चिंता करने के लिए तत्पर और कृत्रिम बुद्धि की सुविधा के लिए पर्याप्त लाने आनंद लेने के लिए हमारे समस्या नहीं है।

http://mobile.zol.com.cn/665/6657842.html mobile.zol.com.cn सच Zhongguancun ऑनलाइन http://mobile.zol.com.cn/665/6656792.html रिपोर्ट 1851 ध्वनि पहचान यथास्थिति और रेडियो रेक्स खिलौना कुत्ता (फोटो नेटवर्क से उद्धृत) कृत्रिम बुद्धि पिछले दो साल में रात भर प्रकोप ऐसा नहीं हो सकता के भविष्य, भाषण मान्यता अपवाद नहीं है। वाक् पहचान का प्रारंभिक प्रोटोटाइप, और अब 90% से अधिक सटीकता दर से वहाँ पहले से ही है, जब इस खिलौने कुत्ते कॉल कर सकते हैं के बारे में 100 साल पुरानी हैं। 1920 के दशक के उत्पादन पर रेडियो रेक्स खिलौना कुत्ता ...