정신 지체에서 지능으로 | 광학 및 음성 인식에 100 년이 걸렸습니다.

얼마 전, 중국어 버전 빅스 비 오픈 베타입니다. 빅스 비 첫 번째 릴리스에서, 그러나 그것은 새로운 음성 거인이 우리의 테스트에서 발견 된 중국 시장에 진입하기 시작했다는 것을 의미합니다. 빅스 비 좋은 인식 속도를 가지고, 당신은 음성 해제, 음성 텍스트 변환을 달성 할 수 있으며, 사용자는 전화 문자 메시지, 소프트웨어 제어, 제 3 자 콘텐츠 액세스 및 기타 작업에 전화를 음성 수 있습니다. 어떤 의미에서, 전화 인간의 목소리에 대한 이해를 얻었습니다.

정신 지체에서 지능형 광 - 음성 인식까지 100 년이 걸렸습니다.

공상 과학 영화의 인문 과학 대화에서 인공 지능을 볼 때 우리는 여전히 기술에 정통합니다. 사실 우리의 음성 조력자는 조용히 우리 삶에 들어서므로 요즘에는 훌륭한 음성 제품을 볼 때, 익숙하지 않겠지 만 우리 대부분의 인상에서 보이스 비서는 여전히 정신적으로 장애가있는 존재입니다. 기계는 지능이 없거나 인간처럼 생각할 수 없기 때문에 실제로 부정하지 않습니다. 거대한 시스템에 대해 생각하게 만들 정도로 충분합니다. 그러나 음성 인식의 인공 지능은 이미 상당한 규모를 가지고 있다는 것은 부인할 수 없습니다.

음성 인식은 큰 편의를 가져 왔습니다.

매우 일반적인 예를 들어, 현재 인터넷 TV 네트워크의 대부분은 음성 검색을 지원하므로 배터리의 입력 장치가 여전히 원격 제어되고 입력 효율성이 키보드와 일치 할 수 없기 때문에 TV 사용을 크게 용이하게하지만 지원 음성, 텔레비전에 입력 음성 명령으로, 당신은 상호 작용을 완료 할 수있는 매우 편리합니다. 또한, 장치의 맹목적인 사용에 대한 음성 인식 상호 작용이 복음을 가져왔다. 그 역할을 과소 평가해서는 안됩니다.

전화 음성 도우미 (네트워크 사진)

나는 음성 인식에 신경 쓰지 않는 많은 독자들이 그런 질문을한다고 믿는다. 형, 너 농담 해? 시리 둘, 집에서 스마트 스피커, 평범한 보이스 어시스턴트가 있습니다. 음, 정말 선화에 대해 어떻게 이야기할까요? 그리고 스마트 스피커의 가격은 비싸지 않습니다. 그럼, 하이테크가 얼마나 싸게 될 것입니까? 음성 도우미를 개발하는 것은 실제로 작은 프로젝트가 아니며 적어도 음성을 지시 할 때 음성 보 조원이 오기 힘들 때가 있습니다. IME 공급 업체는 사용자에게 비용을 청구하지 않으므로 강력한 자금 조달을하지 않으면 고수하기가 어렵습니다. 오늘의 수입.

음성 인식도 약간의 맛이 있습니다 (네트워크의 그림)

이제 우리는 음성 안내 광고 제작자를 만나러 우리의 정확도가 몇 퍼센트에 도달했다고 말하고 있습니다. 지금은 정확도에 도달했습니다. 90%위의 내용은 매우 훌륭합니다. 우리는 그와 같은 높은 정확도를 가지고 있지만, 언어 복잡성 인 무미의 음성 조수 중 일부를 여전히 느끼고 있습니다. 제 3 자 인터페이스는 현재 열병 학교의 무결성과 훌륭한 관계가 있습니다. 음성 인식 이론의 실현과 음성 인식의 현상과 미래 발전에 대해 이야기하려면 인공 지능이 세계를 지배 할 때를 상상해보십시오.

이 기사는 원본 기사에 속하며, 출처를 표시하십시오. 지능이 약한 지능형 조명에서 음성 인식까지 100 년이 걸렸습니다. http://mobile.zol.com.cn/665/6656792.html

음성 인식은 원칙을 달성하기 위해 : 데이터베이스

요약하면, 음성 인식의 원리는 실제로 이해하기 어렵지 않습니다. 지문 인식의 원리는 대면에서 동일합니다 : 장치는 목표 음성을 수집 한 다음 수집 된 음성에 대해 일련의 처리를 수행하여 대상 음성의 특징 정보를 얻은 다음 특성을 만듭니다 정보와 데이터베이스 내의 저장된 데이터 간의 유사성이 비교되고 가장 높은 점수가 인식 결과 인 경우, 장치의 음성 인식 기능이 다른 시스템의 액세스를 통해 완료됩니다.

프로세스를 간략하게 식별하십시오.

음성 인식에 관심이 없다면 일반적인 원칙만으로도 충분하다는 것을 알 수 있습니다. 사실 음성 인식 프로세스는 매우 복잡합니다. 가장 직접적인 이유는 음성의 복잡성 때문입니다. 지문 인식은 입력 된 지문 정보와 데이터베이스는 식별 정보를 저장하기 위해 일치 정보에 저장되며, 데이터베이스에는 지문 정보 만 포함되어 있지만 음성은 완전히 다릅니다.

"강서 사전"(중국 골동품 네트워크에서 인용)

강서 사전에는 한자가 포함되어 있습니다. 47035중국은 고립 된 한자 일뿐만 아니라 언어의 상승과 하락, 감정의 감각, 그리고 다른 의미의 다른 이해를 가지고있는 반면, 6 년 동안 30 명 이상의 유명한 학자들이 그 당시에 6 년간 집계했습니다. 동시에, 만다린을 말할 수 없다, 많은 방언이있다, 당신은 완벽한 언어 데이터베이스를 구축하기를 원한다 얼마나 어려울 지 상상할 수있다. 중국의 복잡성은 빅스 비 이유의 영어 버전보다 나중에 중국어 버전.

고정밀 음성 인식은 거대한 클라우드 기반 데이터베이스 (네트워크의 이미지) 없이는 분리 할 수 없습니다.

현재 개발 음성 인식을 사용할 때 거의 모든 휴대 전화의 음성 네트워킹 요구 도우미입니다 어려운 거대한 데이터베이스 언어가 휴대 단말기에 배치하는 이유는, 자사의 오프라인 버전이없는 것은 아니다, 그러나 우리는 쉽게 오프라인 정확성이 많이 찾을 수 있습니다 온라인 버전보다 낮습니다. 또한, 우리는 방금 정확성 비율에 도달했다고 많은 음성 제조업체들이 주장했다고 언급했습니다 90%위, 그것은 매우 큰라고 할 수있다해도 과언 말이 필요없는이이 시간마다 업그레이드 1정확도 비율, 질적 도약이다. 여기에는 정확도가 높은 식별 추출 알고리즘의 효율성과 자기 학습 시스템을 충족하는 매우 포괄적 인 데이터베이스뿐만 아니라.

물론,이 데이터는 우리가보기의 변증 법적 점에 원하는, 속담, 중국어 언어와 깊은이라고 할 수 백 다른 단어; 제조업체를 제공하고, 데이터의 정확성을 테스트 광범위한가 어려운, 그래서 일부 사용자는 음성 인식을 사용하는 그것은 또한 '정신 지체'라고, 그것은 정상적인 기능입니다 발견했다.

이 기사는 원본 기사에 속하며, 출처를 표시하십시오. 지능이 약한 지능형 조명에서 음성 인식까지 100 년이 걸렸습니다. http://mobile.zol.com.cn/665/6656792.html

http://mobile.zol.com.cn/665/6657840.html mobile.zol.com.cn 사실 중관촌 온라인 http://mobile.zol.com.cn/665/6656792.html 보고 1512 음성 인식의 원리 : 데이터베이스 요약은 음성 인식 원리는 동일 큰 얼굴 및 지문 인식 원리를 이해하기 어렵지 않다 : 대상 기기는 음성을 수집하고 인식 대상 음성을 얻기 위해 음성 일련의 처리를 수집 기능 정보, 그리고 이미 데이터베이스 유사성 검색 비교에 존재하는 특성 정보와 데이터를하자, 높은 점수는 인식의 결과이다. 다음 ...

음성 인식의 원리 : 알고리즘과 자기 학습

음성 신호 샘플을 포함, 첫째, 음성 수집 전처리를 대상으로 음성 인식 시스템은이 과정이 매우 복잡하고있다 : 우리는 단지 우리가 단순히 자신의 작업 과정을 볼 수있는 곳, 추출 및 자기 학습 시스템에 대한 인식 알고리즘을 언급 한 안티 에일리어싱 대역 통과 필터, 및 음성 특징 추출 처리 후의 발음 장치, 환경에 의한 노이즈 등의 개인차를 제거한다.

디지털 음성 파형 (네트워크로부터 사진)

우리는 소리의 자연 프레임 파도의 필요성, 상태를 구성하는 다수의 프레임을 식별, 파형으로 표시 할 수있다 진동이있다, 세 가지 상태가 음소를 구성하는 것을 알고있다. 영어 카네기 멜론 대학의 일반 전화 세트입니다 에 의해 설정 39음소의 음소의 음소 모든 글자 및 마지막으로, 일반적으로 직접 중국어 구성된 별도 음성 인식은 또한 무조 톤으로 분할. 음소 시스템 합성 단어 또는 문자를 통과 한 후에. 물론, 매칭 후 컨텐츠 프로세싱과 같은 대응하는 요구 후 완료 할 알고리즘.

식별 과정의 출력 텍스트 형식

자기 학습 시스템은 데이터베이스에 대한 더 많은 것입니다. 텍스트 음성 인식 시스템으로 두 개의 데이터베이스, 하나의 추출 된 정보와 음향 모델 데이터베이스를 일치시킬 수있는 변환, 두 번째는 일치하는 것입니다 텍스트 언어 데이터베이스. 이러한 두 데이터베이스는 또한 데이터 모델을 훈련 분석의 큰, 자기 학습 시스템으로 알려진 따라서, 데이터베이스를 형성하기 위해 유용한 데이터 모델을 추출, 전진해야합니다 또한, 인식 과정에서, 자기 학습 시스템은 사용자를 요약합니다 습관과 식별 방법, 그리고 데이터베이스에 데이터, 그래서 사용자를위한 식별 시스템이 더 지능입니다.

전체 인식 과정을 더 요약하면 다음과 같습니다 : 대상 음성 처리의 획득, 음성 정보의 핵심 부분에 대한 액세스 - 주요 정보 추출 - 가장 작은 단위 단어 식별, 문법 배열 조항 분석 - 문장 의미론 분석, 핵심 요소 문장 배열, 텍스트의 구성을 조정 - 전체 정보에 따라 콘텐츠의 약간의 편차를 수정합니다.

이 기사는 원본 기사에 속하며, 출처를 표시하십시오. 지능이 약한 지능형 조명에서 음성 인식까지 100 년이 걸렸습니다. http://mobile.zol.com.cn/665/6656792.html

http://mobile.zol.com.cn/665/6657841.html mobile.zol.com.cn 사실 중관촌 온라인 http://mobile.zol.com.cn/665/6656792.html 보고 1278 음성 인식 원리 : 자기 학습 알고리즘과 우리가 추출 알고리즘과 우리는 단순히 자신의 작업 과정을 볼 수있는자가 학습 시스템을 언급 한 인식은 첫째, 음성 인식 시스템은 음성 수집 전처리를 대상으로,이 과정 음성 신호 샘플 안티 에일리어싱 대역 통과 필터를 포함하는 매우 복잡하고, 개인차는 장비 환경에 의한 발음을 삭제했습니다 ...

음성 인식 상태 및 미래

라디오 렉스 장난감 개

AI는 하루 아침에 지난 2 년 동안 분화 할 수없는, 음성 인식도 예외는 아니다. 초기 프로토 타입 음성 인식에서, 지금까지 90%위의 정확률은 이미 있습니다. 100역사의 년. 라디오 렉스 지난 세기 장난감 개 생산 20시대,이 장난감 개는 그것이 팝업 때, 음성 인식의 발신자로 간주됩니다 호출 할 수 있습니다. 음성 인식의 진정한 의미에서 지난 세기에 시작되었습니다 50나이, AT & T Bell 실험실 내장 오디 시스템은 10 영어 음성 인식을 달성하기 위해.

그리고 최근에 NPU 일찍이 신경망 60연령은 음성 인식에 사용되었습니다. 큰 어휘, 연속적인 음성, 스핑크스 시스템은 태어났다. 80올해 말. 90올해는주의를 기울이고 정부 기관에 음성 인식, 음성 인식 기술의 발전에 완벽한 시간이기 때문에, 많은 잘 알려진 기업이이 분야에 많은 투자를하기 시작하고, 높은 수준의 연구 기관의 많은 수의 음성 인식 연구 분야에 합류 한 번 중요한 업적.

IETF 음성 받아쓰기

오늘날 음성 인식은 혁신을 이루었습니다. 2017년 8달 20주간 ,에서 Microsoft 음성 인식 시스템 오류 비율 5.9%줄이기 5.1%전문적인 속기사 수준에 도달 할 수 있으며, 음성 인식 분야의 국내 선두 업체 인 ItexamTech 음성 받아쓰기 정확도에 도달했습니다. 95%알리, Baidu, Tencent 및 기타 대기업과 같은 성능 힘든 국내는 또한 음성 인식, 유망한 전망을 만들었습니다.

IETF Voice Assistant 비행 물고기 시스템 음성 (네트워크 그림)

그리고 음성 인식 시스템은 휴대 전화 지능형 스피커 명령, 장난감, 가구, 집, 자동차, 사법, 의료, 교육, 산업 및 기타 여러 분야 전에뿐만 아니라 언급 한 상호 작용하는 것입니다 단지에 대한 재생됩니다 음성 인식 시스템은 무시할 수없는 인공 지능이 막 시작된 시점에서 대화식 음성은 인간과 컴퓨터 간의 상호 작용을 가장 효율적으로 처리하기 때문에 장치는 인간의 사고를 쉽게 감지 할 수 있습니다.

끝까지 쓴다.

여기에, 우리는 음성 인식에 대한 일반적인 이해가 있다고 생각합니다. 우리는 휴대 전화, 스마트 스피커 음성 인식, 음성 인식은 빙산의 분야이며, 우리는 미래에 볼 수 있습니다 운전자가없는 차량이있는 음성 인식 시스템과 같이 일상 생활의 모든 측면에서 다양한 형태의 음성 인식이 사용됩니다. 자동차를 말할 때마다 자동차가 자동으로 목적지까지 연결됩니다.

인공 지능이 세계를 지배 할 때,이 문제가 말을하지 않습니다. 인공 지능도 인간의 언어 능력에 대한, 자연 언어의 기술을 마스터 한 여전히 주요이지만, 자신이있는 프로그램에 따라 적절한 컨텐츠를 제공하고있다 지혜 조건, 어떤 의미에서, 인간의 지능은 기능 통합의 핵심 기초는 오는이다.하지만 분명이 걱정 기대와 인공 지능의 편의를 충분히 가지고 즐길 수있는 우리의 문제는 아니다.

이 문서에 원래 문서에 속하는, 다시 인쇄해야한다, 소스를 표시하시기 바랍니다 : 지적 장애에서 음성 지능형 광 보냈다 백년의 인식 http://mobile.zol.com.cn/665/6656792.html에

http://mobile.zol.com.cn/665/6657842.html mobile.zol.com.cn 사실 중관촌 온라인 http://mobile.zol.com.cn/665/6656792.html 보고 1851 라디오 렉스 장난감 개 (네트워크에서 인용 사진) 인공 지능 지난 2 년 동안 하룻밤 발생이 일어날 수의 음성 인식 현상과 미래, 음성 인식 예외는 아니다. 초기 음성 인식의 프로토 타입, 지금은 90 %의 정확도 속도에서 약 100 년 전 Radio Rex Toy Dog는 1920 년대에 장난감 개가 불려서 제작되었습니다 ...