هواوي الشهر الماضي الافراج عن P20 برو وP20، لتحتل المرتبة من بين الأفضل في يوم من نشر DxOMark كاميرا الهاتف المحمول وهامش الرائدة ليس 1 نقطة 2 نقطة، قبل P20 برو من أعلى سامسونج غالاكسي S9 بالاضافة الى ارتفاع 10 نقطة، ويمكن القول لا عصر، ولكن واحدة أو قبل اثنين من الأوقات. وبطبيعة الحال P20 برو 1 / 1.73 بوصة المواصفات CMOS أمر لا مفر منه أن بعض الناس الفتوة، ولكن P20 CMOS 1 / 2.7 بوصة مقارنة مع غالاكسي S9 بالاضافة الى ذلك، بكسل 2 فقط المواصفات قليلا عالية ، ولكن جودة التصوير لديها أيضا مزايا واضحة ، من أين جاءت هذه الميزة؟
تحسين نوعية التصوير هو لديه فكرتين، الأجهزة القتال العنيف، مثل استخدام مساحة أكبر أكبر بكسل CMOS، وزيادة تثبيت الصورة البصرية الميكانيكية، والفتحة أكبر؛ والثانية هي فكرة القوة الناعمة: الخوارزميات والتحسين.
الفكرة الأولى هي حالة نموذجية لسامسونج غالاكسي S9 بالاضافة الى ذلك، قبل غالاكسي S8 النسبية غالاكسي S7 الكاميرا الأساسية فقط إضاعة الوقت، في حين كان رائدا في مجرة S9 بالإضافة إلى استخدام 1.4μm الجديد CMOS DRAM مع كومة ثلاث طبقات، ولكن هذا فقط هو عامل ثانوي لتعزيز الصور من العوامل الرئيسية هو خطوة كبيرة حقيقية إلى الأمام المكونات البصرية القفزة الكبرى إلى الأمام، يستخدم غالاكسي S9 بالإضافة إلى اختراق فتحة كبيرة من F1.5. ولكن مطلوب استخدام مثل فتحة كبيرة لدفع ثمنا باهظا، أولا، أكثر من F1.8 فتحة كبيرة من الإنتاج هو صعب للغاية، العائد المنخفض جدا، مما أدى إلى ارتفاع تكاليف إنتاج وحدة الكاميرا، والفتحة الثانية هو كبير جدا، في مشاهد مشرق سيجعل هو تعريض الصورة، GS9 قدم حتى جسديا إن تغيير القزحية لحل هذه المشكلة يزيد بشكل كبير من تعقيد تجميع الكاميرا ويقلل من الموثوقية.
فكرة أخرى هي لتحسين خوارزميات برنامج، حالة نموذجية هي أن بكسل 2، 12.2MP، بكسل 1.4μm، ومواصفات الأجهزة و / 1.8 كاميرا واحدة ليست مبالغ فيها جدا، ولكن لا يزال يمكن أن تطغى على اي فون X وغيرها من الوحش الأجهزة، صوت واحد، هذا بفضل DeepLab-V3 + الخوارزمية. ويستند هذا الخوارزمية على عمق تعلم AI شبكة الطبيعية، ويمكن أن يتم تحليلها في الوقت الحقيقي من على الساحة، وتحديد محتوى المشهد الهدف، من أجل التحسين. HDR + وتجهيز مكان الحادث، وإلى حد معين لتجنب حالة التعرض المفرط وقعت. DeepLab-V3 + خوارزمية حيلة أكثر حمال هي كاميرا واحدة لتحقيق عمق الميدان لالتقاط الصور من خلال الخوارزمية، ويتم تنفيذ هذه الوظيفة تتطلب الكثير من عمليات الترميز وفك، وأخذ عينات متعددة والتحويل، وكمية من حساب ضخمة. جوجل بكسل 2 لتحقيق هذه الميزة حتى وضعت خصيصا رقاقة التسريع دعا بكسل البصرية الأساسية لتنفيذ معالجة الحسابي، وأداء الفاصلة العائمة تسارع رقاقة FPU خمس مرات سوف أبل A11 بيونيك، وأن Google ننظر أيضا بنزاهة DeepLab-V3 + خوارزمية المصدر المفتوح، مجانا لمشاركتها مع العالم. وبطبيعة الحال، وجوجل تقوم به أيضا التفكير الصغيرة الخاصة بها، من ناحية واحدة، يمكنك الاستفادة الكاملة من الموارد الحرة والمفتوحة المصدر تنمية المجتمع على مواصلة تحسين، من ناحية أخرى منافسه أداء كوالكوم شياو AI ليست جيدة كما 835/845 A11، وهذه الحاجة لا تعمل عالية جدا خوارزمية الأداء، لذلك لا تقلق الفكر، والبعض الآخر واحد ليست هناك خوارزمية الأجهزة قادرة على أن تتحقق.
مقارنة عينة P20 وتحليلها
ولكن في هذه القضية قد أخطأت جوجل، هواوي كيرين 970 معالج NPU بناء الرصاص، ويمكن أن توفر أداء كافية لتحقيق نفس المستوى من جودة الأداء مع هذه الخوارزمية على أساس عمق التعلم، وتعزيز اطلاق النار على أساس عمق التعلم خوارزميات AI هي كيفية تحسين جودة الأداء، دعونا نلقي نظرة على دليل مقارن DxO (المصدر مقارنة :. https://www.dxomark.com/huawei-p20-pro-camera-review-innovative-technologies مدهش-/ نتائج، يمكن أن ينظر الفني النقيض محددة في هذه الصفحة)
ضوء منخفض ومضاد للوهج
كان مشهد ليلة نموذجية، هواوي P20 الزاوية برو السفلية اليسرى من السقف لاستعادة أسود صحيح، فيما حمل فون X وبكسل 2 التعرض المفرط الواضح، وانخفاض الشوارع الصحيحة فون X وبكسل 2 أيضا وهج كبير. P20 دراسة متعمقة برو بها المشهد كشف إلى حد كبير لتجنب التعرض المفرط من الحدوث. والزاوية اليمنى العليا من فروع هواوي P20 برو تفاصيل أفضل، ولكن ليس كثيرا الحدة يؤدي الصبر في الارتفاع، وهذا هو مساحة واسعة من ذات حساسية عالية استشعار أفضل + نتيجة العمل المشترك للخوارزمية المتأخرة.
تكبير وتثبيت الصورة البصرية
كنت ساذجة بما يكفي للتفكير تسولي هو العدل، على الرغم من أن هذا هو مجرد مجال DSLR، ولكن في الفضاء المحمول ليس هو الحال. قبل سوني / MEIZU مرة واحدة مع 1 / 2.7 بوصة استشعار تسولي، ولكن أيضا بسبب انتهاء الكبيرة، والهاتف لا يمكنك إضافة مساحة لتثبيت الصورة البصرية OIS، والنتيجة تستحق كل هذا العناء، وأنا فكرت مرة واحدة تسولي وتثبيت الصورة البصرية، مثل الأسماك ولا يمكن أن يكون على حد سواء.
هواوي P20 برو هو إدخال مبتكرة وظيفة AIS، بحيث يمكن أن تأخذ في الاعتبار CMOS نهاية الكبيرة وتثبيت الصورة البصرية، وربما يعمل عن طريق تأطير الحركة للحكم على اتجاه الكاميرا المحمولة باليد خلال ثلاثة، ثم مرة أخرى من قبل منظمة العفو الدولية بعد العلاج مستقرة متعددة الإطار تقوم الخوارزمية بتثبيت الصورة وتكمل المهام التي اعتقدت أنه لا يمكن إنجازها.
مشهد عمودي
العلامة التجارية الأجنبية الهواتف المحمولة صور واطلاق النار الجمال تم متخلفة عن العلامات التجارية المحلية، والسبب هو عدم الاهتمام، هذا البلد هو أكثر إلحاحا للصورة والألم الجمال نقاط، مما اضطر مصنعي الهواتف النقالة المحلية لديها المزيد من المدخلات في هذا الصدد. و هواوي الاستفادة الكاملة من المزايا التكنولوجية، على التعرف على الوجه 3D من قبل شخصيات AI تواجه خوارزميات التعلم العميق، واللون لتحسين وتعزيز الجلد فوق البراهين P20 برو أكثر وردية والتحرك. لأن الشخصيات هي التغييرات في الوقت الحقيقي، والحاجة في الوقت الحقيقي يتم تحليل الصورة ومقارنتها بنتائج التعلم العميق للشبكة العصبية السابقة لتصبح معلومات ثلاثية الأبعاد للوجه ، ثم يتم تحسينها ، حيث لا تزال كمية المعالجة في الوقت الفعلي كبيرة جدًا.
مشهد HDR
هذا المشهد هو صورة، ولكن الخلفية، سطوع المشهد خارج النافذة مرتفع جدا، ونافذة فون X من التعرض المفرط خطيرة، بكسل السيطرة 2 التعرض المفرط أفضل، في حين أن برو السيطرة P20 هي أكثر كمالا، في حين أن الطابع الداخلي ولا مظلمة للغاية. منذ عمق المشهد يجعل التعلم ينقسم تراكم تحديد لهذه الاختلافات الكبيرة في سطوع مشاهد معقدة، وضع استراتيجيات التعرض مختلفة، كيرين 970 NPU أداء قوي يجعل هذه العمليات أكثر سهولة.
ذات الاستخدام المزدوج كاميرا بداية هي المعلومات دون كاميرا عمق الحصول المشهد في جهاز استشعار عمق، عمق شكلت المجال من خلال التوليف متعددة الإطار ووضع مرحلة ما بعد المعالجة، ولكن في خوارزمية قبل سن AI، لتحديد التمييز الأمامية والخلفية المشاكل، وخاصة هو نبات أكثر تعقيدا ، فإن حافة عرضة للعيوب.
عمق تأثير المجال وحكم حافة
واستنادا إلى المشهد بعد دراسة متعمقة لمنظمة العفو الدولية لتحديد، ويرجع ذلك إلى كمية كبيرة من البيانات المتراكمة حتى أن المشهد الكاميرا من الحكم على الأمامية والخلفية هو أكثر دقة، وتجزئة أكثر دقة حافة جزء، ولكن لا يظهر أعلاه لا تدعم كاميرا مزدوجة AI غير لائقة التعامل مع حافة معقدة المشكلة.
وعموما، كيرين NPU 970-19 الفئات وأكثر من 500 مشاهد التدريب تعلم الآلة، مثل القطط والكلاب، والغذاء، والناس، ماكرو، ليلة / النص، والزهور، والسماء الزرقاء، الثلج، الشاطئ، وما إلى ذلك لديها خطة التحسين المقابلة . لتحقيق هذه المهمة يتطلب الكثير من تراكم البيانات، ولكن يجب أن يتم معالجتها بواسطة الشبكة العصبية في الوقت الحقيقي لالتقاط الصور، وبالتالي فإن خوارزمية لحساب السلطة أيضا كميات كبيرة من البيانات ووضع الطلب مرتفع جدا إلى الأمام. هواوي P20 القمة ليست مجرد زرع DXOMark مزايا متأصلة في CMOS والمكونات البصرية، وأكثر جيد الجليد الخوارزمية على الكعكة. يتطلب خوارزمية ممتازة مشغلي قوة قوية لضمان ساهمت 970 كيرين NPU.
استجابة للطلب على التعلم العميق لمنظمة العفو الدولية ، كانت هواوي سباقة في الانضمام إلى وحدة NPU المستقلة في بداية البحث والتطوير لـ Kirin 970.
ذكر في وقت سابق، وظيفة معالجة الصور الأساسية هي تحديد تحليل المشهد، وهذا العمل له مرحلتين. المرحلة الأولى هي الاحتياجات التدريبية لإعطاء عدد كبير من العينات التي تم تحليلها من قبل شبكة التفاف العصبية تعلم التلافيف الشبكات العصبية، يمكن أن تكون عملية التدريب في الجهاز المحمول محليا، فإنه يمكن أيضا أن يكون الخادم كبير إلى سحابة من العمل، ولكن المتابعة من جديد صور والتحليل والحكم أساسا يمكن أن يتم إلا محليا على الرغم من أن هذه ليست سوى واحد تحليل عينة جديدة، ولكن تحتاج أيضا إلى مقارنة البيانات قبل وتراكم نعم، وتتلخص هذا التحليل إلى نتائج التعلم الآلي. وهذا التفاف الشبكة العصبية الشبكة العصبية التلافيف لمعالجة عدد كبير من عملية اتخاذ القرار الفرع، الأمر الذي يتطلب FP16 قوي العائمة نقطة قوة المعالجة.
كوالكوم شياو 845 ما يسمى ب 'NPU' هو السداسي 685، 685 مسدس قبل السداسي 682 تغيير طفيف. بالمعنى الدقيق للكلمة، وهذا لا يمكن إلا أن تعتبر DSP، بدلا من يونيكورن 970 و A11 كما NPU بالمعنى الحقيقي، ولكن التبسيط وحدة المعالجة ناقلات، وقوة الحوسبة DSP أيضا قد يكون محتلا من قبل غيرها من المهام. شياو 845 أكثر تعقيدا AI المهام تعلم الآلة لا تزال بحاجة إلى أن تكون حتى GPU وحدة المعالجة المركزية لتحقيق، وهذا الثمن هو هائل.
هذا هو TechInsights الأساسية كيرين 970 الرسم البياني، يمكننا أن نرى أدناه A53 هو جوهر NPU منطقة رقاقة صغيرة، شركة نفط الجنوب المحمول الحالي، إلا أبل A11 وكيرين 970 لديه شعور حقيقي من NPU.
AI والتعلم العميق ليست مجرد مشكلة في الجهاز، خطوة عملية AI هو نظام متعدد المستويات مشاريع مزيج من الأجهزة والبرمجيات. الطبقة العليا هي طبقة التطبيق، والذي هو تحت API باعتبارها طبقة التطبيقات وطبقة الأجهزة واجهات تطبيق تفاعلية. منصة أندرويد حاليا في منظمة العفو الدولية API المتسارع هي أساسا اثنين: واحد هو رسمي الروبوت AI وقت التشغيل جوجل، المباشر حساب تحت ويندوز مماثل، برامج جيدة وتوافق الأجهزة، هو المعيار الصناعة، والآخر هو هواوي HiAI، وهذا هو API فريد يونيكورن مماثل. CUDA NVIDIA، على الرغم من هناك يمكن أيضا أن يكون GPU هي القيود المفروضة على الأجهزة، ولكن أكثر كفاءة. في طبقة API يليه نظام إدارة الموارد غير متجانسة HiAI، تكليف الأساسية طبقة طبقة الأجهزة الأجهزة أدناه قد يكون NPU،، وحدة المعالجة المركزية، DSP، أو حتى ISP.
هذا يدل على أن ليس بالضرورة أن تدار AI فقط على NPU، وغيرها حدة المعالجة المركزية، GPU، يمكن أن يكون DSP شيئا، ولكن من حيث الأداء والكفاءة، لديه فرق جوهري: أداء GPU هو أربعة أضعاف وحدة المعالجة المركزية، ولكن وحدة المعالجة المركزية NPU 25 مرة وبصرف النظر عن الطاقة فجوة الأداء المطلق من أكثر وضوحا، NPU مقارنة مع GPU وحدة المعالجة المركزية قد تصل إلى 8 أضعاف والفرق 50 أضعاف، والتي امتدت لأجهزة المحمول طاقة، ويمكن القول أن هناك فجوة الطبيعة .
كيرين NPU 970 مع تحديد الوقت الحقيقي للسلع، والأداء لا يمكن أن يتحقق 16GFlops القدرة الحاسوبية، وتستهلك فقط 32ns معالجة واحدة، والتشغيل الحالية من 300MA الوحيد، هو أخضر جدا بالمقارنة مع عدد قليل من مئات واط من وحدة المعالجة المركزية والجرافيك الشروط.
منظمة العفو الدولية من اختبارات الأداء، ويمكننا أن نرى ماستر لو تشيلين 970 شياو لونغ 845 تطوير أداء الجهاز مزايا واضحة النسبية. ويتضمن اختبار ماستر لو AI InceptionV3، Resnet34، VGG16 3 مشاريع، ثلاثة ثلاثة عناصر الاختبار المختلفة كانت خوارزمية التعرف على 100 صورة لتقييم الأداء من خلال تستغرق وقتا طويلا. هذه الخوارزمية الأساسية الثلاثة هي حاليا تدريب فقط الشبكة العصبية خريطة المعرفة الذكاء الاصطناعي من خوارزميات ثلاثة، ممثل جدا، يمكن القول إن منظمة العفو الدولية خوارزمية التعلم عمق الحالية . كل خوارزميات ثلاثة، InceptionV3 أكثر اعتمادا على وحدة المعالجة المركزية وGPU، قليلا يونيكورن 970 و 845 شياو اثنين الفجوة المنبر؛ وResnet34، VGG16 على الخوارزميات المتقدمة التي يمكن الاستفادة من فوائد أداء NPU، لذا من الواضح كيرين 970 مع مزايا الأداء NPU على البنود التالية اختبار اثنين.
VGG16 خوارزمية معينة، انظر تضم طبقات 13 و 16 من التفاف ثلاثة هيكل طبقة من سلسلة كاملة من طبقات المستعبدين، وNPU مناسبة. وتنتقل FP16، FP32 وحدة المعالجة المركزية هذه الدقة الحسابية الخوارزمية، بشكل أكثر دقة. ومع ذلك، عندما تستخدم لعلاج FP16، سوى نقل واحد أو عملية FP16 واحدة، لذلك فإن من النفايات الخطيرة للموارد. لذلك، لأنه في هذه VGG16 حساب FP16 مقرها، FP16 الأمثل NPU للاستخدام أكثر كفاءة يمكن أن يكون أكثر بالكامل الموارد.
حتى كانت الشركة قد تهب شياو لونغ 660 الأداء AI، ولكن لم شياو 660 مسدس 680 DSP السلطة لا الحوسبة FP16، هو أن تعتمد على AI نحسب؟ CPU أو GPU؟ الواقع أنه يمكن تشغيل AI، لا يمكننا إلقاء اللوم كاذبة الدعاية، ولكن لا يبدو الأداء الجيد واستهلاك الطاقة.
في عصر ما قبل منظمة العفو الدولية، لتعزيز نوعية الكاميرا دون عتبة واضحة من دون R الأساسي وقوة D لهذه العلامة التجارية، مجرد استعداد لقضاء بضعة دولارات لشراء أفضل أب لإيجاد سوني CMOS، لتحمل بشدة على انخفاض العوائد فتحة كبيرة، تطبيق كوالكوم أو إصدار العام سامسونج من ISP خوارزمية إرم إرم، ويمكن أيضا جعل الهاتف كاميرا جيدة، ولكن بعد وصول AI، التفكير التقليدي لم يعد ممكنا، على الأكثر، وهي مسابقة في غاية البساطة أن العلامة التجارية ليست الكامنة قدرات الأجهزة R & D يمكن حفظ الأجهزة جيد، ولكن إذا كان هناك خوارزمية المفقودة على أساس ذكي AI عمق التعلم، ويمكن أن تجعل المنتج تماما وراء هذه الفكرة. تم فتح فجوة بين القيادة اثنين، تبع ذلك الخليج، مما يؤدي في النهاية الشركات AI بجد للحفاظ على المستوى.
تحت وتمتلك الشركة R & D قوة الخوارزمية، على الرغم من أن الوضع أفضل قليلا، ويمكن أن تشارك في منظمة العفو الدولية دراسة متعمقة في اللعبة، ولكن هذه الشركات تفتقر إلى R-رقاقة المستوى والقدرة على التطوير، ونحن لا يمكن أن توفر ما يكفي من NPU رقاقة مزود عدد من المنتجات المنبع للقضية، فقط تشكو ومترددة لمتابعة.
وحتى الآن هناك AI آلة التعلم وتطوير قدرات المؤسسات يمكن اعتبارها من الدرجة الثانية، ولكن قدرات رقاقة R & D ومنصة لبناء بيئة الأعمال التجارية هو أعلى. في الجزء السفلي من هواوي كيرين العلامة التجارية كأساس لتطوير وآلة HiAI المتوسطة كمنصة لدعم العلوي المزيد من الالكترونيات الاستهلاكية المنتجات والتطبيقات البرمجية مع اتصال مباشر مع العملاء النهائيين، مثل هذه النظم الإيكولوجية هي التنمية الصحية والمستدامة للبيئة منظمة العفو الدولية. بالنسبة للمستهلكين، استنادا إلى عمق تعلم AI مجرد صندوق أسود، لا يحتاج المستخدم وفهم الطريقة التي يعمل بها، ويمكنك التمتع مجرد ثمار بالاطراء بهم. هواوي كيرين هذا بالاطراء الأبطال المجهولين، وجعل لها العمل الجاد بعد حياتنا مكانا أفضل.