از نظر بینایی کامپیوتر، مانند تحقیقات IBM چشم انداز کامپیوتر و روجریو Feris مدیر تحقیقات چند رسانه ای گفت: بزرگترین چالش این است که چگونه به تجزیه و تحلیل بصری کارآمد تر به توجه ویژه شود، AI است که هنوز در مراحل اولیه توسعه، ما نیاز جدید ایده ها، چشم انداز دراز مدت و سرمایه گذاری بیشتر در تحقیق و توسعه دانشگاهیان و موسسات تحقیقاتی.
در این هفته، کنفرانس دیدگاه و تشخیص رایانه ای (PCPR) این هفته در این هفته در سالتلیک سیتی برگزار شد. CVPR توسط بنیاد رایانه و جامعه کامپیوتر IEEE حمایت می شود و به عنوان یکی از رقابتی ترین فن آوری های رایانه ای در نظر گرفته شده است.
در بخش سخت افزاری AI، تحقیقات IBM در حال ارتقاء یک سیستم استریوی دید است که تکنولوژی شبکه عصبی مغز الهام گرفته را برای کسب اطلاعات (سنسورها) به کار می برد. طراحی شده توسط پردازش داده ها؛ طراحی با استفاده از تراشه TureNorth خود IBM - یک پردازنده معماری غیر فون نیومن - و یک توسعه مبتنی بر رویداد توسط iniLabs صنعت سوئیس است. ) دوربین
معماری TrueNorth IBM (منبع: IBM)
در بخش نرم افزار هوش مصنوعی، مقاله IBM Research در مورد "Blockdrop"، یک گام کلیدی است که در نظر گرفته شده برای کاهش کل محاسبات مورد نیاز برای شبکه های عمیق باقی مانده است. Feris توضیح داد که دو مقاله فوق از همان مشکل را از دو دیدگاه مختلف حل کنید - کارایی تجزیه و تحلیل بصری.
فریز گفت که وقتی کسی می خواهد از جاده عبور کند، انتظار می رود یک وسیله نقلیه ی خود راننده "نتیجه گیری فوری" باشد؛ اگر چه دقت تشخیص تصویر بسیار مهم است، اما چقدر طول می کشد تا ماشین را برای نتیجه گیری و شناسایی آنچه که دارد، رانندگی کند؟ آزمون نهایی آن در برنامه های دنیای واقعی.
Blockdrop چیست؟
در سال 2015، کنگره ImageNet تبدیل شدن به برنده شبکه باقی مانده، چشم انداز کامپیوتر جامعه فن آوری توسط طوفان؛ تکنولوژی ثابت کرده است که می توان آن را به رسمیت شناختن نتایج بسیار عالی ارائه، زیرا آنها می توانند شبکه های عصبی صدها و یا حتی آموزش تعداد Melaleuca اما Feris گفت: "یک اندازه متناسب با همه کسانی که در شبکه باقیمانده اپراتور نیاز به اعمال به همه تصویربرداری، خواهد بود بیش از حد ناکارآمد؛ او در شهرستان توضیح داد، اگر یک سگ در مقابل یک پس زمینه سفید وجود دارد، از یک خیابان شلوغ این است که به آسانی شناخته شده است.
: هدف از این روش مناسب است که به کاهش واحدهای کلی عملیاتی: Feris گفت؛ برای این منظور تحقیقات IBM توسعه داده است BlockDrop، این یک شبکه یادگیری که در آن انتخاب پویا از بلوک های باقی مانده (از جمله لایه های متعدد) به انجام وظایف روش استنتاج است ، بدون از دست دادن دقت پیش بینی.
دستورالعمل BlockDrop (منبع: IBM)
آی بی ام ادعا می کند که BlockDrop می تواند سرعت تشخیص را در طی تست به طور متوسط 20٪ افزایش دهد، و گاهی حتی تا 36٪، بدون به خطر انداختن دقت شبکه های باقی مانده که در مجموعه داده های ImagNet به دست آمده است، فریز گفت که مطالعه IBM در سال 2017 بود. در تابستان با دانشگاه تگزاس و دانشگاه مریلند این شرکت BlockDrop را به جامعه منبع باز منتشر خواهد کرد.
تکنیک های نئومورفیک برای برنامه های کاربردی استریو استریو
از لحاظ سخت افزار، آی بی ام پژوهش در استفاده از یک سیستم دید در سنبله استریو شبکه عصبی با هدف؛ نشان دهنده شرکت، صنعت در حال حاضر مرسوم به استفاده از دو (جلوگیری از اطلاعات) برای تولید یک دوربین سهبعدی است، اما هرگز تلاش شده است تکنولوژی neuromorphic. در حالی که دوربین های معمولی ارائه یک تصویر سه بعدی است غیر ممکن نیست، اما یک تعریف بالا پردازش سیگنال ویدئویی، از جمله محدوده دینامیکی (HDR) تصویربرداری بالا، وضوح فرآیند کالیبراسیون خودکار بالا و مانند آن است.
محققان IBM پس از اسکندر Andreopoulos در این مقاله است، که یک سیستم توسعه یافته با استفاده از دو رویداد راهنمای دوربین iniLabs (همچنین پویا -DVSe سنسور دید نامیده می شود)، عکس های تراشه به خوشه آی بی ام TrueNorth از اشیاء در حال حرکت سریع استخراج توصیف عمق.
هدف IBM است به طور قابل توجهی مصرف انرژی را کاهش دهد برای به دست آوردن یک تصویر برجسته با تاخیر مورد نظر، پس از دریافت موج پخش چرخ ضامن دار ورودی (این تا حد زیادی مقدار داده کاهش می یابد)، سیستم یک تصویر 3D بازسازی با استفاده از آی بی ام سخت افزار neuromorphic، از طریق از تفاوت DVSe تصویر دو، و اشیاء موقعیت در فضای 3D با استفاده از مثلث اندازه گیری برآورد شده است.
تصاویر استریو Neuromorphic (منبع: IBM)
بازیابی داده و پردازش
یک شرکت راه اندازی فرانسوی Prophesee از neuromorphology برای جمع آوری داده ها و کاهش میزان داده های جمع آوری شده توسط سنسور استفاده می کند. تکنولوژی سنسور شرکت مبتنی بر فریم نیست بلکه ساده و مناسب برای استفاده از دستگاه است. اهداف طراحی: در یک مصاحبه قبلی با EE Times، Prophesee گفت که این می تواند به شدت میزان داده ها را کاهش دهد و به ماشین اجازه می دهد که تقریبا تصمیم گیری های فوری انجام دهد.
اما نسل جدیدی از آی بی ام سیستم صوتی استریو نه تنها مانند فن آوری مغز انسان برای ضبط داده ها، همچنین در پردازش اطلاعات استفاده شده برای بازسازی تصاویر سه بعدی؛ Andreopoulos گفت یکی از بزرگترین دستاوردهای نظام است به طوری که از طریق برنامه ریزی TrueNorth عملکرد کارآمد از پاشنه شبکه عصبی بینایی برجسته انواع لازم زیرروالهای مشترک (زیرروالهای). IBM اضافه کرد که، TrueNorth کم قدرت معماری تراشه نسبت به سیستم های سنتی، که سیستم خلبان اتوماتیک را تسهیل خواهد طراحی.
به طور مشابه، با استفاده از یک جفت دوربین DVS (بلوک اطلاعات غیر فرمول) می توانید مقدار از داده ها و مصرف برق را کاهش و افزایش سرعت، کاهش زمان تاخیر، دامنه پویا بهتر است، اما این عناصر کلیدی هستند IBM گفت طراحی سیستم های فوری. زمانی که در مورد سیستم جدید و همچنین کسانی که مزایای TrueNorth پرسید، Andreopoulos گفت: در مقایسه با سیستم های معمولی با استفاده از آخرین CPU / GPU پردازنده یا FPGA، اختلاف پیکسل بر روی نقشه هر یک از قدرت (قدرت در هر نقشه اختلاف پیکسل) دو بار ارتقاء
با استفاده از ورودی های مبتنی بر رویداد، تغذیه آی بی ام سیستم داده های زمان واقعی تصویر 9 تراشه TrueNorth برای پردازش، می توان در هر 400 نقشه اختلاف محاسبه شده است، تنها با تاخیر 11 میلی ثانیه (MS). IBM در این مقاله اشاره شد، توسط با استفاده از معایب خاص، این سیستم می تواند بیشترین میزان را به 2000 نقشه های تناوبی در ثانیه افزایش دهد.
؟ تراشه TrueNorth با استفاده از سیستم دید استریو هنگامی که آن را بصورت تجاری Andreopoulos گفت: "ما می توانیم نقطه در زمان فاش نمی کند، فقط می توانم بگویم که ما تست شده و موفقیت برنامه ریزی تراشه برای مقابله موثر با نقشه اختلاف، یک اثبات مرحله مفهوم است.
تالیف: جودیت چنگ