آئی سی ایم ریسرچ میں کمپیوٹر وژن اور ملٹی میڈیا تحقیق کے مینیجر، راجیرویو فارس کے طور پر کمپیوٹر وژن میں، سب سے بڑا چیلنج یہ ہے کہ کس طرح 'بصری تجزیہ زیادہ موثر' ہے. خاص طور پر، AI اب بھی ترقی کے ابتدائی مرحلے میں ہے علماء اور تحقیقاتی اداروں کی طرف سے تحقیق اور ترقی میں خیالات، طویل مدتی نقطہ نظر، اور زیادہ سرمایہ کاری.
آئی بی ایم ریسرچ اس ہفتہ کے 2018 کانفرنس میں کمپیوٹر ویژن اور پیٹرن شناختی (سی وی پی آر) پر اس ہفتے سلٹ لیک شہر میں منعقد ہونے والی ایی سافٹ ویئر اور ہارڈویئر ٹیکنالوجی پر دو کاغذات شائع کرتی ہیں. CVPR کمپیوٹر ویژن فاؤنڈیشن اور آئی ای ای ای کمپیوٹر سوسائٹی کی طرف سے سپانسر کیا جاتا ہے اور یہ سب سے زیادہ مسابقتی کمپیوٹر وژن ٹیکنالوجی سیمینار میں سے ایک ہے.
ایئر ہارڈویئر سیکشن میں، آئی بی ایم ریسرچ ایک سٹیریو وژن کے نظام کو فروغ دیتا ہے جو اعداد و شمار کے حصول (سینسرز) کے دماغ سے متاثرہ سپکنگ نیچرل نیٹ ورک ٹیکنالوجی پر لاگو ہوتا ہے. ڈیٹا پروسیسنگ کی طرف سے تیار کردہ؛ ڈیزائن IBM کے اپنے TureNorth چپ - ایک غیر وون نیومن فن تعمیر پروسیسر - اور سوئس کی صنعت انلااب کی طرف سے ایک واقعہ پر مبنی ترقی. ) کیمرے
آئی بی ایم کی TrueNorth فن تعمیر (ماخذ: IBM)
حصے میں AI سافٹ ویئر، 'Blockdrop'، پر آئی بی ایم ریسرچ مقالہ یعنی حساب کتاب کی کل رقم کی ضرورت ہوتی ہے ایک بقایا ویب کی گہرائی (گہری بقایا نیٹ ورکس) اہم اقدامات کو کم کیا جا سکتا ہے. Feris سے بیان کی گئی ہے کہ دو یا اس سے زیادہ کاغذات دو مختلف زاویوں ہی مسئلہ ایک بصری تجزیہ کارکردگی ── کو حل کرنے کے لئے.
ہے تصویر شناس درستگی ضروری ہے، لیکن یہ ایک نتیجے پر گاڑی سے کتنا وقت لگتا ہے، اگرچہ، یہ کیا ہے کی شناخت کے لئے؛ Feris کہا کسی کو سڑک پار کرنا چاہتا ہے جب، خود مختار گاڑیوں کی فوری کٹوتی 'بنانے کے لئے توقع کی جاتی ہے کہ حقیقی دنیا ایپلی کیشنز میں آخری ٹیسٹ جو.
'Blockdrop' کیا ہے؟
2015 میں کانگریس ImageNet بقایا نیٹ ورک کی فاتح، طوفان کی طرف سے کمپیوٹر وژن ٹیکنالوجی کمیونٹی بن؛ ٹیکنالوجی وہ سینکڑوں یا اس سے بھی کے عصبی نیٹ ورک کی تربیت کر سکتے ہیں کیونکہ یہ بہترین تسلیم نتائج فراہم کر سکتے ہیں کہ ثابت کر دیا ہے Melaleuca لیکن Feris کی تعداد فرمایا: '' ایک سائز کے فٹ بیٹھتا ہے ان تمام residuals نیٹ ورک آپریٹر تمام امیجنگ پر لاگو کرنے کی ضرورت ہے، بہت غیر مؤثر ہو جائے گا. 'اس نے شہر میں ایک سفید پس منظر کے سامنے ایک کتا ہو تو وضاحت کی ایک مصروف سڑک زائد اس سے زیادہ آسانی سے شناخت کیا جاتا ہے.
'طریقہ کار کا مقصد مجموعی طور پر آپریشنل یونٹس کم کرنے کے لئے مناسب ہے: Feris کہا؛ اس مقصد IBM ریسرچ BlockDrop تیار کیا ہے کے لئے، یہ ایک سیکھنے کے نیٹ ورک، جس میں بقایا بلاکس (ایک سے زیادہ تہوں شامل کر کے) کاموں اندازہ کرنے کے طریقوں کو انجام دینے کے متحرک انتخاب ہے ، پیشین گوئی کی صداقت کو کھونے کے بغیر. '
بلاک ڈراپ ہدایات (ماخذ: آئی بی ایم)
آئی بی ایم کا دعوی کرتا ہے کہ BlockDrop ImagNet ڈیٹا بیس میں حاصل کردہ بقایا نیٹ ورک کی درستگی کی قربانی کے بغیر، 20٪ اوسط کی جانچ پڑتال کے دوران، کبھی بھی 36 فیصد تک اضافہ کرسکتا ہے. فارس نے کہا کہ آئی بی ایم کا مطالعہ 2017 میں تھا. موسم گرما میں ٹیکساس یونیورسٹی اور یونیورسٹی آف میر لینڈ کے ساتھ، کمپنی بلاک ڈراپ کو کھلے ذریعہ کمیونٹی میں جاری کرے گی.
سٹیریو وژن ایپلی کیشنز کے لئے نیورومورک تکنیک
ہارڈ ویئر کی شرائط میں، IBM تحقیق ایک عصبی نیٹ ورک کی بڑھتی ہوئی وارداتوں سٹیریو وژن کے نظام کے استعمال کا مقصد؛ کمپنی کی نمائندگی کرتا ہے، صنعت اب ایک مجسم بیں کیمرے کو پیدا کرنے کے لئے دو (معلومات بلاک) استعمال کرنے کے روایتی ہے، لیکن یہ کوشش کبھی نہیں رہا ہے neuromorphic ٹیکنالوجی. روایتی کیمروں فراہم کرتے ہوئے ایک مجسم بیں تصویر ناممکن نہیں ہے، لیکن جیسا کہ ہائی متحرک رینج (HDR) امیجنگ، اعلی قرارداد خودکار انشانکن کے عمل اور اس طرح ایک ہائی ڈیفی ویڈیو سگنل پروسیسنگ، ضرورت پڑے گی.
الیگزینڈر Andreopoulos بعد IBM محققین دو واقعات کے استعمال کی طرف سے تیار ایک نظام نکالا تیزی سے چلتی اشیاء کی IBM TrueNorth کلسٹر کو iniLabs کیمرے، (بھی متحرک وژن سینسر -DVSe کہا جاتا ہے) چپ شاٹس کی رہنمائی ہے جو کاغذ، میں بیان گہرائی.
آئی بی ایم کا مقصد عمودی طور پر توانائی کی کھپت اور کشیدگی کی تصاویر کو حاصل کرنے کی ضرورت ہے. دو DVSe سے تصاویر کے درمیان فرق کا اندازہ کریں اور 3D جگہ میں triangulation کی طرف سے اشیاء کو تلاش کریں.
نیوروورفیک سٹیریو تصاویر (ماخذ: آئی بی ایم)
ڈیٹا کی بازیابی اور پروسیسنگ
ایک نیا فرانسیسی ریکارڈ کمپنی Prophesee کو ڈیٹا قبضہ کرنے neuromorphic ٹیکنالوجی کا استعمال نہیں ہے اور اعداد و شمار کی رقم سینسر کی طرف سے جمع کو کم کر دیتا؛ کمپنی کی سینسر ٹیکنالوجی فریم بنیادوں کو خبر نہیں ہے، لیکن ترتیب میں آسان بنانے کے لئے اور ڈیٹا کے استعمال کے لئے ایک مناسب مشین پیدا کرنے کے لئے ڈیزائن مقصد Prophesee نے پہلے EE ٹائمز کے ساتھ CEO انٹرویو اس بوجھ کو نمایاں طور پر ڈیٹا کی رقم کو کم کرنے، تاکہ گاڑی تقریبا اصل وقت فیصلے کرنے کے قابل ہونا چاہئے کی اجازت کر سکتے ہیں کہ کہا گیا.
لیکن آئی بی ایم سٹیریو وژن کے نظام کی ایک نئی نسل گا نہ صرف بھی تین جہتی تصاویر کی تعمیر نو کے لئے ڈیٹا کی پروسیسنگ میں استعمال کے اعداد و شمار کی گرفتاری، انسانی دماغ ٹیکنالوجی کی طرح؛ Andreopoulos نظام کی سب سے بڑی کامیابیوں میں سے ایک TrueNorth ذریعے تاکہ پروگرام ہے کہا کی موثر کارکردگی. IBM نے مزید کہا 'عام subroutines (subroutines) کے عصبی نیٹ ورک بیں وژن ضروری قسم spikes کے' کہ روایتی نظام کے مقابلے میں، TrueNorth کم طاقت چپ فن تعمیر، یہ autopilot نظام کو آسان ہو جائے گا جس ڈیزائن.
اسی طرح، کیمرے DVS (غیر فارمولا معلومات بلاک) کی ایک جوڑی کا استعمال کرتے ہوئے اعداد و شمار اور طاقت کے استعمال کی مقدار کو کم کر سکتے ہیں اور اس کی رفتار، کم تاخیر، بہتر متحرک رینج میں اضافہ، لیکن ان اہم عناصر IBM فوری نظام کے ڈیزائن کہا ہے. نئے نظام کے ساتھ ساتھ ان لوگوں کے فوائد TrueNorth کے بارے میں پوچھا جب، Andreopoulos تازہ ترین CPU / GPU پروسیسر یا FPGA استعمال کرتے ہوئے روایتی نظام، پکسل تفاوت طاقت (فی پکسل تفاوت نقشہ پاور) میں سے ہر ایک نقشے پر دو مرتبہ کے مقابلے میں، نے کہا بہتری.
پروسیسنگ کے لئے 9 TrueNorth چپس، فی 400 تفاوت نقشہ حساب کیا جا سکتا ایونٹ کی بنیاد پر ان پٹ کا استعمال کرتے ہوئے، کھانا کھلانے IBM سسٹم اصل وقت کی تصویر کے اعداد و شمار کی جاتی ہے، صرف کی طرف سے، 11 ملی سیکنڈز (MS) میں تاخیر. IBM اخبار میں بیان کیا گیا ہے کسی خاص tradeoff کے (ٹریڈ آف) کی طرف سے، نظام کو مزید فی سیکنڈ تفاوت نقشہ 2،000 فریم کی شرح کو بڑھانے کے کر سکتے ہیں.
؟ سٹیریو وژن نظام جو Andreopoulos کہا کمرشل جا سکتا ہے جب کا استعمال کرتے ہوئے TrueNorth چپس: 'ہم وقت میں نقطہ افشاء صرف اتنا کہہ سکتے ہیں کہ ہم نے تجربہ کیا گیا ہے اور کامیابی سے تفاوت نقشہ کے ساتھ مؤثر طریقے سے نمٹنے کے لئے چپ پروگرام نہیں کر سکتے ہیں، تصور مرحلے کا ایک ثبوت ہے.'
آرکائیو: جوڈت چیانگ