CBIR: Content Based Image Retrieval

مقاله " توصیفگرهای مبتنی بر شبکه عصبی تصادفی برای طبقه بندی شکل "

این مقاله توسط جورباس دیاسی و همکارانش در سال 2017 تهیه شده است. تجزیه و تحلیل شکل یک زمینه بسیار مهم در دید کامپیوتری است. این مقاله یک روش جدید برای تجزیه و تحلیل شکل بر اساس وزن یک شبکه عصبی تصادفی RNN ارائه می دهد. دو روش برای استخراج ویژگی ها پیشنهاد شده است: رویکرد همسایه ها که از فاصله هر پیکسل کناری و پیکسل های مجاور آن استفاده می کند و رویکرد مرزی که که از مدل سازی RNN  استفاده می کند. ضمنا در روش ارائه شده از ترکیب بردارهای ویژگی هر دو رویکرد استفاده شده و  مجموعه ای از ویژگی هایی به دست آمده که در مقابل چرخش و مقیاس پایدار می باشند.

رویکرد مورد نظر با روش های دیگر تحلیل شکل و برای 6 مجموعه داده های مختلف مقایسه شده است که شامل ماهی و برگ در شرایط مختلف است.

تجزیه و تحلیل شکل یک موضوع مورد علاقه و جذاب در بینایی تصویر است. در زندگی روزمره اشیاء بر اساس ویژگی های مهم بصری آن تعریف می شوند و شکل ها به طور گسترده ای در ارتباطات انسانها به دلیل توانایی سیستم بصری در تشخیص آنها مورد استفاده قرار می گیرند. در بینایی کامپیوتری باید از  ویژگی های پایداردر برابر  تغییرات نور و تغییرات رنگ و بافت استفاده شود.

شکل به عنوان یکی از زیر ساخت های اصلی در بسیاری از سیستم های شناخته شده و بازیابی است و در بسیاری از برنامه های کاربردی نقش کلیدی ایفا می کند. استفاده رایج از شکل برای تجزیه و تحلیل و تشخیص نمادها و علامت های تجاری است. برای این منظور روش های همانند PLC[1] وسری زمانی  Zernike و ماتریس هم رخداد[2]  استفاده شده است.

تشخیص تصاویر مبتذل برای فیلتر کردن کار دیگری است که از تجزیه و تحلیل شکل حاصل می شود. در پزشکی نیز از اطلاعات شکل برای هدایت و تقسیم بندی تصاویر بزرگ شده از بافت های حاصل از CT[3] استفاده می شود.

با توجه به اهمیت آن، روش های بسیاری برای استخراج اطلاعات معنی دار از یک شی شکل ارائه شده است. این روش ها معمولا براساس این که ویژگی ها از کچای شکل استخراج شده اند به سه دسته تقسیم می شوند که این دسته بندی ها عبارتند از:

1-  مبتنی بر خطوط، که نشان دهنده روش هایی است که شکل را به عنوان یک مجموعه مرتب شده از نقاط متصل در یک شیء منحنی متصور می کند و از این مجموعه برای توصیف شکل استفاده می شود.

2- روش مبتنی بر منطقه، که شامل روش هایی است که از تصویر شکل برای محاسبه توصیف های آن استفاده می کنند.
3- روش های مبتنی بر اسکلت، که تنها از اطلاعات محوری  شکل برای توصیف و شناخت آن استفاده می کنند.

اخیرا در برخی از روش های از تبدیل رادون، SIFT  و شبکه عصبی کانولوشن برای تحلیل شکل استفاده می نمایند. در تحقیقی که در سال 2016 توسط ماکاتو هاسیگاوا و همکارش انجام شد آنها از تبدیل رادون برای ایجاد یک هیستوگرام برای توصیف شکل استفاده کردند که در آن تطبیق شکل با استفاده از یک ماتریس همبستگی انجام می شد، لذا سیستم در برابر چرخش و مقیاس مقاوم بود. در تحقیقی که توسط وینگان وانگ و همکارانش به منظور کشف و تقسیم کردن اشیاء از زمینه های پیچیده موجود در تصاویر ویدیویی انجام گرفت آنها از یک فلوی SIFT برای کشف و تفکیک بخش های شی در فریم استفاده نمودند.

مدلهای فراگیر یادگیری مبتنی بر شبکه های عصبی کانولوشن ببه منظور تحلیل شکل های مختلف ارائه شده است. وینگان وانگ و همکارش در سال 2016  از یادگیری عمیق برای پاسخ دادن به مشکل خرابی عکس استفاده کردند. آنها همچنین در تحقیقی که در سال 2018 انجام گرفت [27]، یک مدل یادگیری عمیق برای شناسایی مناطق چشمگیر در فیلم ها ارائه نمودند که اطلاعات مکانی و زمانی را تولید می کرد. که بسیار سریع انجام می گرفت.  آنها همچنین در یک کار تحقیقاتی جدید در سال 2018 [28] از  یک شبکه عصبی کانولوشن برای پیش بینی ساختار چشم انسان استفاده نمودند. برای این منظور آنها از یک رویکرد چندمتغیره و استخراج اطلاعات سلسله مراتبی از لایه های شبکه عصبی استفاده نمودند.

در این مقاله از یک شبکه عصبی تصادفی برای محاسبه توصیفگرها از یک خط شکل استفاده کنیم. ایده اصلی این است که از وزن شبکه عصبی به عنوان یک بردار ویژگی برای توصیف و طبقه بندی شکل استفاده شود. در بخش 2 ایده اصلی یک شبکه عصبی تصادفی را توضیح داده می شود و در بخش 3، دو روش برای مدل سازی نقاط به عنوان یک داده ورودی و خروجی برای شبکه عصبی تصادفی به منظور ساخت امضای تصویر نمایش داده می شود نتایج ارزیابی انجام شده در بخش 4 ارائه شده است. برای این ارزیابی، آنها از شش مجموعه داده شامل ماهی، برگ و حالت های مختلف برگ نظیر چرخش، مقیاس و برگ های تغییر شکل داده استفاده نمودند. برای مشخص شدن بهبود روش ارزیابی آنها مقایسه ای با برخی از روش های تحلیل شکل سنتی انجام شده که نتایج آن در بخش 5 ارائه و مورد بحث قرار گرفته است.

 

 

لینک دانلود مقاله

 



[1] pixel-level constraint

[2] co-occurrence matrix

[3] computed tomography

نظرات (0)
نام :
ایمیل : [پنهان میماند]
وب/وبلاگ :
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)