CBIR: Content Based Image Retrieval

مقاله "بررسی تکنیک های استخراج ویژگی شکل"

این مقاله توسط مینگگیانگ یانگ، کیدیو پالما و جوزف رانسین در سال 2010 تهیه شده است و یک مقاله مروری است در خصوص بررسی تکنیک های موجود برای استخراج ویژگی های اشیاء به منظور شناسایی شباهت بین آنها و در نهایت طبقه بندی و دسته بندی اشیاء متناظر. از کنفوسیوس فیلسوف چینی از حدود 2500 سال قبل نقل شده که "یک تصویر به اندازه هزاران کلمه ارزش دارد."

در حال حاضر، قدرت کلمات به طور کلی شناخته و درک شده است. یک تصویر می تواند همانند یک جادو به سرعت یک داستان پیچیده و یا مجموعه ای از ایده ها را برای بیننده یادآوری نماید.

اطلاعات بصری نقش مهمی در جامعه ما ایفا می کند و نیاز به رشد بیشتر این منابع وجود دارد. تصاویر در بسیاری از زمینه های کاربردی مانند معماری، مد، روزنامه نگاری، تبلیغات، سرگرمی و غیره استفاده می شود. بنابراین این فرصت را برای ما فراهم می کند تا از فراوانی تصاویر استفاده کنیم. در مواجهه با این حجم عظیم از تصاویر رو به افزایش، نحوه جستجو و بازیابی تصاویری که ما به آنها علاقه مندیم  یک مشکل اصلی است از این رو نیاز به سیستم های بازیابی تصویر به وضوح احساس می شود. همانطور که می دانیم، ویژگی های بصری تصاویر، شرح محتوای آنها را ارائه می دهند. بازیابی تصویر مبتنی بر محتوا (CBIR) به عنوان یک راهکار امیدوارکننده برای بازیابی تصاویر و مرور تصاویر پایگاه داده های بزرگ به نظر می رسد.  CBIR موضوع انجام تحقیقات بسیاری در سال های اخیر بوده است که در واقع روند بازیابی تصاویر از یک مجموعه بر اساس ویژگی های آن تصویر است.

در این مقاله نویسنده بر ارائه رویکردهای موجود برای استخراج ویژگی های مبتنی بر شکل تمرکز دارد.
ویژگی های شفاف و اساسی مانند:

شناسایی: اشکالی که توسط انسان مشابه شناخته می شوند دارای ویژگی های مشابه و متفاوت با سایر اشیا هستند.

چرخش و تغییرمقیاس: مکان و چرخش شکل نباید بر ویژگی های استخراج شده تاثیر بگذارد.

مقاومت به نویز: ویژگی ها باید در برابر نویز مقاوم باشند.

زمانی که برخی از قسمت های یک شکل توسط اشیاء دیگر مسدود می شوند، ویژگی بخش باقی مانده نباید نسبت به شکل اصلی تغییر کند.

از لحاظ آماری مستقل: دو ویژگی باید از نظر آماری مستقل باشند و به هم وابستگی نداشته باشند.

قابلیت اعتماد: تا زمانی از یک الگواستفاده می شود ویژگی های استخراج شده نباید تغییر کنند و می بایست ثابت باید باقی بمانند.

 

به طور کلی، توصیف کننده شکل، مجموعه ای از اعداد است که برای توصیف یک ویژگی شکل مشخص تولید می شوند.
یک توصیفگر تلاش می کند تا شکل را با روش هایی که با حواس انسان مطابقت دارد و برای انسان قابل فهم است اندازه گیری کند. دقت بازیابی یک توصیفگر می بایست بتواند از یک پایگاه داده شکلهای مشابه را پیدا کند. معمولا توصیفگرها به صورت یک بردار هستند و توصیفگرهای شکل باید شرایط زیر را داشته باشند:

توصیفگرها باید تا حد ممکن کامل باشند تا محتوای آیتم های اطلاعاتی را بیان کنند.

توصیفگرها باید به صورت فشرده نمایش داده و ذخیره شوند. اندازه بردار توصیفگر نباید بیش از حد بزرگ باشد.

نحوه محاسبه توصیفگرها باید ساده باشد در غیر این صورت زمان اجرا برای شناسایی عناصر مشابه خیلی طول خواهد کشید.

 

استخراج ویژگی شکل نقش مهمی در دسته بندی های زیر دارد:

بازیابی شکل: جستجو برای تمام اشکال موجود در یک پایگاه داده که شبیه به شکل مورد جستجومی باشند. معمولا تمام اشکالی که  در یک فاصله معین از پرس و جو مشخص می شوند یا اولین شکل های که کوچکترین فاصله را دارند شناسایی و برگردانده می شوند.

تشخیص شکل و طبقه بندی: تعیین اینکه آیا شکل مشخصی با یک مدل مناسب مطابقت دارد و یا کدام یک از کلاس های نمایشی بیشترین شباهت را دارند.

موقعیت شکل و تثبیت آن: تبدیل یا ترجمه یک شکل به طوری که آن را به بهترین نحو با شکل دیگربه طور کامل و یا بخشی از آن مطابقت دهد

ساده سازی: ساخت یک شکل با عناصر کمتر که هنوز مشابه شکل اصلی باشد.

بسیاری از روش های اندازه گیری و تشریح شکل در گذشته توسعه یافته اند. تعدادی از تکنیک های جدید در سال های اخیر پیشنهاد شده است.

 

سه روش اصلی طبقه بندی متفاوت به شرح زیر وجود دارد:

روش های مبتنی بر محدوده و روش های مبتنی بر منطقه که این طبقه بندی رایج ترین روش طبقه بندی است و توسط MPEG-7 پیشنهاد شده است. و با استفاده از نقاط مرزی شکل در مقایسه با نقاط داخلی شکل مشخص می شود. در هر کلاس دارای چندین زیر کلاس می باشد که این زیر کلاس ها بیانگر این است که آیا شکل به صورت یک کل یا بخش نشان داده شده است.

دامنه فضایی و دامنه تبدیل: در روش ها در حوزه های فضایی، شکل ها را بر اساس نقاط و در تکنیک های مبتنی بر ویژگی مطابق شکل از بردار استفاده می شود.

حفاظت از اطلاعات  IP "Information Preserving"و عدم حفظ اطلاعات NIP "Non-Information Preserving" : روش های IP اجازه می دهد تا بازسازی دقیق شکل با استفاده از توصیفگرهای آن انجام شود در حالی که روش NIP تنها ما را قادر به بازسازی جزئی و مبهم آن می کند.

بر خلاف طبقه بندی سنتی، روش های استخراج و نمایش ویژگی های مبتنی بر شکل بر اساس روش پردازش آنها طبقه بندی می شوند. شکل زیر سلسله مراتب طبقه بندی و روش های استخراج ویژگی را نشان می دهد.

در ادامه نویسندگان به تشریح مختصر هر یک از روش ها و مفاهیم ذکر شده در شکل فوق پرداخته اند. در کل مطالعه این مقاله و منابع آن برای کسانی که تمایل به کار در این حوزه را دارند پیشنهاد می شود.


 لینک دانلود مقاله

نظرات (0)
نام :
ایمیل : [پنهان میماند]
وب/وبلاگ :
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)