CBIR: Content Based Image Retrieval

بازیابی تصویر محتوا محور

CBIR: Content Based Image Retrieval

بازیابی تصویر محتوا محور

پایان نامه "کارایی بازیابی تصویر بر اساس محتوا"

این پایان نامه مربوط به روبا سلامه دانشجوی کارشناسی ارشد مهندسی کامپیوتر از دانشگاه غزه و در سال 2010 می باشد.

بازیابی تصویر مبتنی بر محتوا از منابع بزرگ، امروزه در بسیاری از برنامه های کاربردی مورد استفاده قرار می گیرد. در این پایان نامه یک سیستم بازیابی تصویر مبتنی بر منطقه استفاده شده که از رنگ و بافت به عنوان ویژگی های بصری برای توصیف محتوای منطقه تصویر استفاده می کند.
برای این منظور سه مرحله کار انجام می شود:

در مرحله اول از فیلترهای گابور برای استخراج ویژگی های بافت مناطق جدا شده از تصویر پس از تقسیم بندی استفاده می شود.

در مرحله دوم، برای سرعت بخشیدن به بازیابی و محاسبه شباهت، تصاویر پایگاه داده تقسیم می شوند و مناطق استخراج شده با استفاده از بردارهای ویژگی آنها با استفاده از الگوریتم SOM[1] خوشه بندی می شوند. این فرآیند قبل از پردازش پرس و جو انجام می شود بنابراین برای پاسخ دادن به پرس و جو، سیستم نیازی به جستجو در کل تصاویر پایگاه داده ندارد. در عوض فقط تعدادی از تصاویر کاندید برای جستجوی تشابه تصویر مورد نیاز است.

در مرحله سوم، برای افزایش دقت بازیابی سیستم، ویژگی های منطقه های استخراج شده از مناطق تصویر  با ویژگی های استخراج شده از کل تصویر ترکیب می شوند که این اطلاعات از فیلتر های گابور و هیستوگرام رنگی حاصل شده است.

سیستم پیشنهادی افزایش دقت بازیابی و کاهش زمان بازیابی را دارا است. برای ارزیابی تجربی سیستم از پایگاه داده تصویری COREL و تعداد 1000 تصویر رنگی استفاده شده است. از نتایج تجربی، واضح است که سیستم در مقایسه با سایر سیستم های موجود به طور قابل توجهی بهتر و سریعتر عمل می کند. نتایج نشان می دهد که هر نوع ویژگی برای نوع خاصی از تصاویر با توجه به محتوای معنایی آن موثر است و با استفاده از ترکیب آنها نتایج بهتری برای تمام کلاس های معنایی فراهم می آید.

در پایگاه داده پلیس اطلاعات تصویری مجرمان، صحنه های جرم و موارد سرقت شده نگهداری می شود. در حرفه پزشکی، پایگاه داده تصویری اشعه ایکس و اسکن شده برای تشخیص، نظارت و اهداف تحقیق نگهداری می شود. در طراحی معماری و مهندسی، پایگاه داده تصویری برای پروژه های طراحی، پروژه های به پایان رسیده و قطعات ماشین وجود دارد. در صنعت نشر، روزنامه نگاران پایگاه تصویری را برای رویدادهای مختلف و فعالیت هایی مانند ورزش، ساختمان ها، شخصیت ها، رویدادهای ملی و بین المللی و تبلیغات محصول ایجاد می کنند. برای تحقیقات تاریخی، پایگاه داده تصویری برای آرشیوهایی در زمینه هایی مانند هنر، جامعه شناسی و پزشکی ایجاد می شود. در یک مجموعه کوچک از تصاویر، با یک مرور ساده می توان یک تصویر را شناسایی کرد. این کار برای مجموعه ای بزرگ و متنوع از تصاویر امکان پذیر نیست و کاربر با مشکل در بازیابی تصویر مواجه می شود. مشکل بازیابی تصویر زمانی است که کاربر درخواستی را برای جستجو تصویر به پایگاه داده ارسال می کند که برای برفع این مشکل دو راه کار مبتنی بر متن و مبتنی بر محتوا ارائه شده است. در روش مبتنی بر متن از کلمات کلیدی و شرح هایی برای برچسب گذاری تصاویر استفاده می شود و جستجو بر اساس آنها صورت می گیرد. در روش مبتنی بر محتوا مشخصات فنی و کلیدی تصاویر استخراج و از آنها برای مقایسه شباهت استفاده می گردد. سیستم های تولید شده برای منظور های مختلف از کلمات کلیدی خاص استفاده می نمایند. بازیابی تصویر بر اساس محتوا در بسیاری از برنامه های کاربردی مانند تبلیغات، تحقیقات تاریخی، طراحی مد و گرافیک، طراحی معماری و مهندسی، پیشگیری از جرم، تشخیص پزشکی، اطلاعات جغرافیایی و سیستم های سنجش از دور کاربرد دارد.

سیستم های CBIR تجاری و تجربی متعددی در حال حاضر در دسترس هستند و بسیاری از موتورهای جستجو در حال حاضر از امکانات CBIR  مانند آلتا ویستا، یاهو و گوگل استفاده می نمایند.

بازیابی مبتنی بر محتوا از محتویات تصاویر برای نشان دادن و دسترسی به تصاویر استفاده می کند. یک چارچوب مفهومی برای بازیابی تصویر مبتنی بر محتوا در شکل ذیل نشان داده شده است.

 


در مرحله آفلاین، سیستم به طور خودکار عناصر بصری (رنگ، ​​شکل، بافت، و اطلاعات فضایی) هر تصویر در پایگاه داده را بر اساس مقادیر پیکسل آن استخراج می کند و آنها را در پایگاه داده های مختلف درون سیستم به نام پایگاه داده های ویژگی ذخیره می کند. داده های ویژگی (به عنوان امضا تصویر) برای هر یک از ویژگی های بصری هر تصویر در مقایسه با داده های تصویر بسیار کوچک است، بنابراین پایگاه داده ویژگی شامل انتزاعی از تصاویر پایگاه داده تصویر است. میزت این روش فشرده سازی قابل توجهی تصویر است.

در بازیابی تصویر آنلاین، کاربر می تواند یک تصویر را برای جستجو به سیستم بازیابی ارسال کند. سیستم این تصویر را با یک بردار ویژگی نشان می دهد سپس فاصله ها (یعنی شباهت ها) بین بردارهای ویژگی نمونه مورد پرس و جو را با نمونه های موجود در پایگاه داده ویژگی ها محاسبه و رتبه بندی می کند و در نهایت، سیستم نتایجی را که بیشتر به نمونه های پرس و جو مربوط است را باز می گرداند. اگر نتایج مورد تایید کاربر نباشد، می تواند بازخورد مربوط را به سیستم بازیابی ارائه دهد

در روش های CBIR اولیه از استخراج ویژگی های عمومی برای به دست آوردن توصیفگرهای تصویر استفاده شده است. به عنوان مثال، QBIC در مرکز تحقیقاتی IBM توسعه یافته است و چندین ویژگی از هر تصویر، یعنی رنگ، بافت و ویژگی های شکل را استخراج می کند. این توصیفگرها با استفاده از هیستوگرام های رنگی برای ویژگی های رنگ، با استخراج اطلاعات، در سطح عمومی به دست می آیند. به همین ترتیب، سیستم Photobook ، Visualseek  و VIR  از ویژگی های عمومی برای نشان دادن معانی تصویر استفاده می کنند. به عنوان مثال، فرض کنید در یک تصویر دو گل با رنگ های قرمز و زرد وجود دارد. ویژگی های عمومی بر اساس رنگ بیانگر میانگین رنگ موجود است که در نهایت تصویر یک پرتقال بازگردانده می شود که این نمونه ضعف ویژگی های عمومی را نشان می دهد.

سیستم های بازیابی تصویر بر اساس منطقه  RBIR[2] برای غلبه بر محدودیت های پیشین سیستم های بازیابی مبتنی بر ویژگی های عمومی تشکیل شده اند که در آن تصاویر به عنوان مجموعه ای از مناطق است که ممکن است با اشیائی مانند گل ها، درختان، آسمان ها و کوه ها مطابقت داشته باشد. یک پیش نیاز کلیدی برای یک سیستم بازیابی تصویر مبتنی بر منطقه یک الگوریتم تقسیم بندی قوی است.

الگوریتم تقسیم بندی یک تصویر ورودی را دریافت و با توجه به برخی ویژگی ها (مانند رنگ، بافت یا شکل)  آن را به خوشه ها و بخش هایی تقسیم می کند. سپس ویژگی های ربوط به هر بخش تصویر استخراج می شوند. ویژگی های رنگ، بافت و شکل بر اساس هر پیکسل که متعلق به شیء است، استخراج می شود و هر شی به وسیله مقدار میانگین این ویژگی پیکسل ها توصیف می شود.

مشکل اصلی در سیستم های CBIR  شکاف معنایی و بار محاسباتی آن برای مدیریت مجموعه پایگاه داده های بزرگ و تصاویر بزرگ است.

در این پایان نامه یک سیستم CBIR جدید معرفی شده که هدف آن:

الف- کاهش "اختلاف معنایی" بین ویژگی های سطح پایین تصویر و مفاهیم انسانی است
ب-  برای کاهش کل زمان بازیابی سیستم در ابتدا تصاویر را به مناطق تقسیم می کند که اشیاء در آن وجود دارند.
ترکیبی از بافت و ویژگی های رنگ از هر منطقه در تصویر جداگانه استخراج می شود.

 

عملکرد روش کار به این شکل است :

1-  ویژگی های شطح پایین بافت از مناطق دلخواه شکل با استفاده از فیلتر گابور استخراج می شود که یک ابزار طبیعی و عالی برای طبقه بندی، جداسازی و استخراج ویژگی های بافت است. بسیاری از سیستم های موجود تلاش می کنند که تصویر پرس و جو را با هر تصویر موجود در پایگاه داده مقایسه کنند تا تصاویر با تطبیق پذیری بالا را پیدا کنند که در نتیجه یک جستجوی خطی اتفاق افتاده و زمانی که پایگاه داده بزرگ است زمان زیادی را صرف می کند. در حقیقت، ممکن است قبل از اینکه یک پرس و جو ایجاد شود، از اطلاعات قبلی در رابطه با ساختار تصاویر موجود در پایگاه داده استفاده و وقتی یک پرس و جو دریافت می شود تنها بخشی از پایگاه داده باید جستجو شود در حالی که بخش بزرگی از پایگاه داده ممکن است در جستجو حذف شود که قطعا موجب صرفه جویی قابل توجهی در زمان پردازش شده بدون اینکه دقت بازیابی را تحت تاثیر قرار دهد.

2- برای سرعت بخشیدن به فرآیند بازیابی، تصاویر پایگاه داده به مناطق متمایز تقسیم می شوند. در این پایان نامه از الگوریتم خوشه بندی خود سازماندهی SOM برای خوشه سازی استفاده می شود. مناطق با ویژگی های مشابه با هم در یک کلاس گروه بندی می شوند. این فرآیند خوشه سازی به صورت آفلاین انجام و داده های نمایه سازی هر منطقه همراه با شناسه کلاس مرتبط آن در فایل های شاخص  وبه صورت اندیس ثبت می شود. برای پاسخ به پرس و جو، تصویر پرس و جو به مناطقی تقسیم می شود و فاصله های بین هر منطقه و کلیه کلاس ها در پایگاه داده محاسبه می شود تا مشخص شود ایت تصویر به کدام کلاس متعلق است. سپس مناطق مشابه در پایگاه داده بازگردانده شده و تمام تصاویرآن با تصویر داده شده مقایسه می شود.

3- برای افزایش کارایی سیستم، از یک الگوریتم جستجوی عمومی که از تمام تصویر برای ساختن فاصله بین دو تصویر استفاده می شود. این الگوریتم با الگوریتم جستجوی مبتنی بر منطقه با استفاده از مجموع وزنی دو فاصله ترکیب شده و از این طریق از خواص مناطق تصویری مرتبط با خواص عمومی تصویر برای محاسبه شباهت بین یک پرس و جو و تصاویر پایگاه داده استفاده شده است.

4- سپس نتایج با نتایج روش های موجود مقایسه شده و نتایج نشان می دهد که سیستم توسعه یافته در این پایان نامه، کیفیت کلی بازیابی را نسبت به سیستم های موجود قبلی بهبود می بخشد.

در ادامه این  پایان نامه موارد ذیل را خواهیم دید در فصل 2 خلاصه برخی از آثار مرتبط در موضوع CBIR و مسائل مربوط به تحقیقات اولیه مطرح شده است. در فصل 3، یک مرور کلی بر روی  سیستم های  CBIR، اصول آن و تکنیک های مورد استفاده برای استخراج ویژگی ها، اندازه گیری شباهت و ساختارهای نمایه سازی معرفی شده است. از فیلترهای گابور، برای استخراج ویژگی در سیستم پیشنهادی استفاده شده که در فصل 4 مورد بحث قرار می گیرد. برای بررسی سیستم از پایگاه داده WANG در کلاس های ذیل استفاده شده است.

توسعه بازیابی مبتنی بر ویژگی های عمومی و سیستم های بازیابی مبتنی بر منطقه به ترتیب در فصل 5 و 6 معرفی شده است. همچنین ترکیبی از دو سیستم به عنوان سیستم پیشنهادی این پایان نامه در فصل 6 ارائه شده است. نتایج شبیه سازی و ارزیابی دو سیستم و همچنین سیستم کلی در فصل 7 توضیح داده شده است و سرانجام در فصل هشتم کار به پایان رسیده و کارهای مرتبط در آینده را پیشنهاد می کند.


لینک دانلود پایان نامه

 

 



[1] Self Organizing Map

[2] Region Based Image Retrieval


نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.