CBIR: Content Based Image Retrieval

بازیابی تصویر محتوا محور

CBIR: Content Based Image Retrieval

بازیابی تصویر محتوا محور

مقاله "بررسی تکنیک های استخراج ویژگی شکل"

این مقاله توسط مینگگیانگ یانگ، کیدیو پالما و جوزف رانسین در سال 2010 تهیه شده است و یک مقاله مروری است در خصوص بررسی تکنیک های موجود برای استخراج ویژگی های اشیاء به منظور شناسایی شباهت بین آنها و در نهایت طبقه بندی و دسته بندی اشیاء متناظر. از کنفوسیوس فیلسوف چینی از حدود 2500 سال قبل نقل شده که "یک تصویر به اندازه هزاران کلمه ارزش دارد."

در حال حاضر، قدرت کلمات به طور کلی شناخته و درک شده است. یک تصویر می تواند همانند یک جادو به سرعت یک داستان پیچیده و یا مجموعه ای از ایده ها را برای بیننده یادآوری نماید.

اطلاعات بصری نقش مهمی در جامعه ما ایفا می کند و نیاز به رشد بیشتر این منابع وجود دارد. تصاویر در بسیاری از زمینه های کاربردی مانند معماری، مد، روزنامه نگاری، تبلیغات، سرگرمی و غیره استفاده می شود. بنابراین این فرصت را برای ما فراهم می کند تا از فراوانی تصاویر استفاده کنیم. در مواجهه با این حجم عظیم از تصاویر رو به افزایش، نحوه جستجو و بازیابی تصاویری که ما به آنها علاقه مندیم  یک مشکل اصلی است از این رو نیاز به سیستم های بازیابی تصویر به وضوح احساس می شود. همانطور که می دانیم، ویژگی های بصری تصاویر، شرح محتوای آنها را ارائه می دهند. بازیابی تصویر مبتنی بر محتوا (CBIR) به عنوان یک راهکار امیدوارکننده برای بازیابی تصاویر و مرور تصاویر پایگاه داده های بزرگ به نظر می رسد.  CBIR موضوع انجام تحقیقات بسیاری در سال های اخیر بوده است که در واقع روند بازیابی تصاویر از یک مجموعه بر اساس ویژگی های آن تصویر است.

در این مقاله نویسنده بر ارائه رویکردهای موجود برای استخراج ویژگی های مبتنی بر شکل تمرکز دارد.
ویژگی های شفاف و اساسی مانند:

شناسایی: اشکالی که توسط انسان مشابه شناخته می شوند دارای ویژگی های مشابه و متفاوت با سایر اشیا هستند.

چرخش و تغییرمقیاس: مکان و چرخش شکل نباید بر ویژگی های استخراج شده تاثیر بگذارد.

مقاومت به نویز: ویژگی ها باید در برابر نویز مقاوم باشند.

زمانی که برخی از قسمت های یک شکل توسط اشیاء دیگر مسدود می شوند، ویژگی بخش باقی مانده نباید نسبت به شکل اصلی تغییر کند.

از لحاظ آماری مستقل: دو ویژگی باید از نظر آماری مستقل باشند و به هم وابستگی نداشته باشند.

قابلیت اعتماد: تا زمانی از یک الگواستفاده می شود ویژگی های استخراج شده نباید تغییر کنند و می بایست ثابت باید باقی بمانند.

 

به طور کلی، توصیف کننده شکل، مجموعه ای از اعداد است که برای توصیف یک ویژگی شکل مشخص تولید می شوند.
یک توصیفگر تلاش می کند تا شکل را با روش هایی که با حواس انسان مطابقت دارد و برای انسان قابل فهم است اندازه گیری کند. دقت بازیابی یک توصیفگر می بایست بتواند از یک پایگاه داده شکلهای مشابه را پیدا کند. معمولا توصیفگرها به صورت یک بردار هستند و توصیفگرهای شکل باید شرایط زیر را داشته باشند:

توصیفگرها باید تا حد ممکن کامل باشند تا محتوای آیتم های اطلاعاتی را بیان کنند.

توصیفگرها باید به صورت فشرده نمایش داده و ذخیره شوند. اندازه بردار توصیفگر نباید بیش از حد بزرگ باشد.

نحوه محاسبه توصیفگرها باید ساده باشد در غیر این صورت زمان اجرا برای شناسایی عناصر مشابه خیلی طول خواهد کشید.

 

استخراج ویژگی شکل نقش مهمی در دسته بندی های زیر دارد:

بازیابی شکل: جستجو برای تمام اشکال موجود در یک پایگاه داده که شبیه به شکل مورد جستجومی باشند. معمولا تمام اشکالی که  در یک فاصله معین از پرس و جو مشخص می شوند یا اولین شکل های که کوچکترین فاصله را دارند شناسایی و برگردانده می شوند.

تشخیص شکل و طبقه بندی: تعیین اینکه آیا شکل مشخصی با یک مدل مناسب مطابقت دارد و یا کدام یک از کلاس های نمایشی بیشترین شباهت را دارند.

موقعیت شکل و تثبیت آن: تبدیل یا ترجمه یک شکل به طوری که آن را به بهترین نحو با شکل دیگربه طور کامل و یا بخشی از آن مطابقت دهد

ساده سازی: ساخت یک شکل با عناصر کمتر که هنوز مشابه شکل اصلی باشد.

بسیاری از روش های اندازه گیری و تشریح شکل در گذشته توسعه یافته اند. تعدادی از تکنیک های جدید در سال های اخیر پیشنهاد شده است.

 

سه روش اصلی طبقه بندی متفاوت به شرح زیر وجود دارد:

روش های مبتنی بر محدوده و روش های مبتنی بر منطقه که این طبقه بندی رایج ترین روش طبقه بندی است و توسط MPEG-7 پیشنهاد شده است. و با استفاده از نقاط مرزی شکل در مقایسه با نقاط داخلی شکل مشخص می شود. در هر کلاس دارای چندین زیر کلاس می باشد که این زیر کلاس ها بیانگر این است که آیا شکل به صورت یک کل یا بخش نشان داده شده است.

دامنه فضایی و دامنه تبدیل: در روش ها در حوزه های فضایی، شکل ها را بر اساس نقاط و در تکنیک های مبتنی بر ویژگی مطابق شکل از بردار استفاده می شود.

حفاظت از اطلاعات  IP "Information Preserving"و عدم حفظ اطلاعات NIP "Non-Information Preserving" : روش های IP اجازه می دهد تا بازسازی دقیق شکل با استفاده از توصیفگرهای آن انجام شود در حالی که روش NIP تنها ما را قادر به بازسازی جزئی و مبهم آن می کند.

بر خلاف طبقه بندی سنتی، روش های استخراج و نمایش ویژگی های مبتنی بر شکل بر اساس روش پردازش آنها طبقه بندی می شوند. شکل زیر سلسله مراتب طبقه بندی و روش های استخراج ویژگی را نشان می دهد.

در ادامه نویسندگان به تشریح مختصر هر یک از روش ها و مفاهیم ذکر شده در شکل فوق پرداخته اند. در کل مطالعه این مقاله و منابع آن برای کسانی که تمایل به کار در این حوزه را دارند پیشنهاد می شود.


 لینک دانلود مقاله

پایان نامه "Classification and Clustering of Vector Space Embedded Graphs"

این پایان نامه مربوط به آقای کسپر ریزن می باشد که در سال 2009 در دانشکده فلسفه و علوم طبیعی دانشگاه برن انجام شده است. با توجه به توانایی گراف ها برای نشان دادن خواص مشخصه ها و روابط دوتایی آنها استفاده از گراف در علوم مختلف مشاهده می شود. با این حال، نمودارها هنوز ساختار داده معمول در تشخیص الگو و زمینه های مرتبط را نشان نمی دهند واین به دو دلیل می باشد:

 اولا کار با گراف ها سخت از کار با بردارهای ویژگی است و حتی عملیات پایه ریاضی را نمی توان در یک روش استاندارد برای نمودار تعریف کرد.
ثانیا، زمانی که گراف ها به جای بردارهای ویژگی استفاده می شوند، افزایش قابل توجهی در پیچیدگی بسیاری از الگوریتم ها مشاهده می شود.
در نتیجه، تقریبا هیچ یک از روشهای استاندارد تشخیص الگو برای نمودارها بدون ایجاد تغییر در آنها استفاده نمی شود و لذا کمبود شدید در ابزارهای تشخیص الگو مبتنی بر گراف وجود دارد.

این پایان نامه مربوط به یک رویکرد اساسا جدید جهت به رسمیت شناختن الگوی مبتنی بر گراف بر اساس مکعب فضای بردار گراف است.
در این پایان نامه نویسنده قصد دارد تا قدرت بازنمایی بالا گراف ها را به یک بردار ویژگی های محاسباتی کارآمد و ریاضی قابل استفاده تبدیل کند. بر اساس تعبیه صریح نمودارها، کارکرد تشخیص الگو در نهایت اجرا می شود. از این رو، همه ابزارهای  الگوریتمی به راحتی برای داده های بردار موجود می تواند بر روی نمودارها اعمال شود. ایده کلیدی این است که تفاوت های یک گراف ورودی را به برخی از گراف های پیش نمونه ای به عنوان توصیف درونگر از گراف در نظر  گرفته شود. بدیهی است که با استفاده از این تعبیر، یک فضای بردار را بدست می آوریم که هر محور با یک گراف نمونه اولیه همراه است و مقادیر مختصات یک گراف تعبیه شده، فاصله این نمودار با نمونه های مشخص است.

چارچوب تعبیه گراف اساسا بر محاسبه اختلافات گراف متکی است. علیرغم شرایط سخت ریاضی و محاسباتی در دامنه گراف، روش های مختلفی برای ارزیابی عدم هماهنگی نمودار ها ارائه شده است. در این پایان نامه در واقع از مفهوم فاصله ویرایش گراف برای این کار استفاده می شود.
اساسا، فاصله ویرایش نمودار ها با هدف ایجاد یک اندازه گیری متقارن از تعداد و همچنین شناسایی اختلافات برای تبدیل یک گراف به گراف دیگر استفاده می شود. همانطور که معلوم است، فاصله ویرایش گراف با الزامات کاربردی طیف وسیعی از نمودارها را شامل شده و همچنین سازگاری با دامنه های مختلف دارد. با توجه به این انعطاف پذیری، روش پیشنهادی می تواند تقریبا به هر نوع نمودار اعمال شود. همانطور که در این پایان نامه قید شده، انتخاب نمونه های اولیه یک مسئله حیاتی است. زیرا نه تنها نمونه های اولیه، بلکه تعداد آنها بر روی نقشه گراف و در نتیجه عملکرد الگوریتم تشخیص الگوی مربوطه تاثیر می گذارد. در پایان نامه حاضر، انتخاب های مناسب نمونه اولیه با روش های مختلفی نظیر روش های انتخاب نمونه اولیه، الگوریتم های انتخاب ویژگی، روش های گروه بندی و چندین روش دیگر مورد توجه قرار می گیرند.

در یک بررسی تجربی قدرت و کاربرد چارچوب تعبیه گراف پیشنهادی به صورت تجربی بر روی مجموعه داده 10 نمودار با ویژگی های کاملا متفاوت تایید شده است. نمودار هایی وجود دارد که در برگیرنده اطلاعات نشانگرهای خطی، تصاویر خاکستری، ترکیبات مولکولی، پروتئین ها و صفحات HTML هستند. یافته های اصلی ارزیابی تجربی این است که روش جانمایی با استفاده از اختلافات با طبقه بندی متوالی یا خوشه بندی دارای پتانسیل بسیار بالایی نسبت به رویکردهای سنتی در تشخیص الگوهای مبتنی بر گرافیک است. در حقیقت، این روش بر روی بسیاری از مجموعه داده ها و سیستم هایی که به طور مستقیم بر روی اطلاعات متجانس گراف عمل می کنند بررسی و نتایج آن در اکثر موارد از لحاظ آماری معتبر می باشد.


لینک دانلود پایان نامه

پایان نامه "Image Classification using Bag of Visual Words and Novel COSFIRE"

این پایان نامه مربوط به متهیو گریج دانشجوی کارشناسی از دانشگاه مالتا بوده که در ماه می سال 2016 دفاع شده است.

وظیفه اصلی یک توصیفگر کلیدی این است که نقات کلیدی در یک تصویر را بر اساس فیلترهای COSFIRE که برای تشخیص کلید و تشخیص الگو استفاده می شود شناسایی نماید. یک نقطه کلیدی یک قسمت خاص در یک تصویر است که توسط یک آشکارساز کلیدی و مهم تلقی می شود. نقطه های شناسایی شده توسط توصیفگرهای بصری به طور موثری در مقابل تغییر در شرایط مختلف تصویر مقاوم بوده و نقطه های مختلف را شناسایی می کنند. تجزیه و تحلیل مدل BOVW(Bag of Visual Words) در این پایان نامه انجام شده و با بررسی هر مرحله از این مدل و انتخاب بهترین پیکربندی برای آن، استخراج و توصیف نقاط کلیدی تصویر شروع و در نهایت به طبقه بندی مجموعه داده های تصویرختم می شود. راه حل پیشنهادی، پارامترهای پیکربندی موجود را در نظر گرفته و از فیلترهای COSFIRE به طور موثری برای توصیف نقاط کلیدی استفاده می کنند.
پیکربندی های مختلف توصیفگر COSFIRE در این پروژه پیشنهاد شده و عملکرد آن با سایر توصیف گرهای موجود در [1] مورد ارزیابی قرار گرفته است. آزمایشات در شرایط تصویری مختلف مانند تغییر دید و یا تاری دید در نظر گرفته شده و نتایج آن مورد تحلیل و مقایسه با سایر روش ها قرار گرفته است. بهترین توصیفگر COSFIRE همراه با توصیفگر SIFT[2]   و و BRISK [3]استفاده شده و برای تعیین میزان دقت آنها از مدل BoVW  استفاده شده است. عملکرد توصیفگر COSFIRE-336 بهترین نتایج عملکرد را در بین روش های  پیشنهادی و مقایسه با عملکرد SIFT و توصیفگرهای BRISK برای شرایط تصویری مختلف در این پروژه بدست آورد. توصیفگر COSFIRE-336  در هنگام ارزیابی با استفاده از مدل BoVW، میزان دقت قابل توجهی را در یک مجموعه داده شامل 15 دسته مختلف به دست آورد. پیکربندی فیلتر COSFIRE هر نقطه کلید شناسایی شده در یک تصویر را به مجموعه ای از 4 مقدار مختلف (A,B,C,D) نسبت می دهد که این مجموعه با توجه به مقدار اطلاعاتی که برای هر عنصر کلیدی به دست می آید برای هر نقطه کلیدی با سایر نقاط متفاوت است.

با توجه به فیلترهای مختلف COSFIRE یک هیستوگرام برای هر متغیر برای هر مقدار از توصیفگر COSFIRE در نظر گرفته می شود. اولین هیستوگرام برای مقدار A است که تعداد 5 بین مختلف برای آن با مقادیر ذیل در نظر گرفته می شود


و برای پارامتر B مقدار 16 بین که مقادر آن از 0 تا 5.9 با گام 0.4 می باشد. سپس یک شبکه قطبی برای مکان های (A,B) به دست می آید شبکه قطبی به چندین بخش و حلقه از پیش تعریف شده تقسیم شده و چندین ناحیه را بسته به تعداد حلقه ها و بخش های مورد استفاده تولید می کند. اگر برای مثال، مقادیر بخش ها و حلقه ها برای توصیف کننده COSFIRE به ترتیب 4 و 1 باشد، 4 میدان قطبی را تولید می کند که در شکل زیر دیده می شود.


تنظیمات مختلفی بر روی توصیفگر COSFIRE انجام و ارزیابی شد.

اولین گام این روش شامل کسب اطلاعات MSER از هر تصویر است. این اطلاعات شامل مکان دکارتی و مقادیر پارامتر بیضی آن است (به خاطر اینکه ویژگی ها به شکل بیضی تشخیص داده می شوند). از آنجاییکه مناطق مختلف دارای مقادیر مختلف هستند لذا از ساختار کوواریانس افقی استفاده شده تا همه نواحی مناطق کلیدی را به شکل یک حلقه دایره ای با شعاع ثابت تبدیل کند که نتایج آن در شکل ذیل دیده می شود



این توصیفگر همراه با توصیفگر SIFT در مدل طبقه بندی تصویر BoVW برای تجزیه و تحلیل عملکرد و در نهایت تولید و اختصاص کدهایی که در برای تعریف تصاویر از مجموعه داده انتخاب شده است، اجرا می شود.

دسته بندی ها از مجموعه داده Caltech  انتخاب شده که حداقل 108 تصویر درهر دسته وجود دارد و از مجموعه بزرگی برای داده های آموزشی  استفاده شده تا نتیجه بهتری به دست آید. برای این منظور هر طبقه بندی به دو بخش، آموزش و مجموعه داده های آزمایشی تقسیم می شود که در آن نسبت 70 تصویر برای آموزش و 38  عکس برای آزمایش است.

آشکارساز ویژگی [2] که در این مدل طبقه بندی استفاده می شود، عمدتا توسط 3  پارامتر Peak Thresh، Edge Thresh وFirst Octave Index کنترل می شود

به طور پیش فرض، آشکارساز فضای مقیاس هر تصویر را با رزولوشن کامل شروع می کند. شاخص First Octave Index را عدد -1 در نظر گرفته تا فضای مقیاس با وضوح بالاتر بررسی شود و از این رو ویژگی های بسیار کوچک استخراج می شوند.

Edge Thresh  قله های فضای مقیاسرا  DoG (Difference ofGaussian) حذف می کند که انحنای آن ناچیز است و در این پروژه آن را 60 انتخاب کرده اند.

Peak Thresh قله های فضایی مقیاس گاوس DoG را که ارزش کمی دارند، حذف می کند و مقدار آن 5 در نظر گرفته شده است. سپس تصویر به فضای NxN  تقسیم می شودو هیستوگرام آنها به دست می آید. سپس هیستوگرام تمام بخش ها با یکدیگر ترکیب می شوند تا یک هیستوگرام کلی برای نشان دادن تصویر ایجاد شود. این هیستوگرام پس از آن به طول واحد نرمال می شود. سپس از SVM  برای طبقه بندی تصاویر با استفاده از هیستوگرام آنها استفاده شده است. که نتیجه آن در شکل ذیل دیده می شود.



لینک دانلود پایان نامه

 

 
منابع

 

[1] K. Mikolajczyk and C. Schmid, “A performance evaluation of local descriptors,” Pattern Analysis and Machine Intelligence, IEEE Transactions on, vol. 27, no. 10, pp. 1615–1630, 2005.

 

[2] D. G. Lowe, “Distinctive image features from scale-invariant keypoints,” International journal of computer vision, vol. 60, no. 2, pp. 91–110, 2004.


[3] S. Leutenegger, M. Chli, and R. Y. Siegwart, “Brisk: Binary robust invariant scalable keypoints,” in Computer Vision (ICCV), 2011 IEEE International Conference on, pp. 2548–2555, IEEE, 2011.

معرفی کتاب "داده کاوی چند رسانه ای، محاسبات نرم و بیوانفورماتیک"


کتاب داده کاوی چند رسانه ای، محاسبات نرم و بیوانفورماتیک توسط ساشمیتا میترا و تینکو و در انتشارات جان وایلی و پسران در سال 2003 منتشر شده است. انقلاب دیجیتال و رشد اینترنت، باعث شده که حجم زیادی از اطلاعات چند رسانه ای در اطراف ما بوجود آید. این اطلاعات اغلب مخلوط هستند و شامل انواع مختلفی از داده ها مانند متن، تصویر، صوت، گفتار، گرافیک و تصاویر ویدئویی اند که به یکدیگر متصل می شوند. شبکه جهانی وب نقش مهمی در ایجاد داده ها، از نقاط جغرافیایی مختلف داشته و به راحتی برای همه کاربران در سراسر جهان در دسترس است. با این حال، اغلب این اطلاعات برای اکثر کاربران  جذابیت ندارند. مشکل این است که چگونه اطلاعات مفید یا الگوهای مفید را از مجموعه داده های بزرگ استخراج کنیم. داده کاوی به این فرآیند استخراج دانش مربوط می شود.

داده کاوی یک منطقه در حال رشد و توسعه هم در دانشگاه و هم در صنعت است و شامل تحقیقات بین رشته ای و توسعه در حوزه های گوناگون می شود. در زمان حاضر اکتشاف داده های چندرسانه ای و داده کاوی نباید صرفا محدود به استخراج دانش از حجم زیادی از مجموعه داده های با ابعاد بزرگ در پایگاه داده های سنتی باشد. محققان باید به استخراج انواع داده های مختلف، از جمله فرمت های عددی و الفبایی، متن، تصاویر، ویدئو، صدا، سخنرانی، گرافیک بپردازند. کارآیی پایگاههای اطلاعاتی بسیار بزرگ از عملکرد سیستم های داده کاوی آن تأثیر می پذیرد
و در این زمینه فن آوری های فشرده سازی داده ها می توانند نقش مهمی ایفا کند.

با تکمیل پروژه ژنوم انسان، ما دسترسی به پایگاه داده های بزرگ اطلاعات بیولوژیکی را داریم. تجزیه و تحلیل مناسب چنین اطلاعات عظیمی، شامل رمزگشایی ژن ها در DNA و ساختار پروتئینی سه بعدی، در بیوانفورماتیک بسیار مهم است و کاربرد داده کاوی در این حوزه با توجه به چشم انداز نجات انسان در طراحی دارو حائز اهمیت می باشد و مورد توجه بسیار صنعت داروسازی است. هدف از داده کاوی این است که به جای یک راه حل ارزان قیمت، بهترین راه حل با هزینه ای ارزان و مناسب به دست آید. در این راستا مجموعه های فازی، برای عدم قطعیت است  که ذاتا در استدلال های انسانی وجود دارد و شبکه های عصبی مصنوعی برای یادگیری و به حداقل رساندن خطا می باشند.
ما همیشه با مفاهیم و کارکردهای داده کاوی، مانند طبقه بندی، خوشه بندی و قوانین در برنامه های کاربردی چند رسانه ای و بیوانفورماتیک درگیرهستیم.

فصل اول مقدمه ای بر داده کاوی است و شامل توضیحاتی در رابطه با کشف دانش و داده کاوی، فشرده سازی دیتا، بازیابی اطلاعات، خوشه بندی و دسته بندی و مقایسه رشته ها، دیتاورهاوس و استخراج متن و تصاویر می باشد.

در فصل دوم با بحث در مورد محاسبات نرم و ابزارهای مختلف آن، از جمله مجموعه های فازی، شبکه های عصبی مصنوعی، الگوریتم های ژنتیک، تبدیل های موجک، مجموعه های سخت و ترکیبیات آنها همراه با نقش آنها در داده کاوی، دنبال می شود. سپس برخی از موضوعات پیشرفته و جنبه های جدید داده کاوی مربوط به پردازش و بازیابی داده های چند رسانه ای ارائه می شود. این برنامه های کاربردی مستقیم با بازیابی اطلاعات و استخراج متن دارند.

فصل سوم کتاب در خصوص فشرده سازی اطلاعات مالتی مدیا (چند رسانه ای) بحث شده است. روش فشرده سازی استاندارد تصاویر JPEG و الگوریتم های LZ77 و LZ78 و LZW برای فشرده سازی متن مورد مطالعه قرار گرفته است.

فصل چهارم کتاب در رابطه با تطبیق رشته ای و مشکلات آن بحث می کند. الگوریتم های تطبیق رشته خطی مانند کارپ - رابین و بویر- مور مورد بحث قرار گرفته است.

در فصل پنجم در خصوص طبقه بندی در داده کاوی بحث شده و روش های آن مورد مطالعه قرار گرفته است که می توان به روش ID3 ، جنگل بارانی، روش بیزین، نزدیک ترین همسایه ، کوتاهترین مسیر و درخت تصمیم فازی اشاره نمود.

در فصل ششم در رابطه با خوشه بندی در داده کاوی بحث شده است. در این فصل در خصوص اشیاءو Object های عددی، باینری و دسته بندی آنها بحث شده است. خوشبه بندی سلسله مراتبی و الگوریتم های مختلف از جمله C-mode در این بخش بحث شده است.

در فصل هفتم در خصوص قوانین انجمنی ، الگوریتم Priori و قوانین انجمنی فازی بحث می شود.

فصل هشتم در خصوص روش های استخراج با استفاده از محاسبات نرم بحث می شود در این قسمت روش های مدل شبکه عصبی فازی، شبکه عصبی و MLP مورد مطالعه قرارمی گیرد.

در فصل نهم نویسنده در خصوص داده کاوی دیتا های چند رسانه ای بحث می کند. در این بخش نویسنده تکنیک های مربوط به بازیابی متن ، آنالیز متن و بازیابی آن، جستجو بر اساس کلمات کلیدی و بازیابی متن صحبت می کند. نگارنده در این قسمت مسائل مربوط به داده کاوی بر روی تصاویر، بازیابی تصویر بر اساس محتوا، ویژگی های رنگ، بافت و شکل اشاره و آنها را مورد بررسی قرار می دهد. همچنین در این قسمت به روش کاوش ویدئو و MPEG-7 اشاره دارد. در پایان نیز روش کاوش وب و موتورهای جستجو مورد بحث قرار میگیرد.

فصل دهم روش های بیو انفورماتیک مورد مطالعه قرار گرفته و استفاده از آمینو اسید ها و پروتئین ها و ساختار آنها برای کاوش و روش های محاسبات نرم مطالبی ارائه شده است.

 

لینک دانلود کتاب

معرفی کتاب"شناسایی تصویر و طبقه بندی، الگوریتم ها،سیستم ها و برنامه های کاربردی"


شناسایی تصویر و طبقه بندی آن یکی از پرجاذبه ترین زمینه ها در علوم تصویربرداری و مهندسی است. توانایی جایگزینی قابلیت های بصری انسان با یک ماشین بسیار مهم است و کاربردهای متنوعی دارد. ایده اصلی این است که با پردازش داده های به دست آمده از سنسور، صحنه تصویر را بررسی کنیم. چنین دستگاه هایی می توانند بطور قابل توجهی حجم کار را کاهش داده و دقت تصمیم گیری توسط اپراتورهای انسانی را در زمینه های مختلف از جمله سیستم های نظامی و دفاعی، مهندسی پزشکی، نظارت بر سلامت، جراحی، سیستم های حمل و نقل هوشمند، تولید، روباتیک، سرگرمی و سیستم های امنیتی بهبود بخشد.

تشخیص تصویر و طبقه بندی آن یک زمینه فعالیت چند رشته ای است و مستلزم بهره گیری از فن آوری های متنوع و تخصصی در سنسورها، الگوریتم های پردازش سیگنال / تصویر، VLSI، سخت افزار و نرم افزار و سیستم های بسته بندی می باشد. در بعد نظامی منابع قابل توجهی در این زمینه صرف شده است چون تشخیص درست تصویر و طبقه بندی آنها برای پرسنل نظامی درعملیات، به منظور شناسایی صحیح و تشخیص هدف بسیار ضروری است.

در گذشته، بیشتر برنامه های کاربردی تشخیص و دسته بندی عکس برای سخت افزار های نظامی بوده که هزینه های زیادی نیز برای آنها صرف شده است. با پیشرفت های اخیر در دستگاه های  الکترونیکی نوری، سنسورها، سخت افزار الکترونیکی، کامپیوترها و نرم افزارها، تشخیص تصویر و سیستم های طبقه بندی با بسیاری از برنامه های کاربردی تجاری قابل انجام است. در حالیکه پیشرفت های قابل توجهی در تشخیص تصویر و تکنولوژی های طبقه بندی وجود دارد، مشکلات و چالش های فنی عمده در این زمینه نیز وجود دارد که عمدتا بر اثر شرایط محیطی، تغییرات هندسی، زاویه بازتاب و... است. علاوه بر این، در بسیاری از برنامه های کاربردی، هدف یا جسم مورد علاقه، قسمت کوچکی از یک صحنه بسیار پیچیده است که می بایست کاوش شود تا محل دقیق هدف یا شی مورد نظر مشخص گردد. گاهی اوقات الگوریتم ها با مجموعه ای از داده های آموزشی معتبر وجود دارد که باعث عملکرد بهتر برنامه ها می شود.

این کتاب پیشرفت های مهم اخیر در سنسورها، الگوریتم های پردازش تصویر و سیستم های تشخیص تصویر و طبقه بندی با کاربردهای متنوع در بعد نظامی، هوا فضا، امنیت، ردیابی تصویر، رادار، بیومدیکال و حمل و نقل هوشمند را ارائه می دهد. این کتاب شامل مشارکت برخی از محققان برجسته در زمینه ارائه یک مرور کلی پیشرفت در شناخت و طبقه بندی تصویر در دهه گذشته می شود. این اطلاعات هر دو بعد تئوری و عملی را در بر می گیرد. این کتاب برخی از رویکردهای پیشرفته در زمینه تشخیص تصویر با استفاده از پردازش تصویر، فیلترینگ تصویر غیرخطی، نظریه آماری، نظریه تشخیص بیزی، شبکه عصبی و تصویربرداری سه بعدی را نشان می دهد. در حال حاضر هیچ تکنیک کلی و غالبی وجود ندارد که بتواند برای تمامی مسائل به کار رفته و مشکلات طبقه بندی را حل کند. این کتاب به برخی از زمینه های ابتدایی در پردازش سیگنال / تصور نیز پرداخته که برای مهندسان برق و کامپیوتر با گرایش پردازش سیگنال / تصویر، مهندسین کامپیوتر، تصویربرداران، مهندسان زیست پزشکی، فیزیکدانان کاربردی،تکنسین های سیستم های دفاعی و دانشجویان و محققان این رشته ها مفید می باشد.

در قسمت اول کتاب روش های تشخیص و شناسایی اهداف مطرح و راههای شناسایی آنها بر اساس مقالات موجود به شرح ذیل مطرح می شود

1- آشکارسازهای هدف مبتنی برشبکه عصبی برای تصویربرداری مادون قرمز چند باندی

2- تبعیض هدفمند مادون قرمرمنفعل

3- تشخیص اشیاء در تصاویر SAR

4- تشخیص لبه و مکان در تصاویر SAR: مشارکت مدل های قابل اصلاح آماری

5- تشخیص خودروهای نظامی با استفاده از تصاویر مبتنی بر مشاهده با استفاده از مدل سازگار با مدل CAD

6- اعوجاج ثابت حداقل میانگین مربع خطا الگوریتم فیلتر برای تشخیص الگو

در قسمت دوم راههای تشخیص تصویر سه بعدی مطرح می شود که عبارتند از:

7- ارتباط الکترو نوری برای تشخیص الگو سه بعدی

8-  تشخیص سه بعدی با استفاده از هولوگرافی دیجیتال

قسمت سوم: سیستم های تشخیص تصویر غیرخطی مورد بحث قرار می گیرد

9- اعوجاج تحمل شناخت تصویر گیرنده با استفاده از یک روش چند فرضیه ای

10-  شناخت الگوی همبستگی: رویکرد بهینه ابشیج محالنوبیس

11- فیلتر غیرخطی مطلوب برای شناسایی اهداف تحریف شده پر سر و صدا

12- مینیمم نرم برای فیلتر مقاوم به خطا به منظور شناسایی تصویر

در بخش چهارم: کاربرد تجاری سیستم های تشخیص تصویر مورد مطالعه قرار می گیرد

13- تشخیص چهره مبتنی بر تصویر: مسائل و روشها

14- تکنیک های پردازش تصویر برای شناسایی خودکار و ردیابی خودکار

15- توسعه ابزارهای تشخیص الگو در برنامه های کاربردی براساس الگوریتم انتخاب فرکانس فضایی اتوماتیک

 

لینک دانلود کتاب