دانلود پایان نامه روش های دسته جمعی نیمه نظارتی برای بینایی کامپیوتر
عنوان فارسی |
روش های دسته جمعی نیمه نظارتی برای بینایی کامپیوتر |
عنوان انگلیسی |
Semi-Supervised Ensemble Methods for Computer Vision |
کلمات کلیدی : |
  یادگیری نیمه نظارتی؛ روش های دسته جمعی؛ بینایی کامپیوتر؛ ردیابی اشیاء |
رشته های مرتبط | مهندسی کامپیوتر |
تعداد صفحات پایان نامه انگلیسی : 189 | دانشگاه : Graz University of Technology |
سال انتشار : 2010 | تعداد رفرنس : 190 |
فرمت فایل ترجمه شده : PDF و WORD قابل ویرایش | کیفیت ترجمه : تخصصی ویژه با کیفیت طلایی |
پاورپوینت :
ندارد سفارش پاورپوینت این پایان نامه |
وضعیت ترجمه : انجام شده و با خرید بسته می توانید فایل ترجمه را دانلود کنید |
1. مقدمه 2. مقدمات و نمادها 3. بررسی اجمالی یادگیری نیمه نظارتی 4. یادگیری شباهت بصری و نیمه بوست 5. بوستینگ نیمه نظارتی آنلاین 6. جنگل های تصادفی نیمه نظارتی 7. جنگل های تصادفی نیمه نظارتی آنلاین 8. یادگیری نمونه ی چندگانه با جنگل های تصادفی 9. ردیابی شی بصری 10. نتیجه گیری
چکیده – دستهبندی و ردیابی اشیاء بصری، دو مسئله اصلی در بینایی کامپیوتر هستند. هر دو وظیفه بسیار پیچیده و هنوز از حل کامل فاصله دارند. پیشرفتهای اخیر در ساخت سیستمهای تشخیص و ردیابی بهتر، عمدتاً از طریق بهبود نمایش دادهها و استفاده از الگوریتمهای یادگیری بهتر حاصل شده است. برای یادگیری، معمولاً الگوریتمهای نظارتی به کار میروند که برای دستیابی به نتایج دقیق، به حجم زیادی از دادههای برچسبگذاری شده دستی نیاز دارند. با این حال، برچسبگذاری دستی وظیفهای دشوار و زمانبر است که مستعد خطاهای انسانی نیز میباشد. علاوه بر این، یادگیری فقط از دادههای برچسبگذاری شده طبیعی نیست و وظایفی مانند ردیابی-توسط-تشخیص وجود دارد که در آن یادگیرندهها باید بتوانند از هر دو دادههای برچسبگذاری شده و بدون برچسب استفاده کنند. همچنین، افزایش تعداد تصاویر دیجیتال موجود در وب و پایگاههای داده آفلاین، برچسبگذاری دستی توسط انسان را تقریباً غیرممکن میکند. بنابراین، ما به تکنیکهای یادگیری نیاز داریم که بتوانند از حجم زیادی از دادههای بدون برچسب با مقدار کمتری از تعامل انسانی استفاده کنند. این ملاحظات منجر به افزایش علاقه به روشهای یادگیری نیمهنظارتی شده است که از مقدار کمی دادههای برچسبگذاری شده و حجم زیادی دادههای بدون برچسب یاد میگیرند. در این پایاننامه، ما چندین رویکرد جدید برای یادگیری نیمهنظارتی با استفاده از روشهای دستهجمعی مانند بوستینگ یا جنگلهای تصادفی پیشنهاد میکنیم و کاربرد آنها را در وظایف مختلف بینایی کامپیوتر نشان میدهیم. دلیل مطالعه روشهای دستهجمعی این است که آنها قدرتمند و سریع هستند و در بسیاری از کاربردهای بینایی کامپیوتر استفاده میشوند. در بخش اول پایاننامه، یک الگوریتم بوستینگ نیمهنظارتی جدید بر اساس یادگیری شباهت بصری پیشنهاد میکنیم و کاربرد آن را در تشخیص اشیاء نشان میدهیم. سپس، این روش را به یادگیری آنلاین گسترش میدهیم. در بخش دوم پایاننامه، یک روش جنگل تصادفی جدید پیشنهاد میکنیم که قادر به یادگیری از هر دو دادههای برچسبگذاری شده و بدون برچسب است. مزایای این رویکرد را هم در چندین وظیفه یادگیری ماشین و هم در دستهبندی اشیاء نشان میدهیم، جایی که روش ما قادر به آموزش یک طبقهبندیکننده چند کلاسه ذاتی به جای چندین طبقهبندیکننده یک-در-برابر-همه است. در فصل بعدی، نشان میدهیم که چگونه جنگلهای تصادفی را به حالت آنلاین گسترش دهیم. همچنین نشان میدهیم که چگونه جنگلهای تصادفی را در یک الگوی یادگیری که بسیار شبیه به یادگیری نیمهنظارتی است، یعنی یادگیری نمونههای چندگانه، به کار ببریم. در نهایت، ما فرض میکنیم که ردیابی اشیاء بصری میتواند به عنوان یک وظیفه یادگیری نیمهنظارتی تک-شات فرموله شود. در آزمایشهای ردیابی، نشان میدهیم که استفاده از روشهای یادگیری نیمهنظارتی و یادگیری نمونههای چندگانه آنلاین پیشنهادی، منجر به نتایج ردیابی پایدارتر و دقیقتر میشود.
Visual object classification and tracking are two of the cardinal problems in computer vision. Both tasks are extremely complicated and far from being solved. Recent advances towards building better detection and tracking systems were mainly achieved by improved representations and applying better learning algorithms. For the learning, usually supervised algorithms are applied which demand large amounts of hand-labeled data in order to yield accurate results. However, hand-labeling is a tedious and time-consuming task, which is also prone to human errors. Additionally, learning only from labeled data is not natural and there exist tasks, such as tracking-by-detection, where the learners have to be able to exploit both labeled and unlabeled data. Also, the growing number of digital images present in the web and off-line databases makes human hand labeling hardly possible. Hence, we need learning techniques that are able to exploit huge amounts of unlabeled data with a reduced quantity of human interaction. These considerations have led to an increased interest in semi-supervised learning methods that learn from a small amount of labeled data and a large amount of unlabeled data. In this thesis, we propose several novel approaches to semi-supervised learning using ensemble methods, such as boosting or random forests, and show their applicability on various computer vision tasks. The reasons for studying ensemble methods is that they are powerful and fast and are already used in many computer vision applications. In the first part of the thesis, we propose a novel semi-supervised boosting algorithm based on visual similarity learning and demonstrate its applicability to object detection. Then, we extend the method to on-line learning. In the second part of the thesis, we propose a novel random forest method that is able to learn from both labeled and unlabeled data. We demonstrate the benefits of the approach on both several machine learning tasks and object categorization where our method is able to train one inherent multi-class classifier rather than several one-versus-all classifiers. In the subsequent chapter, we demonstrate how to extend random forests to on-line mode. We also show how to apply random forests to a learning paradigm that is very similar to semi-supervised learning, i.e., multiple instance learning. Finally, we hypothesize that visual object tracking can be formulated as a oneshot- semi-supervised learning task. In the tracking experiments, we demonstrate that applying the proposed on-line semi-supervised and multiple instance learning methods lead to more stable and higher accurate tracking results.
بینایی کامپیوتر (Computer Vision) یکی از شاخههای هوش مصنوعی است که به کامپیوترها و سیستمها امکان میدهد تا از تصاویر دیجیتال، ویدئوها و سایر ورودیهای بصری، اطلاعات معناداری استخراج کرده و بر اساس آن اطلاعات، تصمیمگیری یا اقدام کنند. به عبارت دیگر، بینایی کامپیوتر به کامپیوترها قدرت “دیدن” و “درک” دنیای اطراف را میدهد، همانطور که انسانها با چشمان خود این کار را انجام میدهند. این حوزه شامل تکنیکها و الگوریتمهایی است که به کامپیوترها امکان میدهد اشیاء را تشخیص دهند، تصاویر را دستهبندی کنند، حرکات را ردیابی کنند و صحنههای پیچیده را تفسیر کنند.
ترجمه این پایان نامه در 147 صفحه آماده شده و در ادامه نیز صفحه 122 آن به عنوان نمونه قرار داده شده است که با خرید این محصول می توانید، فایل WORD و PDF آن را دریافت نمایید.
محتوی بسته دانلودی:
فایل PDF پایان نامه انگلیسی فایل ورد قابل ویرایش (WORD) و PDF ترجمه پایان نامه به صورت کاملا مرتب ترجمه شکل ها و جداول انجام شده است
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.