شماره رکورد
157
عنوان
سعيد مجيدي: يادگيري تقويتي Reinforcement Learning
نام نرم افزارها
سعيد مجيدي: يادگيري تقويتي Reinforcement Learning
نام سازمان
خانه رياضيات اصفهان
وضعيت نشر
خانه رياضيات اصفهان
موضوع
يادگيري تقويتي ,Reinforcement Learning
چکيده
يادگيري تحت سرپرستي ، يك روش عمومي در يادگيري ماشين است كه در آن به يك سيستم ، مجموعه جفت هاي ورودي - خروجي ارائه شده و سيستم تلاش مي كند تا تابعي از ورودي به خروجي را فرا گيرد. يادگيري تحت سرپرستي نيازمند تعدادي داده ورودي به منظور آموزش سيستم است . با اين حال رده اي از مسائل وجود دارند كه خروجي مناسب كه يك سيستم يادگيري تحت سرپرستي نيازمند آن است ، براي آنها موجود نيست . اين نوع از مسائل چندان قابل جوابگويي با استفاده از يادگيري تحت سرپرستي نيستند. يادگيري تقويتي مدلي براي مسائلي از اين قبيل فراهم مي آورد . در يادگيري تقويتي (tnemecrofnier gninrael) سيستم تلاش مي كند تا تقابلات خود با يك محيط پويا را از طريق خطا و آزمايش بهينه نمايد . يادگيري تقويتي مسئله اي است كه يك عامل كه مي بايست رفتار خود را از طريق تعاملات آزمايش و خطا با يك محيط پويا فرا گيرد، با آن مواجه است . در يادگيري تقويتي هيچ نوع زوج ورودي - خروجي ارائه نميشود . به جاي آن پس از اتخاذ يك عمل ، حالت بعدي و پاداش بلافصل به عامل ارائه مي شود . هدف اوليه برنامه ريزي عامل ها با استعاده از تنبيه و تشويق است بدون آنكه ذكري از چگونگي انجام وظيفه آنها شود . در اين سمينار ابتدا مسئله يادگيري تقويتي معرفي شده و سپس الگوريتم هاي مختلف مطرح در آن بيان مي شوند .
تاريخ نمايه سازي
27/06/1386
شماره راهنما
ل289