• شماره رکورد
    157
  • عنوان

    سعيد مجيدي: يادگيري تقويتي Reinforcement Learning

  • نام نرم افزارها
    سعيد مجيدي: يادگيري تقويتي Reinforcement Learning
  • نام سازمان

    خانه رياضيات اصفهان

  • وضعيت نشر
    خانه رياضيات اصفهان
  • موضوع

    يادگيري تقويتي ,Reinforcement Learning

  • چکيده
    يادگيري تحت سرپرستي ، يك روش عمومي در يادگيري ماشين است كه در آن به يك سيستم ، مجموعه جفت هاي ورودي - خروجي ارائه شده و سيستم تلاش مي كند تا تابعي از ورودي به خروجي را فرا گيرد. يادگيري تحت سرپرستي نيازمند تعدادي داده ورودي به منظور آموزش سيستم است . با اين حال رده اي از مسائل وجود دارند كه خروجي مناسب كه يك سيستم يادگيري تحت سرپرستي نيازمند آن است ، براي آنها موجود نيست . اين نوع از مسائل چندان قابل جوابگويي با استفاده از يادگيري تحت سرپرستي نيستند. يادگيري تقويتي مدلي براي مسائلي از اين قبيل فراهم مي آورد . در يادگيري تقويتي (tnemecrofnier gninrael) سيستم تلاش مي كند تا تقابلات خود با يك محيط پويا را از طريق خطا و آزمايش بهينه نمايد . يادگيري تقويتي مسئله اي است كه يك عامل كه مي بايست رفتار خود را از طريق تعاملات آزمايش و خطا با يك محيط پويا فرا گيرد، با آن مواجه است . در يادگيري تقويتي هيچ نوع زوج ورودي - خروجي ارائه نميشود . به جاي آن پس از اتخاذ يك عمل ، حالت بعدي و پاداش بلافصل به عامل ارائه مي شود . هدف اوليه برنامه ريزي عامل ها با استعاده از تنبيه و تشويق است بدون آنكه ذكري از چگونگي انجام وظيفه آنها شود . در اين سمينار ابتدا مسئله يادگيري تقويتي معرفي شده و سپس الگوريتم هاي مختلف مطرح در آن بيان مي شوند .
  • تاريخ نمايه سازي
    27/06/1386
  • شماره راهنما
    ل289