مارکتینگ پروژه 20 | مرجع فایل های دانلودی - پروژه آماده - پروژه دانشجویی - پاورپوینت آماده
0

هیچ محصولی در سبد خرید نیست.

ترجمه مقاله کنترل چراغ ترافیک (راهنمایی) در محیط­های غیرثابت براساس یادگیری-Q چند عاملی

دسته بندی :کامپیوتر مدیریت 33

ترجمه مقاله کنترل چراغ ترافیک (راهنمایی) در محیط­های غیرثابت براساس یادگیری-Q چند عاملی

دسته بندی کامپیوتر
فرمت فایل zip
حجم فایل 522 کیلو بایت
تعداد صفحات 6
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

2011 14th International IEEE Conference on Intelligent Transportation Systems Washington DC USA. October 5-7 2011

Traffic Light Control in Non-stationary Environments based on Multi Agent Q-learning

Abstract—In many urban areas where traffic congestion does not have the peak pattern conventional traffic signal timing methods does not result in an efficient control. One alternative is to let traffic signal controllers learn how to adjust the lights based on the traffic situation. However this creates aclassical non-stationary environment since each controller is adapting to the changes caused by other controllers. In multi-agent learning this is likely to be inefficient and computationally challenging i.e. the efficiency decreases with the increase in the number of agents (controllers). In this paper we model a relatively large traffic network as a multi-agent system and use techniques from multi-agent reinforcement learning. In particular Q-learning is employed where the average queue length in approaching links is used to estimate states. A parametric representation of the action space has made the method extendable to different types of intersection. The simulation results demonstrate that the proposed Q-learning outperformed the fixed time method under different traffic demands.

کنترل چراغ ترافیک (راهنمایی) در محیط­های غیرثابت براساس یادگیری-Q چند عاملی

چکیده

در بسیاری از مناطق شهری که در آنجا تراکم ترافیک دارای الگوی اوج نیست، روش­های زمان­بندی چراغ­های معمولی باعث کنترل موثری نمی­شود. یک روش جایگزین این است که یادگیری نحوه تنظیم چراغ بر اساس وضعیت ترافیک توسط کنترلرهای سیگنال ترافیکی میسر شود. با این­حال، این امر باعث ایجاد یک محیط غیرثابت کلاسیک می­شود زیرا هر کنترلر تغییرات ناشی از دیگر کنترلرها را تطبیق می­دهد. در یادگیری چند عاملی، این کار به احتمال زیاد ناکارآمد بوده و دارای پیچیدگی­های محاسباتی است، یعنی با افزایش تعداد عامل­ها (کنترلرها)، بازده کاهش می­یابد. در این مقاله، یک شبکه ترافیکی نسبتا بزرگ را بصورت سیستم چند عاملی مدل­سازی می­کنیم و از تکنیک­های یادگیری تقویتی چند عاملی استفاده می­کنیم. بطور خاص، یادگیری-Q به کار گرفته شده است، که در آن طول متوسط صف​ ​درلینک­های نزدیک شونده به منظور برآوردحالت­ها استفاده می­شود. یک بیان پارامتری از فضای عمل، این روش را قابل توسعه به انواع مختلفی از تقاطع­ها کرده است. نتایج شبیه­سازی نشان می­دهد که یادگیری-Q پیشنهادی عملکرد بهتری نسبت به روش زمان ثابت تحت نیازهای ترافیکی متفاوت دارد.

پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

مدیریت

طراح و مدیر مارکتینگ پروژه _ خوشحال میشم که بتوانم قدمی در رشد و برطرف ساختن نیازهای شما عزیزان بردارم.

مطالب زیر را حتما بخوانید:

قوانین ارسال دیدگاه در سایت

  • چنانچه دیدگاهی توهین آمیز باشد و متوجه اشخاص مدیر، نویسندگان و سایر کاربران باشد تایید نخواهد شد.
  • چنانچه دیدگاه شما جنبه ی تبلیغاتی داشته باشد تایید نخواهد شد.
  • چنانچه از لینک سایر وبسایت ها و یا وبسایت خود در دیدگاه استفاده کرده باشید تایید نخواهد شد.
  • چنانچه در دیدگاه خود از شماره تماس، ایمیل و آیدی تلگرام استفاده کرده باشید تایید نخواهد شد.
  • چنانچه دیدگاهی بی ارتباط با موضوع آموزش مطرح شود تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

لینک کوتاه: