-
regret bounded by gradual variation for online convex optimization
جزئیات بیشتر مقاله- تاریخ ارائه: 1392/07/24
- تاریخ انتشار در تی پی بین: 1392/07/24
- تعداد بازدید: 986
- تعداد پرسش و پاسخ ها: 0
- شماره تماس دبیرخانه رویداد: -
recently, it has been shown that the regret of the follow the regularized leader (ftrl) algorithm for online linear optimization can be bounded by the total variation of the cost vectors rather than the number of rounds. in this paper, we extend this result to general online convex optimization. in particular, this resolves an open problem that has been posed in a number of recent papers. we first analyze the limitations of the ftrl algorithm as proposed by hazan and kale (in machine learning 80(2–3), 165–188, 2010) when applied to online convex optimization, and extend the definition of variation to a gradual variation which is shown to be a lower bound of the total variation. we then present two novel algorithms that bound the regret by the gradual variation of cost functions. unlike previous approaches that maintain a single sequence of solutions, the proposed algorithms maintain two sequences of solutions that make it possible to achieve a variation-based regret bound for online convex optimization.to establish the main results, we discuss a lower bound for ftrl that maintains only one sequence of solutions, and a necessary condition on smoothness of the cost functions for obtaining a gradual variation bound. we extend the main results three-fold: (i) we present a general method to obtain a gradual variation bound measured by general norm; (ii) we extend algorithms to a class of online non-smooth optimization with gradual variation bound; and (iii) we develop a deterministic algorithm for online bandit optimization in multipoint bandit setting.
مقالات جدیدترین رویدادها
-
استفاده از تحلیل اهمیت-عملکرد در ارائه الگوی مدیریت خلاقیت سازمانی و ارائه راهکار جهت بهبود
-
بررسی تاثیر ارزش وجوه نقد مازاد بر ساختار سرمایه شرکت های پذیرفته شده در بورس اوراق بهادار تهران
-
بررسی تأثیر سطح افشای ریسک بر قرارداد بدهی شرکت های پذیرفته شده در بورس اوراق بهادار تهران
-
بررسی تأثیر رتبه بندی اعتباری مبتنی بر مدل امتیاز بازار نوظهور بر نقد شوندگی سهام با تأکید بر خصوصی سازی شرکت ها
-
تأثیر آمیخته بازاریابی پوشاک ایرانی بر تصویر ذهنی مشتری پوشاک ایرانی (هاکوپیان)
-
بررسی موقعیت گردشکردی و توسعه پایدار روستایی (مطالعه موردی: روستای دهه چشمه، استان چهارمحال و بختیاری)
-
توسعه آگاهی محیطی؛ کاربست الگوی آموزش پایدار در طراحی مدارس ابتدائی
-
نشانه های افسردگی در کودکان و راه های مقابله با آن
-
ارزیابی منحنی شکنندگی لرزه ای قاب های خمشی فولادی ویژه با نامنظمی جرمی در ارتفاع
-
آنالیز پلاستیک دال های دوطرفه با استفاده از شبکه های عصبی مصنوعی
مقالات جدیدترین ژورنال ها
-
مدیریت و بررسی افسردگی دانش آموزان دختر مقطع متوسطه دوم در دروان کرونا در شهرستان دزفول
-
مدیریت و بررسی خرد سیاسی در اندیشه ی فردوسی در ادب ایران
-
واکاوی و مدیریت توصیفی قلمدان(جاکلیدی)ضریح در موزه آستان قدس رضوی
-
بررسی تاثیر خلاقیت، دانش و انگیزه کارکنان بر پیشنهادات نوآورانه کارکنان ( مورد مطالعه: هتل های 3 و 4 ستاره استان کرمان)
-
بررسی تاثیر کیفیت سیستم های اطلاعاتی بر تصمیم گیری موفق در شرکتهای تولیدی استان اصفهان (مورد مطالعه: مدیران شرکتهای تولیدی استان اصفهان)
-
الگوپردازی و اعتبارسنجی پدیده تصمیم هراسی مدیران
-
مطالعه آزمایشگاهی بررسی بهبود بازیافت نفت با استفاده از سورفکتانت کاتیونی و پلیمر با فرآیند سیلاب زنی
-
توسعه پایدار؛ شکاف طراحی و اجرایی سد داریان هورامان
-
حقوق زندانیان از منظر فقه امامیه و حقوق ایران با نگاهی به اسناد بین المللی
-
boron nitride nanocone as an adsorbent and senor for ampicillin: a computational study
سوال خود را در مورد این مقاله مطرح نمایید :