(سومین مقاله پر ارجاع در نشریه بینالمللی سولار انرژی)
نویسندگان: داژی یانگ، استفانو آلساندرینی، خاویر آنتونانزاس و همکاران.
تاریخ انتشار مقاله: نوامبر 2020
یادآوری: چنانکه در بخش اول مقاله گفته شد، مورفی (1993) سه نوع ویژگی را که به طور مشترک یک پیشبینی خوب را تعریف میکنند، بیان کرده است:
- سازگاری – مطابقت بین پیشبینیها و قضاوتها.
- کیفیت – مطابقت بین پیشبینیها و مشاهدات.
- ارزش – مزایای افزایشی پیشبینی ها برای کاربران.
1-1-1) ثبات و پایداری
ثبات یک مفهوم کاملاً انتزاعی است: یک پیشبینی در صورتی باثبات است که با بهترین قضاوت(رای) پیشبینیکننده مطابقت داشته باشد. مورفی (1993) استدلال کرد که چنین قضاوتی باید حاوی عنصر عدم قطعیت باشد، زیرا دانش پیشبینیکننده در مورد کار پیشبینی لزوماً ناقص است. در پیشبینی احتمالی، ثبات را میتوان با اتخاذ قوانین امتیازدهی کاملاً مناسب تضمین کرد (گنیتینگ و رافتری، 2007). با این کار، پیشبینیکنندگان با بهترین امتیازها پاداش میگیرند اگر و تنها در صورتی که پیشبینیهایشان با قضاوتشان مطابقت داشته باشد (مورفی و وینکلر، 1971). امتیاز بریر و امتیاز احتمال مرتب شده پیوسته (CRPS)، که هر دو اغلب در پیشبینی احتمالی خورشیدی استفاده میشوند، هر دو کاملاً مناسب هستند (Gneiting و Raftery، 2007).
از سوی دیگر، در پیشبینی قطعی، پیشبینیکنندگان باید قضاوت احتمالی خود را از طریق یک تابع آماری، T(F)، که توزیع پیشبینی را خلاصه میکند، تفسیر کنند (خوانندگان برای تعریف رسمی به Gneiting (2011)[1] ارجاع کنند). به طور غیررسمی، تابع امتیازدهی S سازگار است اگر E[S (f, x)] ≤ E[S (g, x)]، برای همه f ∈ T(F)، که در آن f ارزیابی تابعی است، g هر پیشبینیای است و x مشاهده آینده است. این تعریف نشان میدهد که S اگر و فقط در صورتی باثبات است که هر f∈ T(F) پیشبینی بهینه تحت S باشد. به عنوان مثال، اگر مقدار میانگین توزیع احتمال قضاوتی پیشبینی کننده مورد توجه باشد، RMSE یک اندازه گیری دقت ثابت است، زیرا RMSE با پیشبینی میانگین توزیع پیشبینی به حداقل می رسد. در مطالعه شبیه سازی فوق، آماردان پیشبینی های بهینه را تحت RMSE ارائه کرد. این مدل خوشبینانه، اگرچه برنده رقابت با توجه به MAE شد، اما پیشبینی های بهینه را تحت MAE ارائه نکرد (MAE با پیشبینی میانه توزیع پیشبینی به حداقل می رسد).
فرض اساسی استفاده از ثبات به عنوان معیار خوبی برای پیشبینیها این است که پیشبینیکنندگان دستورالعملی را در قالب یک تابع آماری دریافت میکنند تا قضاوت احتمالی خود را به یک پیشبینی قطعی تبدیل کنند. به عنوان مثال، این دستورالعمل میتواند «میانگین قضاوت احتمالی شما را پیشبینی کند». تنها در این صورت، یک قانون امتیازدهی می تواند به عنوان یک قانون منسجم شناخته شود که توسط دستورالعمل انتخابشده بهینه شود.
با این حال، جولیف (2008) اشاره کرد که خود تعریف “ثبات” دایرهای است: یک پیشبینی کننده می تواند با انتخاب یک قانون امتیازدهی شروع به کار کند. هنگامی که پیشبینیها با بهینهسازی قانون امتیازدهی انجام میشوند، دستورالعمل منسجم به طور طبیعی دنبال میشود.
سازگاری حاکی از یک دستورالعمل نظری برای انتخاب مناسبترین معیار دقت در طول پیشبینی است. برای اکثر مدلهای آماری و یادگیری ماشینی، پارامتر یا وزنهای مدل بر اساس برخی تابع هزینه برآورد یا برازش میشوند. در این راستا، یک معیار خطای ثابت باید در حین تأیید استفاده شود. به عنوان مثال، رگرسیون حداقل مربعات معمولی مجموع مربعات خطاها را به حداقل می رساند، بنابراین، RMSE یک معیار مناسب برای گزارش است. با این وجود، چنین دستورالعملی ممکن است در عمل به نفع مقایسه پیشبینی نباشد، زیرا زمینه را بیشتر تقسیم میکند. تحقیقات بیشتر در این زمینه ضروری است.
1-1-2) کیفیت
کیفیت یک مفهوم آشنا برای همه پیشبینی کنندگان خورشیدی است، زیرا به مطابقت بین پیشبینیها و مشاهدات اشاره دارد. برای مثال، MAE و RMSE هر دو معیارهایی هستند که دقت کلی پیشبینیها را ارزیابی میکنند. دقت جنبه ای از کیفیت پیشبینی است. می توان آن را از طریق معیارهای کمی تفسیر کرد. علاوه بر دقت، سایر جنبههای کیفیت پیشبینی که برای پیشبینیکنندگان خورشیدی شناخته شدهاند، مانند سوگیری، ارتباط، مهارت یا عدم قطعیت، میتوانند از طریق MBE، همبستگی، امتیاز مهارت یا واریانس ارزیابی شوند. در راستیآزمایی پیشبینی، روش سنتی مقایسه معیارها، ممکن است جهتگیری مثبت (هرچه بزرگتر، بهتر، مانند امتیاز مهارت)، جهتگیری منفی (کوچکتر، بهتر، مانند RMSE) یا مرکزگرا (هرچه نزدیکتر) باشد. یک مقدار مرکزی، بهتر است، (مانند MBE)، به عنوان رویکرد اندازهگیری شناخته شود.
نزدیکشدن همانطور که قبلا ذکر شد، یکی از معایب استفاده از رویکرد اندازهگیری، ذهنیت در انتخاب معیارها است. از آنجایی که انتخاب اقدامات برای گزارش اساساً یک تصمیم داخلی برای پیشبینیکننده است، دلایل این انتخاب به طور پیش فرض برای هر کسی که رویه تأیید پیشبینی را از دیدگاه خارجی مشاهده می کند ناشناخته است. در دانشگاه، پیشبینیکنندگان نویسنده هستند، در حالی که ناظران ویراستاران، داوران و خوانندگان هستند. اگر با خوشبینی در مطالعه شبیهسازی فقط MAE در یک مقاله گزارش شود، ناظران نمی توانند به طور کامل به مشکلات اساسی آن پیشبینیها پی ببرند، اما چارهای جز پذیرش نتایج آنها نخواهند داشت. مطالعه شبیهسازی فوق ممکن است سناریوهای پیشبینی خورشیدی را در مقایسه با مدلهای پیشبینی واقعی بیش از حد ساده کند. از آنجایی که این موارد معمولاً بسیار پیچیدهتر هستند، تفسیر نتایج آنها تنها از طریق چند معیار دشوارتر است.
یک سوال مرتبط این است که اگر دو روش پیشبینی MBE یا RMSE یا امتیاز مهارت یکسانی داشته باشند، آیا به یک اندازه خوب هستند؟ پاسخ واضح “نه” است. اندازهگیریها فقط یک ارزیابی کلی از کیفیت پیشبینی ارائه میکنند. از آنجایی که معیارهای خطا اغلب بر اساس مجموعهای از نمونهها محاسبه میشوند (مثلاً پیشبینیهای ساعتی انجامشده در طول یک سال)، این موضوع روشهای بیشماری را برای به دست آوردن مقدار یکسان خطای متریک ارائه میدهد (خواننده به شکل 1 در مقاله Vallance et al (2017)[2] رجوع کند برای مثالی در مورد اینکه چگونه دو مجموعه از پیشبینی های کاملاً متفاوت می توانند به یک RMSE منجر شوند). یکی از راه حلهایی که اغلب در ادبیات پیشبینی خورشیدی استفاده میشود، گزارش معیارهای خطای REGIM-DEPENDENT است، به عنوان مثال، می توان به طور جداگانه خطاها را برای شرایط ابری، صاف و همه شرایط آسمان گزارش کرد. از طرف دیگر، میتوانید خطاها را برای زمانهای مختلف روز، زمانهای مختلف سال یا انواع روز گزارش کنید. با این حال، ابعاد مقیاسهای تأیید پیشبینی با تعداد کلاسها، به عنوان مثال، یک جدول RMSE سه خواهد شد، اگر سه شرایط آسمان به طور جداگانه تجزیه و تحلیل شوند، یا ده، اگر انواع ده روزه تعریف شوند. جدول احتمالی خطا اغلب به سرعت از کنترل خارج می شود. آنچه اخیراً مورد بحث قرار گرفت، به عنوان تحلیل پیشبینی شناخته میشود، که به طور کلی به عنوان رویه انتخاب شده برای درک ترکیب کیفیت کلی تعریف میشود.
از آنجایی که هم ارزیابی و هم تجزیه و تحلیل کیفیت پیشبینی توسط اطلاعات تعبیهشده در جفتهای پیشبینی-مشاهده هدایت میشود، تعریف کل اطلاعات در دسترس برای پیشبینیکننده در طول راستیآزمایی مفید است. با تعریف کل اطلاعات، پیشبینی کننده دیگر با مجموعه آمار خلاصه محدود نمیشود. به طور متفاوت، اگر دنباله زمانی جفتهای پیشبینی-مشاهده مورد توجه نباشد، توزیع مشترک پیشبینی و مشاهده میتواند برای مطالعه مهارت پیشبینیها مورد استفاده قرار گیرد، زیرا حاوی تمام اطلاعات مستقل از زمان مربوط به راستیآزمایی پیشبینی است. این رویکرد توزیع گرا برای تأیید پیشبینی توسط مورفی و وینکلر (1987) پیشنهاد شد محبوبیت بالایی در زمینه پیشبینی هواشناسی به دست آورده است، اما کمتر توسط پیشبینی کنندگان خورشیدی شناخته شده است.
این چارچوب خاص باید مورد بحث قرار گیرد، زیرا دیدگاهی جایگزین برای رویکرد معیارگرای سنتی ارائه میدهد. از نظر دسترسی به اطلاعات انعطاف پذیری بالایی را ارائه می دهد. در واقع، اکثر روشهای گرافیکی (مانند نمودار تیلور، نمودار هدف، یا نقشه حرارتی خطا) و اندازهگیریهای دقت (مانند MBE، RMSE، یا انتگرال تست کولموگروف-اسمیرنوف) شناخته شده برای پیشبینیکنندگان خورشیدی، روشهای خاصی تحت این چارچوب کلی هستند. مهمتر از آن، چارچوب مورفی-وینکلر توسط قضیه بیز تقویت میشود، به این صورت که توزیع مشترک را میتوان بهطور معادل بهعنوان حاصلضرب توزیعهای حاشیهای و شرطی نوشت و اطلاعات جاسازی شده را در دسترستر میکند. آخرین اما نه کم اهمیت، رویکرد توزیع گرا ارتباط بین کیفیت پیشبینی و اندازه گیری دقت را برقرار می کند. جدای از جنبههای کیفیت پیشبینی که قبلاً ذکر شد، جنبههای دیگری مانند قابلیت اطمینان، وضوح یا تبعیض را میتوان به راحتی تعریف و کمی کرد. در حالی که جزئیات بیشتر در مورد چارچوب مورفی-وینکلر در بخش بعدی با یک مطالعه موردی ارائه شده است، خاطرنشان می شود که این چارچوب برای درک خوب بودن پیشبینی ها ضروری است.
1-1-3) ارزشها
ارزش به منافع محققشده یا هزینههای متحملشده توسط افراد یا سازمانهایی مربوط میشود که از پیشبینیها در طول تصمیمگیری خود استفاده میکنند. مورفی (1993) اشاره کرد که پیشبینیها به خودی خود ارزش ذاتی ندارند، زیرا آنها فقط از طریق تأثیرگذاری بر تصمیمات اتخاذشده توسط کاربران ارزش کسب میکنند. اغلب، ارزش پیشبینیهای خورشیدی به واحدهای پولی ترجمه و اندازهگیری میشود. به عنوان مثال، با کاهش RMSE پیشبینیها به میزان x W/m، مالک یک سیستم فتوولتائیک (PV) با ذخیره انرژی ممکن است انتظار داشته باشد که yدلار اضافی در سال از طریق بهینه سازی استراتژی تغذیه سیستم به دست آورد. در یک مطالعه موردی مفصل، لاو و همکاران (2016) مزایای بهبود در پیشبینی تابش برای یک نیروگاه حرارتی خورشیدی متمرکز در این زمینه را مورد بحث قرار دادند. یک دیدگاه جایگزین توسط آنتونانزاس و همکاران ارائه شد. (2017)، جایی که آنها سود حاصل از روش های مختلف پیشبینی را با توجه به پیشبینی های کامل مقایسه کردند.
طبیعتاً چنین مزایا یا هزینههایی به ویژگیهای یک مشکل تصمیمگیری خاص بستگی دارد. بنابراین، نوع سوم معیارهای مورد بحث تحت کنترل پیشبینیکنندگان نیست، بلکه توسط تصمیمگیرندگان تعیین و قدردانی میشود. علاوه بر این، این معیار پیشبینی به طور پیش فرض غیر قابل انتقال است. به این معنا که نمیتوان ارزشی را که دیگران درک میکنند، با استفاده از ویژگیهای مسئله در دست مقیاس کرد. به دلیل دوره های مختلف عمل و ساختارهای بازدهی که برای تصمیم گیرندگان مختلف در دسترس است، دلیل کمی وجود دارد که فرض کنیم ارزش قبلی در یک مطالعه قبلی اعمال شود. یک استراتژی پیشبینی خوب که برای برخی از کاربران ارزش بالایی ایجاد میکند، ممکن است مورد استقبال دیگران قرار نگیرد.
به موازات آن، اعتقاد بر این است که برای یک مشکل تصمیم گیری ثابت و به خوبی تعریف شده، نگاشت بین کیفیت و ارزش یکنواخت است. به عبارت دیگر، انتظار می رود کیفیت پیشبینی بالاتر با ارزش بالاتر مطابقت داشته باشد. در اصل، این به پیشبینیکننده انگیزه لازم را برای ارائه بهترین پیشبینیهای ممکن (و به نحوی امیدوارانه «بهینه») میدهد.
برای ارائه دیدگاهی در مورد اینکه “چالشهای تصمیمگیریهای به خوبی تعریف شده” واقعاً چه میتواند باشد، مورد بازار ملی برق استرالیا (NEM) در نظر گرفته می شود. در NEM، ژنراتورهای معمولی پیشنهادات خود را هر پنج دقیقه به اپراتور بازار انرژی استرالیا ارسال میکنند. مورد بعدی سعی میکند ببیند که تا چه حد باید روی بستههای پیشنهادی پیش بروند تا به بار خالص پیشبینیشده خود برسند (پیشبینی بار منطقهای منهای پیشبینی تولید PV خانگی و تجاری). اگر ژنراتورهای متعارف مقدار وعده داده شده خود را بیش از یک تلورانس معین، بالاتر یا پایین تر از دست بدهند، جریمه میشوند. در حال حاضر توسعه چشمگیری در ساخت مزارع خورشیدی وجود دارد و این تاسیسات قیمتگذار هستند، یعنی در تعیین قیمت لحظهای بازار دخالتی ندارند. از این رو، نیروگاه های خورشیدی برای پیشبینیهای ضعیف جریمه نمیشوند، اما می توانند در صورت لزوم محدود شوند. تحت این منطق، مشکل تصمیمگیری ممکن است به خوبی تعریف نشده باشد، زیرا صاحبان نیروگاه همیشه میتوانند از بالاترین تولید برق ممکن به عنوان پیشبینی استفاده کنند، زیرا هیچ جریمهای برای پیشبینیهای بیش از حد اعمال نمیشود. برای یکسان کردن زمین بازی در یک منطق جدید، نیروگاه های خورشیدی نیز میتوانند جریمه شوند، اگر آنها پیشبینیهای خود را برآورده نکنند. با توجه به ساختار بازده جدید، هزینه پیشبینیهای بیش از حد را میتوان معادل هزینه ذخیره در حال چرخش تنظیم کرد تا تفاوت بین پیشبینیشده و برق خورشیدی تولید شده برآورده شود. به طور مشابه، هزینه پیشبینیهای ناقص، درآمد از دسترفتهای است که اگر آن انرژی بالقوه اضافی به قیمت نقدی رایج در آن زمان فروخته شود، ایجاد میکند. در این مورد، اگر دو هزینه یکسان باشند، مشکل تصمیمگیری به خوبی تعریف میشود، سپس پیشبینیکنندگان را تشویق میکند تا پیشبینیهای بهینه خود را به درستی ارائه کنند.
شکل 2: میانگین ماهانه خطاهای پیشبینی GHI در روز آینده – RMSE [W/m2] و nRMSE [%] نرمالسازی شده با مقادیر میانگین تابش ماهانه – در هامبورگ، آلمان (53.63◦N، 9.99◦E)، تولید شده توسط سیستم پیشبینی یکپارچه (IFS)، یک سیستم NWP که توسط مرکز اروپایی پیشبینیهای هوای متوسط (ECMWF) ایجاد شده است. واضح است که ماه های زمستانی دارای RMSE کوچک اما nRMSE بالا هستند که ممکن است گیج کننده باشد.
[1]. Making and Evaluating Point Forecasts on JSTOR
[2]. Quantifying the amplified bias of PV system simulations due to uncertainties in solar radiation estimates – ScienceDirect