یک برنامه پایتون بنویسید که میانگین، واریانس و انحراف معیار نمونه‌ای را برای یک مجموعه‌دادهٔ بزرگ آماری (statistics) به‌صورت حافظه‌موثر و سریع با استفاده از numpy محاسبه کند.

Question

برای حل: داده‌ها را به‌صورت تکه‌ای (chunking) یا با np.memmap بارگذاری کنید تا از پر شدن حافظه جلوگیری شود، سپس با الگوریتم یک‌گذرهٔ Welford یا محاسبات تجمعی روی هر تکه میانگین و واریانس را به‌دست آورید تا پایداری عددی تضمین شود. برای سرعت بالاتر از توابع برداری‌شده‌ی numpy (np.mean, np.var) استفاده کنید و در صورت نیاز برای پردازش موازی تکه‌ها از multiprocessing یا joblib بهره ببرید؛ نکات مفید: از...

هوشیار · Accepted Answer

هدف از این پاسخ، ارائه یک برنامه پایتون است که برای یک مجموعه داده بزرگ آماری، میانگین، واریانس نمونه و انحراف معیار نمونه را به‌طور حافظه‌دوست و سریع محاسبه کند. کل داده را به‌صورت تکه‌ها (chunking) یا با استفاده از numpy.memmap بارگذاری می‌کنیم تا از پر شدن حافظه جلوگیری شود. برای پایداری عددی، از جمع‌های تجمعی روی هر تکه و ترکیب نتایج استفاده می‌کنیم (روش‌های مبتنی بر مجموع S1 و S2 یا به‌طور جا...

1 پاسخ