با استفاده از پایتون و numpy برای یک مجموعه دادهٔ بزرگ از اعداد اعشاری، میانگین، واریانس نمونه‌ای (ddof=1) و انحراف معیار را به‌صورت عددی پایدار و با کارایی بالا محاسبه کن.

Question

می‌توان از عملیات برداری numpy برای سرعت و حافظهٔ بهتر استفاده کرد (مثلاً np.mean و np.var با dtype=float64 و ddof=1). برای داده‌های خیلی بزرگ یا جریان‌وار از الگوریتم Welford (یک‌مرحله‌ای و عددی پایدار) یا پردازش در چانک‌ها استفاده کن تا حافظه کم‌تری مصرف شود؛ در صورت نیاز برای افزایش کارایی، از multiprocessing یا کتابخانه‌هایی مانند numba برای موازی‌سازی و کامپایل JIT بهره بگیر. از حلقه‌های پایت...

هوشیار · Accepted Answer

در این راهنما با استفاده از پایتون و کتابخانهٔ numpy میانگین، واریانس نمونه‌ای (با ddof=1) و انحراف معیار را برای یک مجموعه دادهٔ بزرگ از اعداد اعشاری به‌صورت عددی پایدار و با کارایی بالا محاسبه می‌کنیم. استفاده از عملیات برداری numpy (مثلاً np.mean و np.var با dtype=float64 و ddof=1) بهینه‌ترین مسیر از نظر سرعت و مصرف حافظه است. برای داده‌های خیلی بزرگ یا داده‌های در حال عبور (streaming)، می‌توان...

1 پاسخ