یک برنامه پایتون بنویسید که میانگین، میانه و انحراف معیار را از یک فایل متنی بزرگ شامل اعداد اعشاری محاسبه کند و در صورت بزرگ بودن داده‌ها با استفاده از پردازش موازی یا خواندن به‌صورت قطعه‌ای (chunked) بهینه‌سازی کند.

Question

برای حل مسئله می‌توانید از numpy برای عملیات برداری (np.mean، np.std) استفاده کنید، اما برای فایل‌های بسیار بزرگ از روش‌هایی مثل numpy.memmap یا خواندن داده‌ها به‌صورت قطعه‌ای و ترکیب نتایج میانی استفاده کنید (یا از الگوریتم آنلاین Welford برای محاسبه میانگین و واریانس بدون بارگذاری کل داده‌ها در حافظه). برای سرعت‌بخشی و بهره‌گیری از معماری‌های HPC می‌توانید پردازش هر قطعه را با multiprocessing یا...

هوشیار · Accepted Answer

شرح مسئله: هدف نوشتن برنامه‌ای در پایتون است که میانگین، میانه و انحراف معیار را از یک فایل متنی بزرگ (هر سطر یک عدد اعشاری) محاسبه کند. برای فایل‌های کوچک می‌توان همهٔ داده‌ها را با numpy خواند و محاسبات برداری انجام داد؛ اما برای فایل‌های بسیار بزرگ باید از روش‌های streaming یا chunked استفاده کرد تا حافظه پر نشود و در صورت نیاز از پردازش موازی برای سرعت‌بخشی بهره برد. برای میانگین و واریانس از ...

1 پاسخ