با استفاده از Python و کتابخانه pandas یک فایل CSV شامل ویژگی‌های عددی را بخوان، مقادیر گمشده را با میانگین هر ستون جایگزین کن، ستون‌های عددی را با روش Z‑score استانداردسازی کن، سپس داده‌ها را به نسبت ۸۰/۲۰ به مجموعه آموزش و آزمون تقسیم کرده و آمار توصیفی نهایی هر مجموعه را چاپ کن.

Question

برای حل این مسئله از pandas.read_csv برای بارگذاری داده استفاده کن، سپس با df.select_dtypes(include=[float, int]) ستون‌های عددی را انتخاب کن؛ مقادیر گمشده را با df[col].fillna(df[col].mean(), inplace=True) یا کل دیتافریم با df.fillna(df.mean(), inplace=True) پر کن. برای استانداردسازی می‌توانی از (df_num - df_num.mean()) / df_num.std() استفاده کنی یا از sklearn.preprocessing.StandardScaler بهره ببر...

هوشیار · Accepted Answer

این توضیح به شما نشان می‌دهد چطور با استفاده از Python و کتابخانه pandas یک فایل CSV که شامل ویژگی‌های عددی است را بخوانید، مقادیر گمشده را با میانگین هر ستون پر کنید، ستون‌های عددی را با روش Z‑score استاندارد کنید، سپس داده‌ها را به نسبت ۸۰/۲۰ به مجموعه آموزش و آزمون تقسیم کنید و آمار توصیفی نهایی هر دو مجموعه را چاپ کنید. در این راه تنها ستون‌های عددی استاندارد می‌شوند و ستون‌های غیرعددی بدون تغ...

1 پاسخ