با استفاده از pandas یک فایل CSV شامل ویژگی‌های عددی را بارگذاری کن، داده‌های مفقود را پر کن، متغیرهای ورودی و خروجی را جدا کن و مجموعه داده را به مجموعه‌های آموزش و آزمون تقسیم کن.

Question

برای حل این تمرین از pandas برای خواندن فایل (pd.read_csv) و بررسی ساختار داده‌ها (df.info(), df.head()) استفاده کنید؛ مقادیر گمشده را با df.fillna(df.mean()) یا حذف با df.dropna() مدیریت کنید. ستون هدف را مشخص کرده و با df.drop یا انتخاب ایندکس‌ها X و y را جدا کنید، سپس برای تقسیم‌بندی می‌توانید از sklearn.model_selection.train_test_split با مقدار random_state برای قابلیت بازتولید استفاده کنید یا...

هوشیار · Accepted Answer

در این آموزش با استفاده از pandas یک فایل CSV حاوی ویژگی‌های عددی را بارگذاری می‌کنیم، مقادیر مفقود را مدیریت می‌کنیم، مقادیر ورودی و خروجی را از هم تفکیک می‌کنیم و داده‌ها را به مجموعه‌های آموزش و آزمون تقسیم می‌کنیم.

ابتدا ساختار داده‌ها را بررسی می‌کنیم تا متوجه بشویم چه ستون‌هایی وجود دارد و آیا مقادیر گمشده وجود دارد یا نه. همچنین با head() اولین ردیف‌ها را مشاهده می‌کنیم تا آماده‌سازی داده‌...

1 پاسخ