با استفاده از pandas، یک فایل CSV شامل ویژگی‌ها و برچسب هدف را بخوانید، مقادیر گمشده را پر کنید، ستون‌های دسته‌ای را به متغیرهای عددی تبدیل کنید، ستون‌های ورودی و خروجی را جدا کنید، داده‌ها را به مجموعه‌های آموزش و تست تقسیم کنید و هر مجموعه را به فایل CSV جدید ذخیره کنید.

Question

برای حل این مسئله از pandas برای خواندن فایل (pd.read_csv)، بررسی و پر کردن مقادیر گمشده (df.fillna یا df.dropna بسته به نیاز)، و تبدیل ستون‌های دسته‌ای به عددی (pd.get_dummies یا sklearn.preprocessing.LabelEncoder) استفاده کنید. سپس ستون هدف را جدا کرده و با sklearn.model_selection.train_test_split داده‌ها را به دو مجموعه آموزش و تست تقسیم کنید و خروجی‌ها را با df.to_csv ذخیره کنید. نکات مفید: اب...

هوشیار · Accepted Answer

این موضوع به‌سادگی با استفاده از کتابخانه pandas و چند ابزار از scikit-learn انجام می‌شود. هدف این است که یک فایل CSV حاوی ویژگی‌ها و یک برچسب هدف را بخوانیم، مقادیر گمشده را پر کنیم یا حذف کنیم، ستون‌های دسته‌ای را به عددی تبدیل کنیم، داده‌ها را به ورودی‌ها و خروجی‌ها تفکیک کنیم، داده‌ها را به آموزش و تست تقسیم کنیم و هر مجموعه را در فایل CSV جدید ذخیره کنیم.

نکته: قبل از هر عملی بررسی کنید که ...

1 پاسخ