این یک تکنیک داده کاوی است که داده های خام را به قالبی قابل فهم تبدیل می کند. داده های خام (داده های دنیای واقعی) همیشه ناقص هستند و آن داده ها نمی توانند از طریق یک مدل ارسال شوند. که باعث ایجاد خطاهای خاصی می شود. به همین دلیل است که قبل از ارسال از طریق یک مدل باید داده ها را از پیش پردازش کنیم
چرا باید داده ها را از قبل پردازش کنیم؟
این یک تکنیک داده کاوی است که داده های خام را به قالبی قابل فهم تبدیل می کند داده های خام (داده های دنیای واقعی) همیشه ناقص هستند و داده ها را نمی توان از طریق یک مدل ارسال کرد. که باعث ایجاد خطاهای خاصی می شود. به همین دلیل است که قبل از ارسال از طریق یک مدل، باید داده ها را از قبل پردازش کنیم.
آیا باید داده های آزمایش را از قبل پردازش کنم؟
خلاصه اصلی این است: شما نباید از روش پیش پردازشی استفاده کنید کهبر روی کل مجموعه داده نصب شده است، برای تبدیل داده های آزمایش یا آموزش. اگر این کار را انجام دهید، به طور ناخواسته اطلاعاتی را از قطار تنظیم شده به مجموعه آزمایشی منتقل می کنید.
مشکل نشت داده چیست؟
نشت داده عبارت است از انتقال غیرمجاز داده از داخل یک سازمان به مقصد یا گیرنده خارجی… نشت داده، همچنین به عنوان سرقت داده کم و آهسته شناخته می شود، یک مشکل بزرگ است. برای امنیت داده ها، و آسیب وارد شده به هر سازمان، صرف نظر از اندازه یا صنعت، می تواند جدی باشد.
چگونه داده های آزمون را تغییر می دهید؟
تبدیل
تغییر همه ویژگی ها را با تفریق میانگین و تقسیم بر واریانس تغییر می دهد. برای راحتی، این دو فراخوانی تابع را می توان در یک مرحله با استفاده از fit_transform انجام داد.