Normalization زمانی خوب است که می دانید توزیع داده های شما از توزیع گاوسی پیروی نمی کند. از سوی دیگر، استانداردسازی در مواردی که داده ها از توزیع گاوسی پیروی می کنند می تواند مفید باشد.
آیا باید از نرمال سازی یا استانداردسازی استفاده کنم؟
هنجارسازی زمانی مفید است که دادههای شما مقیاسهای متفاوتی داشته باشند و الگوریتمی که استفاده میکنید مفروضاتی در مورد توزیع دادههای شما مانند k-نزدیکترین همسایه و شبکههای عصبی مصنوعی ایجاد نمیکند. Standardization فرض می کند که داده های شما دارای توزیع گاوسی (منحنی زنگی) هستند.
آیا استانداردسازی همان عادی سازی است؟
در دنیای تجارت، "نرمالسازی" معمولاً به این معنی است که محدوده مقادیر " از 0 نرمال می شود.0 تا 1.0". "Standardization" معمولاً به این معنی است که محدوده مقادیر برای اندازه گیری تعداد انحرافات استاندارد از میانگین آن "استاندارد" شده است.
آیا عادی سازی داده ها همیشه خوب است؟
با عادی سازی، در واقع برخی از اطلاعات مربوط به داده ها مانند مقادیر حداکثر و حداقل مطلق را دور می اندازید. بنابراین، هیچ قانون سرانگشتی وجود ندارد. همانطور که دیگران گفتند، عادی سازی همیشه قابل اجرا نیست. به عنوان مثال، از نقطه نظر عملی.
چه زمانی نباید داده ها را عادی کنید؟
چند دلیل خوب برای عادی نشدن
- پیوستن ها گران هستند. عادی سازی پایگاه داده شما اغلب مستلزم ایجاد تعداد زیادی جداول است. …
- طراحی عادی دشوار است. …
- سریع و کثیف باید سریع و کثیف باشد. …
- اگر از پایگاه داده NoSQL استفاده می کنید، عادی سازی سنتی مطلوب نیست.