طبقه‌بندی آماری

طبقه‌بندی دایره‌های توپر و توخالی با الگوریتم اس وی ام

در یادگیری ماشینی و آمار طبقه‌بندی (به انگلیسی: Classification) [۱]مسئلهٔ شناسایی تعلق یک مشاهده جدید به کدام یک از مجموعه دسته‌ها (زیر-جمعیت‌ها)، بر اساس یک مجموعه از داده‌های مورد استفاده به منظور آموزش شامل مشاهدات است که عضویت در دسته هایشان معلوم است. در اصطلاح یادگیری ماشین، طبقه‌بندی نوعی یادگیری با نظارت است، که مجموعه‌ای داده‌ها برای آموزش موجودند. برای نمونه طبقه‌بندی ایمیل‌ها به اسپم و غیراسپم یک طبقه‌بندی با دو دسته است. اگر الگوریتمی بخواهد ایمیل‌های دریافت‌شده را طبقه بندی کند هر ایمیل به کلاس اسپم یا غیراسپم تعلق خواهد داشت. این نمونه‌ای از یک طبقه‌بندی دودویی است.[۲] در مقابل طبقه‌بندی دودویی، طبقه‌بندی چندکلاسه قرار دارد (برای نمونه تشخیص یک عدد بین ٠ تا ٩ از روی تصویر نه کلاس دارد). طبقه‌بندی‌های چندکلاسه معمولا دشوارتر از طبقه‌بندی دودویی هستند.[۲][۳]

الگوریتم‌های طبقه‌بندی[ویرایش]

جستارهای وابسته[ویرایش]

منابع[ویرایش]

  1. T. Hastie, R. Tibshirani, and J. Friedman, “The Elements of Statistical Learning,” Bayesian Forecast. Dyn. Model., vol. 1, pp. 1–694, 2009.
  2. ۲٫۰ ۲٫۱ Provost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking. " O'Reilly Media, Inc.".
  3. Piryonesi S. Madeh; El-Diraby Tamer E. (2020-06-01). "Role of Data Analytics in Infrastructure Asset Management: Overcoming Data Size and Quality Problems". Journal of Transportation Engineering, Part B: Pavements. 146 (2): 04020022. doi:10.1061/JPEODX.0000175.