هوش مصنوعی

درخت تصمیم‌گیری (Decision Tree) در یادگیری ماشین چیست؟ به زبان ساده

درخت تصمیم گیری در یادگیری ماشین

درخت تصمیم‌گیری (Decision Tree) در یادگیری ماشین چیست؟ به زبان ساده

همه ما در زندگی روزمره از «درخت تصمیم» استفاده می‌کنیم؛ مثلاً: «آیا امروز باران می‌بارد؟ اگر بله، چتر ببرم. اگر نه، عینک آفتابی بزنم.»

در دنیای یادگیری ماشین، درخت تصمیم‌گیری (Decision Tree) الگوریتمی است که همین فرآیند «اگر – آنگاه» (If-Then) را به صورت خودکار از داده‌ها یاد می‌گیرد تا بتواند پیش‌بینی کند یا دسته‌بندی انجام دهد.


ساختار درخت تصمیم‌گیری (اجزای تشکیل‌دهنده)

یک درخت تصمیم از سه بخش اصلی ساخته شده است:

  1. ریشه (Root Node): اولین سوال یا ویژگی که کل داده‌ها از آن شروع می‌شوند.
  2. گره داخلی (Internal Node): گره‌هایی که سوالات میانی را می‌پرسند.
  3. برگ (Leaf Node): پایان مسیر؛ جایی که تصمیم نهایی یا نتیجه (پیش‌بینی) مشخص می‌شود.

الگوریتم چطور یاد می‌گیرد؟ (به زبان ساده)

الگوریتم درخت تصمیم با نگاه کردن به ویژگی‌های داده‌ها، سعی می‌کند بهترین «سوال» را انتخاب کند تا داده‌ها را به خالص‌ترین دسته‌ها تقسیم کند. برای این کار از معیارهای ریاضی استفاده می‌کند:

  • آنتروپی (Entropy): معیاری برای اندازه‌گیری بی‌نظمی یا آشفتگی در داده‌ها. هدف الگوریتم این است که آنتروپی را در هر مرحله به حداقل برساند (یعنی داده‌ها را کاملاً دسته‌بندی کند).
  • شاخص جینی (Gini Impurity): روشی دیگر برای اندازه‌گیری میزان ناخالصی. هرچه جینی کمتر باشد، دسته‌بندی بهتر انجام شده است.

چرا درخت تصمیم‌گیری محبوب است؟ (مزایا)

  • سادگی در درک: خروجی آن برای انسان کاملاً قابل فهم است (برخلاف مدل‌های سیاه یا Black-box مثل شبکه عصبی).
  • عدم نیاز به پیش‌پردازش پیچیده: نیاز به نرمال‌سازی داده‌ها یا حذف مقادیر پرت ندارد.
  • کاربردی برای هر دو نوع داده: هم برای دسته‌بندی (Classification) و هم برای پیش‌بینی اعداد (Regression) استفاده می‌شود.

چالش‌های الگوریتم (معایب)

  • بیش‌برازش (Overfitting): این بزرگترین نقطه ضعف است! اگر درخت خیلی بزرگ شود، تمام جزئیات داده‌های آموزشی را حفظ می‌کند و در مواجهه با داده‌های جدید شکست می‌خورد.
  • راه حل: هرس کردن (Pruning) درخت؛ یعنی حذف شاخه‌های غیرضروری.
  • ناپایداری: تغییر کوچکی در داده‌ها می‌تواند کل ساختار درخت را عوض کند.

کاربردهای واقعی درخت تصمیم‌گیری

  1. بانکداری: تایید اعتبار مشتریان برای دریافت وام (بر اساس سن، درآمد و سابقه چک).
  2. پزشکی: تشخیص بیماری‌ها بر اساس علائم ظاهر شده در بیمار.
  3. بازاریابی: پیش‌بینی اینکه آیا یک مشتری محصول خاصی را خریداری می‌کند یا خیر.
  4. تولید: کنترل کیفیت و تشخیص قطعات معیوب در خط تولید.

یک مثال کاربردی (تأیید وام)

فرض کنید می‌خواهیم بفهمیم آیا به یک نفر وام بدهیم یا نه:

  1. گره اول: آیا درآمد بالای ۱۰ میلیون است؟
  • خیر -> رد وام
  • بله -> برو به مرحله بعد
  1. گره دوم: آیا سابقه چک برگشتی دارد؟
  • بله -> رد وام
  • خیر -> تایید وام

جمع‌بندی

درخت تصمیم‌گیری مانند یک راهنمای نقشه عمل می‌کند. اگرچه الگوریتم‌های پیچیده‌تری مثل «جنگل تصادفی» (Random Forest) وجود دارند که از ترکیب چندین درخت تصمیم ساخته شده‌اند، اما درک درخت تصمیم پایه، کلید ورود به دنیای یادگیری ماشین است

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *