فیلم آموزشی استخراج داده ها Data Mining
علم استخراج داده ها Data mining به بهرهگیری از ابزارهای تجزیه و تحلیل دادهها به منظور کشف الگوها و روابط معتبری که تاکنون ناشناخته بودهاند اطلاق میشود.
این ابزارها ممکن است مدلهای آماری، الگوریتمهای ریاضی و روشهای یاد گیرنده (Machine Learning Methods) باشند که کار این خود را به صورت خودکار و بر اساس تجربهای که از طریق شبکههای عصبی (Neural Networks) یا درختهای تصمیمگیری (Decision Trees) به دست میآورند بهبود میبخشد. داده کاوی منحصر به گردآوری و مدیریت دادهها نبوده و تجزیه و تحلیل اطلاعات و پیشبینی را نیز شامل میشود برنامههای کاربردی که با بررسی فایلهای متن یا چند رسانهای به کاوش دادهها میپردازند پارامترهای گوناگونی را در نظر میگیرد
کاربردهای عمومی دادهکاوی در علم کامپیوتر عبارتند از:
- کشف الگوی میان دادهها
- پیشبینی حدودی نتایج
- تمرکز بر روی دادههای بزرگ
مفهوم مدیریت ذخیرهسازی و دستیابی اطلاعات
دادههای اطلاعاتی به عنوان یکی از منابع حیاتی سازمان شناخته میشود و بسیاری از سازمانها با اطلاعات و دانش سازمانی خود مانند سایر داراییهای ارزشمندشان برخورد میکنند.
حال تصور نمایید، دسترسی به اطلاعات در شرایطی که دادهها به روش نامناسبی نگهداری شوند و یا روش ضابطهمندی جهت دستیابی به آنها وجود نداشته باشد تا چه حد مشکل است.
سر فصل های فیلم آموزشی استخراج داده ها Data Mining به زبان فارسی:
- شناخت انواع دادهها و ویژگیها
- انواع ویژگیها و توصیف آماری دادهها
- شناخت دادهها (پراکندگی، توزیع نرمال، تحلیل هیستوگرام، اندازهگیری شباهت و عدم شباهت دادهها)
- تکمیل روشهای شباهتسنجی-مصورسازی دادهها
- عملیات پیشپردازش وپاکسازی دادهها
- عملیات پیش پردازش- تجمیع دادهها (تحلیل همبستگی – تست کای-دو)
- انواع روشهای گسستهسازی
- انباره دادهها-شماهای ستارهای، دانهبرفی تحلیل الگوهای پرتکرار
- ایجاد قوانین انجمنی
- الگوریتم Apriori
- افزایش بهرهوری الگوریتم Apriori و شروع FP-growth
- الگوریتم Eclat و معیارهای ارزیابی قوانین انجمنی
- مفاهیم دستهبندی دادهها
- درخت تصمیم
- بررسی معیارهای شاخص و هرس درخت تصمیم
- دستهبندی بیزین – دستهبندی مبتنی بر قانون
- استخراج قوانین درخت تصمیم
- ارزیابی و مقایسه روشهای دستهبندی
منبع : Data Mining