
کاوش قوانین وابستگی در جریانات سریع داده
فرمت فایل دانلودی: .docxفرمت فایل اصلی: docx
تعداد صفحات: 60
حجم فایل: 9857 کیلوبایت
کاوش قوانین وابستگی در جریانات سریع داده
تعداد صفحات : 60 با فرمت ورد و قابل ویرایش
1-1 مقدمه 2
1-2- فرضیات و محدودیت های مسئله 4
1-3- ضرورت انجام تحقیق 6
1-4- سرفصل مطالب 8
2-بیان مساله 22
2-2- مقدمه 22
2-2-1- مسئلهی کشف قوانین وابستگی 22
2-2-2- مدل سازی مسئله 23
2-3- مدلهای پردازش و کاوش جریانهای داده 27
3-بررسی ادبیات موضوع 29
3-1- مقدمه 29
3-2- انواع روشهای حل مسئله 29
3-2-1- روش های مبتنی بر پنجره نشانه 31
3-2-1-1- الگوریتم شمارش پر اتلاف 31
3-2-1-2- الگوریتم DSM-FI 33
3-2-2- روش های مبتنی بر پنجره زوال 35
3-2-2-1- الگوریتم استدک 35
3-2-3- روش های مبتنی بر پنجره کشویی 41
3-3- الگوریتم استماکس 45
3-4- الگوریتم (FastARM) 48
3-5- کاوش مجموعه های داد های با ابعاد بالا و کاوش الگوهای متناوب بسیار بزرگ 51
3-6- کاوش الگوهای ساختاری: گراف، درخت و شبکه 52
3-7- الگوریتم دی. اس. تری 53
3-8- جمع بندی 56
فهرست منابع و مآخذ 57
امروزه حجم بسیار زیادی از دادهها در پایگاه های داده ای ذخیره گردیدهاند. برای شناسایی بسیاری از الگوهای پنهان شده در این دادهها، نیازمند ابزار و تکنیکهای جدیدی میباشیم. در این راستا داده کاوی(Data Mining) به عنوان علمی نوین جهت کاوش الگوهای مفید از حجم زیاد دادهها معرفی گردیده است.کشف قوانین وابستگی (Association Rule) یکی از پرکاربردترین الگوهایی است که توسط داده کاوی استخراج میگردند و به معنای یافتن همه قوانین موجود در مشاهده اقلام مجمو عه های داده ای است بطوریکه این قوانین حجم قابل انتظاری از دادهها را تحت پوشش قرار میدهند. مهمترین فاز یافتن قوانین وابستگی، یافتن الگوهای پرتکرار می باشد.
پیشرفت علم و متعاقب آن تکنولوژی نوع جدیدی از دادهها را معرفی نموده است که بسیار پر تکرار، سریع و در عین حال نامحدود میباشند که این نوع دادهها جریان داده(Data Stream) نامیده میشوند. با توجه به ماهیت جریان داده ای، امکان ذخیره سازی داده های ورودی و مرور دوباره آنها وجود نداشته و می بایست به جای جواب های دقیق به دنبال جواب های نسبی باشیم که تا حد امکان به جواب های دقیق نزدیک باشند.
به دلیل این محدودیت ها، در سال های جدید به جای یافتن همه الگوهای پرتکرار به دنبال زیرمجموعه ای از آنها هستیم که در عین حال جزء جذاب ترین آنها نیز باشند.
در این الگوریتم های ازائه شده برای کاوش الگوهای پرتکرار را بررسی می نماییم وطی ارزیابی های انجام گرفته کارایی الگوریتم معرفی شده های در مقایسه با یکدیگر قرار می گیرند.