دانلود مقاله کاوش قوانین وابستگی در جریانات سریع داده
چکیده:
مسئله کاوش الگوهای تکراری در پایگاهای داده در سال ۱۹۹۳ توسط آگروال و دیگران ارائه شد[ ۱]. این مسئله به علت کاربرد وسیع در تجارت، صنعت و علوم مختلف، موضوعی مهم و اساسی در زمینه کشف دانش و داده کاوی است. در سال های اخیر تحقیقات بسیار زیادی در مورد این مسئله انجام گرفته و پیشرفت های چشمگیری صورت گرفته است که حاصل آنها ارائه الگوریتم های کارا و مقیاس پذیر از یک طرف و مطرح شدن آن در کاربرد های مختلف بوده است. تحقیقات انجام شده عموماً در مورد کاوش الگوهای تکراری در پایگاه داده های ایستا بوده است به طوری که الگوریتم های مختلفی در این مورد ارائه شده اند.
کاوش الگوهای تکراری علاوه بر داده های ایستا، اخیراً در پایگاه داده های پویا و جریان های داده ۲ نیز مطرح شده است [۸]. در داده های جریانی فرض بر این است که داده ها به صورت پشت سرهم و بی وقفه به سیستم می رسند. در یک جریان داده، داده ها با سرعت و به شکلی بی پایان دریافت می شوند.
انجام محاسبات مختلف آماری و داده کاوی، از جمله مسائل مطرح در مدل جریانی می باشند. در جریان های داده، در هرلحظه، حجم داده هایی که تاکنون رسیده و در آینده نیز خواهد رسید، بسیار زیاد است، بنابراین ذخیره آن امکانپذیر نیست.
در این تحقیق مدل های مختلف بررسی و شناسایی الگو در جریان داده ها مورد بررسی قرار گرفته و الگوریتم های ارائه شده قبلی در هر مدل مورد بررسی قرار می گیرد.
کلید واژه: کاوش الگوهای پرتکرار، داده کاوی، جریان سریع داده، الگوهای توالی
فهرست مطالب:
چکیده
فصل اول: معرفی مساله
۱-۲- مقدمه
۱-۳- کاوش قوانین وابستگی
۱-۴- ضرورت انجام تحقیق
۱-۵- سرفصل مطالب
۲- بیان مساله
۲-۲- مقدمه
۲-۳- مشکلات مساله یافتن الگوهای پرتکرار
فصل سوم: ادبیات موضوع
۳-۲- مقدمه
۳-۳- مدلهای پردازش و کاوش جریانهای داده
۳-۴- جریان کاوی مجموعه اقلام تکراری در مدل نشانه
۳-۴-۱- الگوریتم شمارش پر اتلاف
۳-۴-۲- الگوریتم جنگل مجموعه اقلام تکراری پسوندی
۳-۵- کاوش مجموعه اقلام تکراری در مدل زوال
۳-۵-۱- محو زمانی بهوسیله وزن دادن مستقیم
۳-۵-۲- الگوریتم استماکس
۳-۶- کاوش مجموعه اقلام تکراری در مدل پنجرهای
۳-۷- الگوریتمهای بر اساس درخواست
۳-۷-۱- روش MFI-TRANSW
۳-۷-۲- الگوریتم استماکس+
۳-۷-۳- الگوریتم دی. اس. تری
۳-۷-۴- الگوریتم سی. پی. اس. تری
۳-۸- سایر الگوریتم ها
۳-۸-۱- الگوریتم Moment
فصل چهارم: جمع بندی
فهرست منابع و مآخذ
فهرست شکل ها
فرمت فایل: WORD
تعداد صفحات: 57
مطالب مرتبط