متدولوژی تصمیم گیری در ایجاد پایگاه داده تحلیلی
مقاله کارشناسی ارشد مهندسی نرم افزار با عنوان متدولوژی تصمیم گیری در ایجاد پایگاه داده تحلیلی سیستم همکاری در فروش فایل فایلینا fileina فایلینا |
![]() |
دسته بندی | مهندسی نرم افزار |
فرمت فایل | doc |
حجم فایل | 83 کیلو بایت |
تعداد صفحات فایل | 17 |
متدولوژی تصمیم گیری در ایجاد پایگاه داده تحلیلی
چكیده
نظر به اینكه دلیل اصلی شكست سیستم های پایگاه داده تحلیلی، عدم تشخیص لزوم ایجاد آنهاست، تحلیل لزوم ایجاد پایگاه داده تحلیلی دارای اهمیت بسیار زیادی بوده و در این گزارش مورد بررسی قرار می گیرد. به این منظور ابتدا انواع پرس و جو دسته بندی شده و سپس بر روی یك پایگاه داده نمونه و پایگاه داده تحلیلی متناظر با آن با سایزهای مختلف اعمال شد و دیدیم كه در رابطه با پرس و جوهای چندبعدی و مجتمع ، وجود پایگاه داده تحلیلی ضروری بوده و در رابطه با پرس و جوهای تودرتو و پیوندی ، استفاده از پایگاه داده تحلیلی مفید بوده و برای پری و جوهای ساده و محاسباتی ، استفاده از پایگاه داده مناسب تر می باشد. در این مقاله، هدف از متدولوژی، ارائه یک چهارچوب کاری است.
کلمات کلیدی:
پایگاه داده
پایگاه داده تحلیلی
پرس و جو
طراحی پایگاه داده تحلیلی
متدولوژی تصمیم گیری در ایجاد پایگاه داده تحلیلی
مقدمه
با بررسی منابع مختلف، دیدیم كه به چگونگی ساخت پایگاه داده تحلیلی بسیار پرداخته شده است. ساخت پایگاه داده تحلیلی شامل مراحل زیر است:
-انتخاب فرایند تجاری: این فرایند، فرایند عملیاتی اصلی در سازمان مورد نظر می باشد . سازمان مورد نظر شامل چندین سیستم می باشد که در آن داده ها برای پایگاه داده تحلیلی جمع آوری می شوند.
-انتخاب دانه : دانه در واقع یک رکورد در جدول حقیقت می باشد و می تواند یک تراکنش خاص باشد.
-انتخاب بعدها : مانند زمان، محصول و مشتری به همراه شناسایی ویژگیهای آن بعد.
-انتخاب حقایق قابل اندازه گیری جدول حقایق : این حقایق مقادیر شمارشی و افزودنی می باشند.
-تشخیص پارامترهای تحلیلی: رکوردی که خلاصه ای از بعضی رکوردهای جدول حقیقت سطح پایه را ارائه می دهد.
پس از ساخت چهارچوب اصلی پایگاه داده تحلیلی، فعالیتهای زیر به منظور پركردن اطلاعات آن باید صورت گیرد:
آماده سازی، یکپارچگی، تحلیل سطح بالا، خصوصی سازی
آماده سازی برای هر منبعی انجام می شود و شامل استخراج داده، پاکسازی آن و احتمالا بایگانی آن قبل یا بعد از پاکسازی می باشد. قدم دوم شامل تطبیق داده و یکپارچگی آن می باشد که پاکسازی چند منبعه می باشد. قدم سوم محاسبه دیدهای تحلیلی از دیدهای پایه و در واقع ایجاد پارامترهای تحلیلی می باشد. قدم چهارم شامل استخراج و خصوصی سازی اطلاعات، در واقع ایجاد پایگاه پردازش تحلیلی خاص می باشد.
نظر به اینكه فعالیتهای فوق زمانبر و پرهزینه می باشند، تصمیم گیری اینكه آیا واقعا در كاربرد موردنظر ما پایگاه داده تحلیلی لازم می باشد یا خیر، بسیار مورد اهمیت بوده و علت اصلی شكست سیستم های دارای پایگاه داده تحلیلی، ایجاد آنها در مواقعی است كه واقعا مورد نیاز نمی باشند. تشخیص این مساله بسیار مورد اهمیت بوده و در منابع مختلف به آن پرداخته نشده است. به این منظور ابتدا باید کاربران سیستم شناسایی شوند و در صورت نیاز کاربران به تصمیم گیری های مدیریتی، دانه سیستم و نوع پرس و جو های درخواستی آنها از سیستم شناسایی شود. در این مقاله لزوم ایجاد پایگاه داده تحلیلی، با توجه به نوع پرس و جو كه قرار است در سیستم مورد نظر پاسخگویی شود مورد بررسی قرار می گیرد. در واقع با توجه به اینكه سیستم ما باید پاسخگو به چه نوع پرس و جویی باشد، تشخیص می دهیم كه آیا پایگاه داده تحلیلی لازم است و یا اینكه پایگاه داده كفایت می كند. بنابراین به این منظور قدم اول شناسایی پرس و جو های سیستم آتی است.
پس از شناسایی پرس و جو های مورد نیاز سیستم، با توجه به جدول ارائه شده در بخش خلاصه (جدول 16)، اگر پاسخگویی به نوعی از پرس و جوهای مطرح در كاربرد مورد نظر، نیاز به پایگاه داده تحلیلی داشت، پایگاه داده تحلیلی باید ایجاد شود.
به این منظور ابتدا به تعریف پرس و جو می پردازیم. پرس و جو یک واحد کاری است در سیستم های اطلاعاتی که برخلاف تراكنش در سیستم های عملیاتی، شامل درج، بهنگام سازی و پاک کردن نمی باشد. تراكنش یك برنامه اجرایی است كه به داده های مختلف دسترسی پیدا كرده و گاها آنها را بهنگام سازی می كند. این برنامه اجرایی با زبانهای برنامه نویسی سطح بالا (مانند SQL، C و جاوا) نوشته می شود و با دستور Begin Transaction شروع شده و با End Transaction خاتمه می یابد و دارای خصوصیات زیر است:
-اتمیک: هر تراكنش یا تمام دستوراتش اجرا می شود و یا اینكه هیچ یك از دستوراتش اجرا نمی شوند.
-سازگاری: اجرای تراكنش به تنهایی، سازگاری پایگاه داده را تضمین می كند.
-جدایی: اجرای همزمان تراكنشها باعث اثر جانبی تراكنشها بر روی هم نمی شود. در واقع به نظر می رسد که هر تراكنش به تنهایی اجرا می شود.
-پایداری: پس از اجرای تراكنش، تغییری كه در پایگاه داده ایجاد می كند، از بین نخواهد رفت حتی اگر سیستم دچار خرابی شود.
حال آنکه پرس و جو تنها به واکشی و ارائه داده مورد درخواست می پردازد.
در این گزارش ابتدا انواع پرس و جو دسته بندی شده و ساختار داده ای هر یك ارائه می شود. هدف از این دسته بندی، تشخیص لزوم ایجاد پایگاه داده تحلیلی با توجه به انواع پرس و جو كه به آن اعمال می شود می باشد. بنابراین، پس از آن، نحوه پاسخگویی هر یك از این انواع بر روی پایگاه داده و پایگاه داده تحلیلی متناظر با آن در سایزهای مختلف ارزیابی می شود. به این منظور مقاله ارائه شده دارای هفت بخش دیگر است. در بخش یك، انواع پرس و جو دسته بندی می شود و ساختار داده ای هر دسته ارائه می شود. در بخش دوم، پارامترهای ارزیابی سیستم در رابطه با پرس و جو ارائه می شود. در بخش سوم، یك پایگاه داده و پایگاه داده تحلیلی متناظر با آن به منظور انجام آزمایشات معرفی می شوند. بخش چهارم شامل بررسی نحوه پاسخگویی پایگاه داده و پایگاه داده تحلیلی به انواع پرس و جوهای دسته بندی شده بوده و در بخش پنجم، نتایج آزمایشات بررسی می شود. خلاصه مقاله در بخش ششم ارائه شده و در نهایت، بخش هفتم دربرگیرنده فهرست منابع می باشد.
فهرست
1- چكیده2
2- کلید واژه2
3- مقدمه2
4- دسته بندی انواع پرس و جو3
5-2- پرس و جوی ساده3
5-3- پرس و جوی مجتمع4
5-4- پرس و جوی تودرتو4
5-5- پرس و جوی پیچیده4
5-6- پرس و جوی محاسباتی5
2-6- پرس و جوی پیوندی5
2-7- پرس و جوی بزرگ5
2-8- پرس و جوی چندبعدی6
5- پارامترهای ارزیابی سیستم در رابطه با پرس و جو6
6- معرفی پایگاه داده نمونه و پایگاه داده تحلیلی متناظر با آن به منظور انجام آزمایشات6
6-1- جدول1: جدول شخص (Person_Table)7
6-2- جدول3: جدول شماره تلفن اشخاص (Tel_Table)8
جدول4: جدول قرارداد (Contract_Table)8
6-3- جدول5: جدول تعهدات (Commitment_Table)8
6-4- جدول6: جدول خسارت (Damage_Table)8
6-5- شکل1: دیاگرام ارتباطی پایگاه داده9
6-6- جدول 7 : جدول حقیقت (Insurance_Fact)9
6-7- جدول 8 :بعد زمان (Time_Dimension)9
6-8- جدول9: بعد شخص (Person_Dimension)9
جدول10 : بعد تعهد (Commitment_Dimension)9
7- نحوه پاسخگویی پایگاه داده و پایگاه داده تحلیلی به انواع پرس و جو11
5-1- نتایج اجرای پرس و جوی ساده11
5-2- نتایج اجرای پرس و جوی مجتمع11
5-3- نتایج اجرای پرس و جوی تودرتو12
5-4- نتایج اجرای پرس و جوی پیوندی12
5-5- نتایج اجرای پرس و جوی بزرگ (پرس و جوی دو بعدی)13
5-6- نتایج اجرای پرس و جوی بزرگ (پرس و جوی سه بعدی)14
8- بررسی نتایج15
9- خلاصه و نتیجه16
10- فهرست منابع16