loading...
مهفا44
س بازدید : 437 جمعه 14 آبان 1395 نظرات (0)
افزایش كارایی پرس و جوهای پایگاه داده تحلیلی با نگاشت مكعب مفهومی به فضای دوبعدی

در این مقاله با به کارگیری تکنیک‌های محاسبه از پایین به بالای عناصر شبکه جستجو، روش کارآیی برای پردازش پرس‌وجو در پایگاه داده تحلیلی و انجام محاسبات مکعب داده ارائه شده است

دانلود افزایش كارایی پرس و جوهای پایگاه داده تحلیلی با نگاشت مكعب مفهومی به فضای دوبعدی

مکعب داده
پایگاه داده تحلیلی
پردازش تحلیلی برخط
مدل داده‌ی چند بعدی
افزایش كارایی پرس و جوهای پایگاه داده تحلیلی
نگاشت مكعب مفهومی به فضای دوبعدی
سیستم همکاری در فروش فایل
همکاری در فروش فایل
فروش فایل
fileina
فروشگاه فایل
خرید مقاله و تحقیق رشته نرم افزار
دسته بندی مهندسی نرم افزار
فرمت فایل doc
حجم فایل 89 کیلو بایت
تعداد صفحات فایل 9

افزایش كارایی پرس و جوهای پایگاه داده تحلیلی با نگاشت مكعب مفهومی به فضای دوبعدی

 
چكیده
پایگاه داده تحلیلی و پردازش تحلیلی برخط، از جمله عناصر ضروری در سیستم‌های تصمیم‌یار به شمار می‌روند كه به طور روز افزون در مباحث مرتبط با پایگاه‌های داده مورد توجه قرار گرفته‌اند. سیستم‌های تصمیم‌یار نسبت به سیستمهای پردازش تراكنش برخط، نیازمندی‌های متفاوتی دارد. در این سیستم‌ها بهینه‌سازی پرس‌وجوها و پردازش کارآی مکعب های داده‌ای نقش اساسی در عملکرد سیستم ایفا می‌کند.
 
در این مقاله با به کارگیری تکنیک‌های محاسبه از پایین به بالای عناصر شبکه جستجو، روش کارآیی برای پردازش پرس‌وجو در پایگاه داده تحلیلی و انجام محاسبات مکعب داده ارائه شده است. بررسی نتایج به دست آمده بر مبنای پارامترهای ارزیابی، حکایت از آن دارد که الگوریتم ارائه شده در این مقاله نسبت به بهترین الگوریتم‌هایی که پیش از آن ارائه شده‌اند عملکرد بهتری (بر اساس معیار زمان اجرا) از خود نشان می‌دهد و سرعت آن در اجرای پرس و جوهای یکنوا و با حجم داده های بسیار زیاد، به مراتب بهتر از الگوریتم های پیش از آن است. ضمن اینکه با توجه به نگاه دو بعدی ایجاد شده توسط این الگوریتم به مساله مکعب و تبدیل مکعب به ساختار ابرگراف، میزان حافظه مورد نیاز این الگوریتم در مواردی که مجموع سازی بر روی زیرمجموعه‌ای از ابعاد مکعب صورت پذیرد، کمتر از حافظه‌ی مصرف شده توسط الگوریتم‌های پیش از آن است.
 
 
كلید واژه:

مکعب داده

پایگاه داده تحلیلی

پردازش تحلیلی برخط

مدل داده‌ی چند بعدی

 
 
 
1- مقدمه
پایگاه داده‌ی تحلیلی، ابزاری برای پشتیبانی تصمیم است كه از منابع داده‌ی سازمان‌ها و ارگان‌های متفاوت تهیه می‌شود. این پایگاه داده بستر مناسبی فراهم می‌آورد كه داده‌های بایگانی شده در پایگاه‌های داده‌ی عملیاتی، به صورت مجتمع و سازمان یافته درآیند و برای استخراج دانش مناسب باشند. تعریف ارائه شده توسط اینمون (Inmon) برای پایگاه داده تحلیلی به صورت زیر است: "پایگاه داده تحلیلی، یك مجموعه موضوع-گرا، یكپارچه، متكی بر بازه‌های زمانی متفاوت (متغیر با زمان) ، و تغییرناپذیر از داده‌ها است كه برای پشتیبانی مدیریت پردازش تصمیم‌گیری (تصمیم‌یاری) به كار می‌رود."[12]
 
پایگاه‌های داده تحلیلی با توجه به اینکه اطلاعات مجتمع شده از چندین پایگاه داده عملیاتی را در خود دارند  شامل حجم عظیمی از داده هستند. این مساله سبب بروز مشکلاتی در نگهداری و به کارگیری پایگاه‌های مزبور می‌شود. برای اینکه بتوان به صورت کارا به پرس‌وجوهایی که از پایگاه داده تحلیلی می‌شود پاسخ داد، باید از روشهایی کارا برای دستیابی به داده و پردازش پرس‌وجو استفاده کرد. به این منظور الگوریتم‌های فراوانی ارائه شده‌اند که هدف آنها انجام پرس و جوها به نحوی است که زمان لازم برای پاسخگویی کمینه باشد و در عین حال فضای حافظه مورد نیاز برای انجام پردازش ها بهینه و یا دست کم قابل قبول باشد.
 
پایگاه های داده تحلیلی را می توان از دیدگاه مفهومی به صورت مجموعه ای چند بعدی از داده ها دید. این دیدگاه چند بعدی را مکعب داده می نامند. مكعب داده در [6] ارائه شده و برخی از ویژگی‌های مفید محاسبه مكعب بیان شده است. منظور از محاسبه مکعب داده، پاسخگویی به پرس و جوهای تحلیلی است که از پایگاه داده تحلیلی متناظر با آن می شود.  چون این پرس وجوها تحلیلی هستند و به بررسی داده ها در بعد کلان می پردازند، نیاز به مجموع سازی داده ها در ابعاد مختلف مکعب دارند.سه نوع تابع برای انجام عملیات مجموع‌سازی تعریف می‌شوند [1]. مجموعه‌ای مانند T از چندگانه‌ها (ركوردها) را در نظر بگیرید. فرض كنید كه مجموعه‌ی  یك مجموعه‌ی كامل از زیر مجموعه‌های جدا از هم T باشد یعنی  و . 
 
•تابع مجموع‌ساز F، تابع توزیعی خوانده می‌شود اگر تابعی مانند G وجود داشته باشد طوریكه  . توابع SUM، MIN، و MAX همگی توابعی توزیعی هستند كه در آنها G=F است. تابع COUNT نیز یك تابع توزیعی است كه در آن G=SUM است.
•تابع مجموع‌ساز F جبری است اگر تابع M-مقداری G و تابع H موجود باشند طوریكه   كه در آن مقدار M برخلاف مقادیر |T| و n ثابت است. همه‌ی تابع‌های توزیعی توابعی جبری نیز هستند. علاوه بر آنها توابعی نظیر میانگین، انحراف معیار استاندارد، MaxN و MinN نیز توابعی جبری هستند. به عنوان مثال، در تابع میانگین (Average)، تابع G مقادیر SUM و COUNT را به دست می‌آورد و تابع H نتایج به دست آمده از تابع G را بر هم تقسیم می‌نماید.
•یك تابع مجموع‌ساز نظیر F را هولیستیك می‌نامند اگر جبری نباشد. برای مثال توابع میانه (Median) و رتبه (Rank) نمونه‌ای از توابع هولیستیك هستند. 
 
 
فهرست مطالب
افزایش كارایی پرس و جوهای پایگاه داده تحلیلی با نگاشت مكعب مفهومی به فضای دوبعدی1
چكیده1
كلید واژه1
1- مقدمه2
2- پرس و جوهای آستانه ای3
3- الگوریتم  Ex-Cube5
3-1- تعاریف و نمادها5
3-2- ساختار ابرگراف6
3-3- ذخیره سازی دوبعدی Ex-Graph6
3-4- فضای لازم برای ذخیره سازی Ex-Graph7
4- شبیه‌سازی و نتایج به دست آمده8
4-1- تاثیر افزایش حجم پایگاه داده بر روی شمای ثابت بر سرعت محاسبات8
4-2- تغییرات زمان با افزایش کاردینالیتی ابعاد8
4-3- افزایش تعداد ابعاد8
4-4- افزایش تعداد ابعاد9
5- نتیجه9
مراجع9
 
 
 OLAP
Data Cube
Data Warehouse
On-Line Analytical Processing
Multi-dimensional Data Model

دانلود افزایش كارایی پرس و جوهای پایگاه داده تحلیلی با نگاشت مكعب مفهومی به فضای دوبعدی

س بازدید : 110 سه شنبه 04 آبان 1395 نظرات (0)
مقاله رشته مهندسی نرم افزار با عنوان داده کاوه

در داده کاوی معمولا به کشف الگوهای مفید از میان داده ها اشاره می شود منظور از الگوی مفید ، مدلی در داده ها است که ارتباط میان یک زیر مجموعه از داده ها را توصیف می کند و معتبر ، ساده ، قابل فهم و جدید است

دانلود مقاله رشته مهندسی نرم افزار با عنوان داده کاوه

داده کاوی
DATA MINING
استخراج اطلاعات
دسته بندی داده ها
فرآیند و مراحل داده کاوی
تفاوت داده کاوی و آنالیز های آماری
دانلود مقاله رشته مهندسی نرم افزار با عنوان داده کاوه
سیستم همکاری در فروش فایل
همکاری در فروش فایل
فروش فایل
خرید مقاله و تحقیق رشته نرم افزار
fileina
فروشگاه ساز فایل
فروشگاه فایل
دسته بندی کامپیوتر و IT
فرمت فایل doc
حجم فایل 904 کیلو بایت
تعداد صفحات فایل 21

مقاله رشته مهندسی نرم افزار با عنوان داده کاوه

 

*یک PDF با 31 صفحه بصورت رایگان ضمیمه شده است:)
 
مقدمه
 از سال 1950 به بعد که رایانه ، در تحلیل و ذخیره سازی داده ها به کار رفت ، حجم اطلاعات ذخیره شده درآن پس از حدود 20 سال دو برابر شد و همزمان  با پیشرفت فناوری اطلاعات ، حجم داده ها در پایگاه داده ها هر دو سال یک بار ، دو برابر شد و همچنان  باسرعت بیش تری نسبت به گذشته حجم اطلاعات  ذخیره شده بیش تروبیش تر می شود . با وجود شبکه جهانی وب ، سیستم  های یکپارچه اطلاعاتی ، سیستم های یکپارچه بانکی ، تجارت الکترونیکی و ... لحظه به لحظه به حجم داده ها  در پایگاه داده ها اضافه شده و باعث به وجود آمدن انبارهای ( توده های ) عظیمی از داده ها شده است ، به طوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است .
 
      شدت رقابت ها  در عرصه های علمی ، اجتماعی ، اقتصادی ، سیاسی و نظامی نیز اهمیت سرعت یا زمان دسترسی به اطلاعات را دو چندان کرده است . بنا براین نیاز به طراحی سیستم هایی که قادر به اکتشاف سریع اطلاعات مورد علاقه کاربران با تاکید بر حداقل مداخله انسانی باشند از یک سو و روی آوردن به روش های تحلیل متناسب با حجم داده های حجیم ازسوی دیگر ، به خوبــــــی احســاس می شود . در حال حاضر ، داده کاوی مهم ترین فناوری برای بهره وری موثر ، صحیح و سریع ازداده های حجیم است و اهمیت آن رو به فزونی است
داده کاوی پل ارتباطی میان علم آمار ، علم کامپیوتر ، هوش مصنوعی ، الگوشناسی ، فراگیری ماشین داده می باشد.  داده کاوی فرآیندی پیچیده جهت شناسایی الگوها و مدل های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده می باشد، به طریقی که این الگو ها و مدلها برای انسانها قابل درک باشند.
 
داده کاوی به صورت یک محصول قابل خریداری نمی باشد، بلکه یک رشته علمی و فرآیندی است که بایستی به صورت یک پروژه پیاده سازی شود.داده ها اغلب حجیم می باشند و به تنهایی قابل استفاده نیستند،اما دانش نهفته در داده ها قابل استفاده می باشد.بنابراین بهره گیری از قدرت فرآیند داده کاوی جهت شناسایی الگوها و مدلها و نیز ارتباط عناصر مختلف در پایگاه داده جهت کشف دانش نهفته در داده ها و نهایتا تبدیل داده به اطلاعات، روز به روز ضروری تر می شود.در داده کاوی معمولا به کشف الگوهای مفید از میان داده ها اشاره می شود . منظور از الگوی مفید ، مدلی در داده ها است که ارتباط میان یک زیر مجموعه از داده ها را توصیف می کند و معتبر ، ساده ، قابل فهم و جدید است .
 
 
 
کلمات کلیدی:

داده کاوی

DATA MINING

استخراج اطلاعات

دسته بندی داده ها

فرآیند و مراحل داده کاوی

تفاوت داده کاوی و آنالیز های آماری

 
 
 
تاریخچه 
     با توجه به وجود اطلاعات ارزشمند در پایگاه های  داده ای در اواخر دهه 80 میلادی ، تلاش برای استخراج و استفاده از اطلاعات پایگاه های  داده ای شروع شد . داده کاوی فرایندی است که در آغاز دهه 90 پا به عرصه ظهور گذاشته و با نگرشی نو ، به مسئله استخراج اطلاعــات از پایگـــاه داده ها می پردازد . در سال 1989 و 1991 کارگاه های کشف دانش از پایگاه داده ها توسط پیاتتسکی و همکارانش  و در فاصله سال های 1991 تا 1994 کارگاه های فوق ، توسط فایاد و پیا تتسکی و دیگران برگزار شد .
 
به طور رسمی اصطلاح داده کاوی برای اولین بار توسط « فیاض »  در اولیـن کنفرانس بین المللی « کشف دانش و داده کاوی »  در سال 1995 مطرح شد . از سال 1995 داده کاوی به صورت جدی وارد مباحث آمار شد.و در سال 1996 ، اولین شماره مجله کشف دانش از پایگاه داده ها منتشر شد .امروزه کنفرانس های مختلفی دراین زمینه در سراسر دنیا برگزار می شود . داده کاوی حاصل تحول تدریجی در طول تاریخ بوده و از اوایل دهه 90 همزمان با همه گیر شدن استفاده از پایگاه های داده ای به عنوان یک علم مطرح شده است. 
 
 
 

دانلود مقاله رشته مهندسی نرم افزار با عنوان داده کاوه

س بازدید : 96 سه شنبه 04 آبان 1395 نظرات (0)
متن کاوی و ارزیابی مهمترین متد های متن کاوی

در این مقاله ما به بررسی یکی از جدیدترین زمینههای مورد تحقیق در داده کاوی، متن کاوی می پردازیم در این مقاله روش های موجود برای پیش پردازش کردن، رده بندی ، استخراج اطلاعات ، روش های یافتن روابط شرح داده می شوند در پایان هر بخش ارزیابی و مقایسه ای روی روش های بیان شده در آن بخش صورات میگیرد و در پایان تعدادی از کاربردهای متن کاوی بیان می گردند

دانلود متن کاوی و ارزیابی مهمترین متد های متن کاوی

الگوریتم خوشه بندی
روش های استخراج اطلاعات
متن کاوی
داده کاوی
یکپارچه  کردن داده کاوی
دسته بندی و مرتب سازی داده ها
دانلود مقاله متن کاوی و ارزیابی مهمترین متد های متن کاوی
سیستم همکاری در فروش فایل
همکاری در فروش فایل
فروش فایل
خرید مقاله و تحقیق رشته نرم افزار
fileina
فروشگاه ساز فایل
فروشگاه فایل
دسته بندی مهندسی نرم افزار
فرمت فایل doc
حجم فایل 404 کیلو بایت
تعداد صفحات فایل 33

متن کاوی و ارزیابی مهمترین متد های متن کاوی

 
چکیده
    رشد فزاینده پایگاه داده ها در تقریبا هر ناحیه از فعالیت انسان باعث شده است که نیاز برای ابزارهای قدرتمند جدید برای تغییر دادن داده به دانش مفید افزایش یابد. برای برآوردن این نیاز محققان در ناحیه های مختلف مانند یادگیری ماشین ، شناسایی الگو، آنالیز داده آماری، بصری سازی داده ، شبکه های عصبی، اقتصاد سنجی، بازیابی اطلاعات، استخراج اطلاعات و..... روش ها و ایده هایی را کاوش کرده اند. ذات غیرساخت یافته ی این متون، اعمال همان روشهایی را که ما در مورد پایگاه داده های غیرمتنی بکار می بریم، غیر ممکن می سازد. بنابراین روش ها و الگوریتم-های پردازش (پیش پردازش)خاصی برای استخراج الگوهای مفید موردنیاز است. متن کاوی اطلاعات متنی غیرساختیافته را استفاده می کند و آنرا برای کشف ساختار و معناهای ضمنی پنهان در متن بررسی می کند. 
 
در این مقاله ما به بررسی یکی از جدیدترین زمینه-های مورد تحقیق در داده کاوی، متن کاوی می پردازیم. در این مقاله روش های موجود برای پیش پردازش کردن، رده بندی ، استخراج اطلاعات ، روش های یافتن روابط شرح داده می شوند در پایان هر بخش ارزیابی و مقایسه ای روی روش های بیان شده در آن بخش صورات می-گیرد و در پایان تعدادی از کاربردهای متن کاوی بیان می گردند.
 
 
کلمات کلیدی:

متن کاوی

داده کاوی

استخراج اطلاعات

یکپارچه  کردن داده کاوی

دسته بندی و مرتب سازی داده ها

 
 
 
مقدمه
   بخش قابل توجهی از اطلاعات قابل دسترس در پایگاه داده های متنی (یا پایگاه داده های سند ) كه شامل مجموعه بزرگی از اسناد منابع مختلف (مثلا مقالات خبری، paperها، كتاب ها، ایمیل ها و صفحات وب) ذخیره شده اند. پایگاه داده های متنی به علت افزایش مقدار اطلاعات موجود به فرم الكترونیكی سریع رشد می كنند. امروزه بیشتر اطلاعات در صنعت، کسب و کار  و سازمان های دیگر به صورت الكترونیكی و به فرم پایگاه داده متنی ذخیره شده اند.   داده های ذخیره شده در بیشتر پایگاه  داده های متنی، داده های نیمه ساختاریافته هستند چون نه به طور كامل غیرساختیافته هستند و نه به طور كامل ساختیافته هستند. 
 
برا ی مثال یك سند شامل تعدادی فیلد ساختیافته مانند عنوان، نویسندگان، تاریخ انتشار، رده  و ..... و از طرف دیگر شامل برخی كامپوننت های متنی غیرساختاریافته مانند چكیده و محتویات است. تكنیك های بازیابی اطلاعات مانند (متدهای ایندکس کردن متن ) برای هندل كردن سندهای غیر ساختاریافته ایجاد شده اند. تكنیك های بازیابی اطلاعات قدیمی برای مقدار زیادی داده متنی كه به طور فزاینده افزایش می یابند، ناكارآمد هستند. بدون دانستن محتویات سندها، فرمول بندی كردن Queryهای مناسب برای آنالیز كردن و استخراج كردن اطلاعات مفید از داده، مشكل است.
 
 كاربرها نیاز به ابزارهایی برای مقایسه سندهای مختلف، مرتب كردن سندها بر اساس موبوط بودن آن ها و یافتن الگوها دارند.  بنابراین یکی از جدیدترین زمینه های مورد تحقیق در داده کاوی، متن کاوی برای این منظور گسترش یافت. متن کاوی یعنی جستجوی الگوها در متن غیرساختیافته. متن کاوی برای کشف اتوماتیک دانش مورد علاقه یا مفید از متن نیمه ساختیافته استفاده می شود. چندین تکنیک برای متن کاوی پیشنهاد شده است عبارتند از ساختار مفهومی ،کاوش association ruleها درخت تصمیم گیری، روش های استنتاج قوانین ، همچنین تکنیک های بازیابی اطلاعات برای کارهایی مانند تطبیق دادن سندها، مرتب کردن کردن، کلاسترینگ و.....
 
 
فهرست مطالب
چکیده 3
1 مقدمه3

1.1 کشف دانش و ارتباط آن متن کاوی5

2.1 تعاریف متن کاوی5

3.1 ناحیه های سرچ مرتبط6
2 روش ها پیش پردازش کردن متون7
1.2 مدل فضای برداری9

2.2 پیش پردازش زبان شناختی10

3 روش های متن کاوی ...10
1.3 فازهای اصلی فرآیند کتن کاوی...11
2.3 رده بندی ...12
1.2.3 انتخاب ترم ایندکس12
2.2.3 رده کننده Naïve Bayes12
3.2.3 رده بندی کننده نزدیکترین همسایه13
4.2.3 درخت تصمیم گیری14
5.2.3 متدهای هسته و SVM14
6.2.3 ارزیابی رده بندی کننده ها15
3.3  استخراج اطلاعات16
1.3.3 رده بندی برای استخراج اطلاعات16

2.3.3 مدل مارکوف پنهان17

3.3.3 فیلدهای رندم شرطی17

4.3.3 مقایسه روش های استخراج اطلاعات18

2.2 پیش پردازش زبان شناختی18
4.3 روش ها ترکیبی18
1.4.3 روش های dicsotex18
1.1.4.3 مقدمه19

2.1.4.3 یکپارچه  کردن داده کاوی و استخراج اطلاعات19

3.1.4.3 سیستم dicsotex19
2.4.3روش textminer21
1.2.4.3 مقدمه21
2.2.4.3 استخراج اطلاعات22

3.2.4.3 الگوریتم خوشه بندی23

3.4.3 یافتن روابط25
4.4.3 مقایسه روش های ترکیبی26
4 کاربردهای متن کاوی26
5 نتیجه گیری و کارهای آینده27
6 مراجع28
 
 
 
 
 
 
 

دانلود متن کاوی و ارزیابی مهمترین متد های متن کاوی

اطلاعات کاربری
  • فراموشی رمز عبور؟
  • لینک دوستان
  • نگین فایل22
  • فایل آف
  • نگین فایل
  • آویشو
  • الکترونیک دات آی آر
  • فایلز شاپ
  • وادافایل
  • فایل ناب44
  • فایل سل
  • پی ان یو فایل
  • بازارفایل44
  • دانلود فایل های علمی
  • فایل44 مرکز خرید و فروش فایل قابل دانلود
  • دانود فایل و کسب درآمد
  • دانلود فایل ها
  • فایلوکس44
  • آریافایل44
  • پرشین2 موزیک
  • فایلود44
  • آراس نوین
  • آراس44
  • اسرانوین
  • اسرا44
  • فروشگاه اینترنتی پارسی2
  • استوفایل44
  • فایل فروش44
  • فایل بوکر44
  • اربان شاپ44
  • سیدوآنلاین44
  • فایلینا44
  • زپوفایل
  • قطره اسپانیش فلای اصل
  • فایل یار
  • دانلود پروژه
  • خرید فایل های قابل دانلود فایلود
  • خرید فایل های قابل دانلود آریافایل
  • خرید فایل های قابل دانلود
  • فروشگاه اینترنتی پارسی44
  • فروشگاه اینترنتی شاندرمن ویرافایل
  • فروشگاه مستند
  • فروشگاه مستند پارسی
  • خرید ویندوز 8.1
  • فروشگاه اینترنتی شاندرمن سیتی
  • فروشگاه اینترنتی ماسال مارکت
  • فروشگاه اینترنتی ماسال شاپ
  • فروشگاه اینترنتی الماس مارکت
  • فروشگاه پارسی زنبیل شاپ
  • فایل مارکت
  • سلامت فایل
  • فارسی فایل مرکز خرید و فروش فایل قابل دانلود
  • فرافایل شاپ
  • فرافایل22
  • فایلود شاپ
  • یاسا44
  • جاست استار
  • تل استار
  • آخرین مطالب ارسال شده
  • تبلیغات
    آمار سایت
  • کل مطالب : 4267
  • کل نظرات : 30
  • افراد آنلاین : 194
  • تعداد اعضا : 2
  • آی پی امروز : 289
  • آی پی دیروز : 409
  • بازدید امروز : 556
  • باردید دیروز : 2,031
  • گوگل امروز : 0
  • گوگل دیروز : 0
  • بازدید هفته : 10,146
  • بازدید ماه : 10,146
  • بازدید سال : 287,172
  • بازدید کلی : 1,812,641
  • کدهای اختصاصی