دانلود پایان نامه كارشناسی ارشد مهندسی فناوری اطلاعات
پیدا کردن بهترین مدل برای پیش بینی تقاضای دارو با دیتا ماینینگ
چکیده
توسعه ی استفاده از فناوری اطلاعات در بهداشت و درمان علاوه بر مزایای فراوان باعث می شود تا حجم زیادی از داده های مرتبط، در دسترس قرار بگیرند. با بکارگیری داده کاوی بر روی داده های موجود می توان تصمیم گیری ها و فرایند های مدیریتی را بهبود بخشید. در این پایان نامه تلاش شده است ضمن بررسی الگوریتم های مختلف داده کاوی مدلی جهت پیش بینی مصرف دارو در داروخانه های بیمارستان ها ارائه گردد. مجموعه داده در نظر گرفته شده مربوط به سیستم اطلاعات بیمارستان پاستور شهرستان بم می باشد که در مدت 5 سال در پایگاه داده سیستم اطلاعات این بیمارستان ذخیره شده است. برای پیش بینی مصرف دارو عملکرد مدل های MLP، SVR، ADABOOST.R، BAGTREE، LR، LSSVR مورد بررسی قرار می گیرد. دقت پیش بینی بر اساس معیارها MSE ,RMSE ,MAE وR2 ارزیابی می گردد. طبق نتایج بدست آمده عملکرد مدل BAGTREE در روش های مختلف بهتر از سایر مدل ها بوده است.
واژگان کلیدی :
پیش بینی
خرید دارو
داروخانه
سیستم های اطلاعات بیمارستان
مقدمه
در سال های اخیر مراکز بهداشتی ودرمانی کشورمان به ویژه بیمارستانها درصدد مکانیزه کردن سیستم های اطلاعاتی خود برآمده-اند. در ابتدا مقصود از چنین فعالیت هایی کاهش هزینه های ناشی ازکاغذ بازی موجود در سیستم های دستی و اداری بوده است، اما اکنون به مرحله ای رسیده ایم که بهبود کیفیت ارائه خدمات درمانی اهمیتی روزافزون می یابد و در این راستا بکار گیری سیستم های اطلاعات بیمارستان ها بسیار مرسوم شده است.
بکارگیری سیستم اطلاعات بیمارستان علاوه بر مزایای فراوان از جمله کاهش زمان پذیرش، زمان ترخیص، زمان اخذ جواب ها، زمان مراجعه به اطلاعات قبلی پرونده، بالا بردن میزان دقت در درج اطلاعات و درخواست ها كه در حالت دستی می تواند ناخوانا باشد، همچنین می تواند موجب تسریع ارتباطات بین بخشی و در نهایت بالابردن میزان رضایت بیمار، ارائه خدمات بهتر، دریافت آمار و گزارشات روزانه و زمانی گردد. در نهایت بکارگیری سیستم های اطلاعات بیمارستان، حجم زیادی از داده های مرتبط با درمان را در دسترس قرار می دهد [1]. با استفاده از تکنیک های داده کاوی می توان از داده های موجود در این سیستم ها در جهت پشتیبانی از تصمیم و مدیریت و در نهایت پیشبرد اهداف اقتصادی و درمانی سود جست .[2] دادهکاوی یکی از ده دانش در حال توسعه است و در سالهای اخیر در دنیا گسترش فوقالعاده سریعی داشته است. دادهکاوی فرآیند کشف الگوها و روابط موجود بین داده ها در پایگاه داده های بزرگ است که با برخورداری از دامنه وسیع زیر زمینههای تخصصی با توصیف، تشریح، پیشبینی و کنترل پدیدههای گوناگون پیرامون، امروزه کاربرد بسیار وسیع در حوزههای مختلفی ازجمله پزشکی و تجارت دارد [3].
افزایش هزینههای بیمارستانی در سالهای اخیر و نیز اجرای طرح خودگردانی و ادارهی بیمارستانها به وسیلهی درآمد اختصاصی آنها، بیمارستانها را با مشکلات مالی جدی رو به رو ساخته است. داروخانه یکی از بخش های مهم و درآمدزا در بیمارستان ها می باشد که می توان با بهبود خرید دارو و افزایش بهره وری آن، بنحوی به وضعیت اقتصادی بیمارستان ها کمک کرد. این حقیقت که مصرف دارو بر اساس شیوع بیمارها در فصول مختلف تغییر می کند و نیز در نظر گرفتن این نکته که برخی داروها برای درمان یک بیماری مکمل یکدیگرند، از جمله فاکتورهایی هستند که باید در خرید دارو درنظر گرفته شوند [4]. به عبارتی با توجه به بیماری های بسیار متنوع، و تجویز داروهای مختلف برای آنها، میتوان بر اساس سابقه مصرف دارو، نیاز های دارویی در آینده را پیش بینی کرد در نتیجه، در صورت بکارگیری تکنیک های داده کاوی بر روی اطلاعات موجود در سیستم اطلاعات بیماستان می توان خرید دارو را بر اساس پیش بینی صورت گرفته توسط داده کاوی بهینه کرد.
لذا بر آن شدیم تا با انجام این مطالعه به پیش بینی مصرف دارو، با استفاده از تکنیکهای داده کاوی، در داروخانه یک بیمارستان بزرگ به منظور افزایش بهره وری مالی آن بپردازیم.
فهرست مطالب
فصل 1- کلیات2
1-1- فناوری اطلاعات در بهداشت و درمان2
1-2- داروخانه های بیمارستانی3
1-3- داده کاوی3
1-3-1- داده کاوی چیست؟3
1-3-2- تكنیك های مختلف داده كاوی4
1-3-2-1-انواع تکنیک داده کاوی5
1-4- بیان مسئله6
1-5- اهداف تحقیق8
1-6- سوالات وفرضیات تحقیق9
1-6-1- سوالات9
1-6-2- فرضیات تحقیق9
1-7- فصول پایان نامه9
فصل 2- پیشینه پژوهشی12
2-1- جمع بندی24
فصل 3- مروری بر ادبیات تحقیق و مبانی نظری26
3-1- سیستم های اطلاعات بیمارستان26
3-2- تعریف و مفهوم سیستم اطلاعات بیمارستانی28
3-2-1-- اهداف سیستم اطلاعات بیمارستانی29
3-2-2- اهمیت و ضرورت راهاندازی سیستم اطلاعات بیمارستانی30
3-2-3- مزایایی سیستم اطلاعات بیمارستانی31
3-3- داده کاوی32
3-4- مراحل داده کاوی33
3-4-1- پیش پردازش داده ها35
3-4-2- پاکسازی داده ها35
3-4-3-یکپارچه سازی داده ها36
3-4-4- تبدیل دادهها36
3-4-5- تلخیص داده ها37
3-5- وظایف داده کاوی37
3-5-1- دسته بندی38
3-5-2- تخمین39
3-5-3- پیش بینی39
3-5-4- گروه بندی شباهت یا قوانین وابستگی40
3-5-5- خوشه بندی40
3-5-6- نمایه سازی41
3-6- كاربرد های داده كاوی41
3-7- رویکردهای مسائل داده کاوی در پزشکی42
3-8- مدلها و الگوریتمهای داده کاوی43
3-8-1- شبکه های عصبی مصنوعی43
3-8-1-1-ساختار شبکه عصبی44
3-8-1-2-معماری شبکه عصبی45
3-8-1-3-آموزش شبکه های عصبی مصنوعی46
3-8-1-4-انواع یادگیری در شبکه های عصبی مصنوعی47
3-8-2- درخت های انتخاب47
3-8-3- Bagging & Boosting48
3-8-3-1-Bagging55
3-8-1-1-Boosting44
3-8-1-1-الگوریتم های Boosting44
3-8-4- Adaptive Boosting(Adaboost)50
3-8-5- رگرسیون بردار پشتیبان51
3-8-6- رگرسیون خطی52
3-9 نرم افزارهای داده کاوی54
3-10- فرایند خرید دارو55
3-11- جمع بندی56
فصل 4- روش انجام پژوهش58
4-1- مقدمه58
4-2- الگوریتم پیشنهادی59
4-3- پیش پردازش دادهها60
4-3-1- ساخت ماتریس داده60
4-3-1-1-روش ماههای متوالی67
4-3-1-2-روش ماههای یکسان44
4-3-1-3-روش فصول متولی69
4-4- الگوریتمهای Prediction63
4-4-1- روش NN64
4-4-2-روش SVR64
4-4-3- روش LSSVR67
4-4-4- AdaBoost.R69
4-5- مجموعه داده70
4-5-1- پاکسازی داده72
4-6- معیارهای ارزیابی72
4-7- جمع بندی74
فصل 5- بحث و نتیجه گیری76
5-1- مقایسه روشهای مورد بررسی76
5-1-1- ارزیابی الگوریتم با روش ماههای متوالی77
5-1-2- ارزیابی الگوریتم با روش ماههای یکسان83
5-2- جمع بندی93
فصل 6- پیشنهادهاو فرصتهای پژوهشی آینده95
فهرست جداول
جدول 2- 1تکنیک های مهم داده کاوی در بخش دارویی[21] 21
جدول 4- 1 ماتریس داده بصورت ماههای متوالی60
جدول 4- 2 ماتریس داده بصورت ماههای یکسان61
جدول 4- 3 ماتریس داده بصورت فصول متوالی2
جدول 5- 1 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 77
جدول 5- 2 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Vialdioxin81
جدول 5- 3 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol82
جدول 5- 4 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 82
جدول 5- 5 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Vialdioxin 85
جدول 5- 6 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol86
جدول 5- 7نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 91
جدول 5 - 8 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol 93
فهرست شکل ها و نمودارها
شکل 2- 1 مدل پیش بینی با شبکه عصبی[4]12
شکل 2- 2 شبکه عصبی [14] BP 12
شکل 2- 3 مدل بهینه سازی خرید دارو[15]14
شکل 2- 4 مدل استخراج دانش [26] 16
شکل 2- 5 جریان عملیات در داروخانه[17] 17
شکل 2- 6 دسته بندی اهدا بکارگیری داده کاوی[15]19
شکل 2- 7 روند بکارگیری داده کاوی در پزشکی[20]20
شکل3- 1 مراحل داده کاوی[40]32
شکل3- 2 ساختار شبکه عصبی[47]43
شکل3- 3 مثالی از درخت تصمیم[41]55
شکل 3- 4 واسط کاربری سیستم اطلاعات بیمارستان55
شکل 4- 1 دیاگرام چاچوب تحقیق58
شکل4- 2 پارامترهای مورد استفاده در SVM64
شکل4- 3 گزارش تهیه شده با کریستال ریپورت70
شکل4- 4 خروجی گزارش تهیه شده با کریستال ریپورت71
شکل5- 1 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R78
شکل5- 2 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR78
شکل5- 3 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE79
شکل5- 4 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR80
شکل5- 5 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR80
شکل5- 6 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE83
شکل5- 7 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR83
شکل5- 8 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR84
شکل 5- 9 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R84
شکل5- 10 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR85
شکل 5- 11 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R86
شکل5- 12 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR87
شکل5- 13 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR87
شکل5- 14 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR88
شکل5- 15 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R89
شکل5- 16 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم NN90
شکل5- 17 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR90
شکل5- 18 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR92
شکل5- 19 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE93
شکل5- 20 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR94
شکل5- 21 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE94