پایان نامه داده کاوی در سازمان
پایان نامه داده کاوی در سازمان
هدف از پایان نامه داده کاوی در سازمان ، کاربرد داده کاوی در کشف دانش پنهان میان داده های سامانه ۱۳۷ شهرداری تهران می باشد.
مشخصات فایل
تعداد صفحات | ۱۵۲ |
حجم | ۸۶۴ کیلوبایت |
فرمت فایل اصلی | docx |
دسته بندی | مدیریت |
توضیحات کامل
هدف از پایان نامه داده کاوی در سازمان ، کاربرد داده کاوی در کشف دانش پنهان میان داده های سامانه ۱۳۷ شهرداری تهران می باشد. تحقیق حاضر از نوع کاربردی می باشد و به بررسی به کارگیری برخی روشهای داده کاوی در مورد دادههای سامانه ۱۳۷ شهرداری تهران میپردازد.
سامانه ۱۳۷ یک مرکز گیرنده پیامهای مردمی جهت رسیدگی به مشکلات و معضلات مشکلات شهری شهروندان تهرانی میباشد. در این راستا کل پیامهای سال ۱۳۸۹ این سامانه در بانک اطلاعاتی۲۰۰۸ SQL Server گردآوری و مورد تحلیل قرار گرفت.سامانه ۱۳۷ با هدف رفع مشکلات و معضلات شهری و با رویکرد مشارکت بیشتر شهروندان در مدیریت شهری راه اندازی شده است. تعداد کل پیام ها در طول سال مورد بررسی و پس از مرحله آماده سازی داده ها مجموعاً ۱٫۰۸۲٫۱۹۵ بوده است که به لحاظ تحلیلهای آماری تعداد قابل توجه و برای تحلیلهای دادهکاوی مناسب میباشد.
رویکرد محقق در این تحقیق به کارگیری تکنیک های مختلف داده کاوی به منظور شناسایی و پیش بینی، نیازها و مشکلات شهری بر اساس داده های بدست آمده از سامانه مدیریت شهری ۱۳۷ می باشد. تمرکز اصلی در این تحقیق بر استفاده از روشهای داده کاوی و نرم افزار SPSS Clementine میباشد. همان طور که در فصل قبل بیان شد، دلیل استفاده از این نرم افزار، توانایی آن در پردازش مجموعه های داده ای بزرگ و متداول بودن آن در میان کاربران است. در بخش آماده سازی داده ها، رسم نمودارها و جداول از نرم افزارهایی نظیر Sql server 2008، Excel 2007 و Spss 16 استفاده شده است.
در مرحله ی توصیف اطلاعات، ابتدا توزیع فراوانی و درصد فراوانی متغیرهای گوناگون و همینطور برخی از شاخصهای سرانه را مورد بررسی قرار دادیم و در بخش تحلیل داده ها با استفاده از تکنیک های داده کاوی، گروه مدلها و تحلیلهای زیر مورد بررسی قرار گرفته است:
• شناسایی مناطق همگن از منظر سامانه ۱۳۷
• پیش بینی وضعیت تماس های آب گرفتگی هر یک از مناطق به ازای بارش هر میلمیتر باران
• تعیین ارتباط میان آب گرفتگی نواحی مختلف یک منطقه
• تعیین نواحی مستعدتر درهر منطقه در بروز مشکلات و معضلات شهری
فهرست مطالب
فصل اول: کلیات
مقدمه 1
۱-۱- بیان مساله 2
۱-۲- هدف تحقیق 3
۱-۳- سوالات تحقیق 3
۱-۴- اهمیت و ضرورت تحقیق 4
۱-۵- قلمرو تحقیق 5
۱-۵-۱- از منظر سازمانی 5
۱-۵-۲- از منظر زمانی و مکانی 5
۱-۵-۳- از منظر موضوعی 5
۱-۶- روش تحقیق و جمع آوری اطلاعات 5
۱-۷- تعریف واژه ها و اصطلاحات فنی 6
۱-۸- خلاصه فصل اول 6
فصل دوم: ادبیات تحقیق
مقدمه 8
۲-۱- مبانی نظری 9
۲-۱-۱- تاریخچه داده کاوی 9
۲-۱-۲- تعریف داده کاوی 10
۲-۱-۳- انواع داده کاوی 11
۲-۱-۴- دلایل استفاده از داده کاوی 12
۲-۱-۵- پیش نیازهای یک داده کاوی موفق 12
۲-۱-۶- مراحل فرایند داده کاوی ( استاندارد CRISP-DM ) 13
۲-۱-۶-۱شناخت کسب و کار 14
۲-۱-۶-۲شناخت داده ها 14
۲-۱-۶-۳آماده سازی داده ها 15
۲-۱-۶-۴مدل سازی 15
۲-۱-۶-۵ارزیابی مدل 15
۲-۱-۶-۶توسعه ی مدل 16
۲-۱-۷- قابلیت های اساسی داده کاوی 16
۲-۱-۷-۱ طبقه بندی 16
۲-۱-۷-۲ پیش بینی 17
۲-۱-۷-۳ تحلیل خوشه ای 17
۲-۱-۷-۴ تخمین 18
۲-۱-۷-۵ گروه بندی شباهت یا قوانین وابستگی 19
۲-۱-۷-۶ توصیف و نمایه سازی 20
۲-۱-۸- دسته بندی الگوریتم های داده کاوی 20
۲-۱-۹- الگوریتم های خوشه بندی 21
۲-۱-۹-۱روش افرازی ( تقسیم بندی) 21
۲-۱-۹-۱-۱الگوریتم K-MEANS 22
۲-۱-۹-۲روش های سلسله مراتبی 22
۲-۱-۹-۳روش های مبتنی بر چگالی 23
۲-۱-۱۰- الگوریتم های وابستگی قواعد 23
۲-۱-۱۰-۱الگوریتم Naïve 23
۲-۱-۱۰-۲ الگوریتم Apriori 24
۲-۱-۱۱- الگوریتم های طبقه بندی 26
۲-۱-۱۱-۱الگوریتم درخت طبقه بندی و رگرسیون (CART) 26
۲-۱-۱۱-۲الگوریتم درخت تصمیم C4.5 27
۲-۱-۱۱-۳الگوریتم های شبکه های بیزین 29
۲-۲-۱- مدیریت شهری و شهرداری 30
۲-۲-۲- نقش فن آوری اطلاعات در توسعه ی مدیریت شهری 31
۲-۲-۳- معرفی سامانه مدیریت شهری ۱۳۷ شهرداری تهران 33
۲-۲-۳-۱نحوه ی عملکرد سامانه مدیریت شهری ۱۳۷ 36
۲-۲-۳-۲ماموریت های مرکز سامانه مدیریت شهری ۱۳۷ 38
۲-۲-۳-۳رویکردهای اجرایی مرکز سامانه مدیریت شهری ۱۳۷ 38
۲-۲-۳-۴چشم انداز مرکز سامانه مدیریت شهری ۱۳۷ 39
۲-۲-۳-۵ساختار سازمانی سامانه مدیریت شهری ۱۳۷ 39
۲-۲ مدل مفهومی تحقیق 40
۲-۳- ادبیات یاپیشینه تحقیق 40
۲-۴- خلاصه فصل دوم 44
فصل سوم: روش تحقیق
مقدمه 46
۳-۱- نوع تحقیق 46
۳-۲- مدل فرایندی داده کاوی بر اساس استاندارد CRISP-DM 47
۳-۲-۱- شناخت کسب و کار 47
۳-۲-۲- شناخت داده ها 48
۳-۲-۳- آماده سازی داده ها 48
۳-۲-۴- مدل سازی 49
۳-۲-۵- ارزیابی مدل 49
۳-۲-۶- توسعه مدل 49
۳-۳- داده های تحقیق 50
۳-۴- جامعه آماری, روش نمونه گیری و حجم نمونه 50
۳-۵- روش گردآوری اطلاعات و ابزار سنجش 50
۳-۶- نوع داده ها و مقیاس آن ها 51
۳-۷- ساختار اجرایی تحقیق 51
۳-۷-۱- درک مساله کسب و کار 51
۳-۷-۲- درک داده ها 52
۳-۷-۳- آماده سازی داده ها 53
۳-۷-۴- مدل سازی 55
۳-۷-۵- ارزیابی نتایج 56
۳-۷-۶- به کارگیری مدل 56
۳-۸- مدل اجرایی تحقیق 56
۳-۹- خلاصه فصل سوم 58
فصل چهارم: تجزیه و تحلیل داده ها
مقدمه 60
۴-۱- توصیف داده ها 60
۴-۲- تحلیل توصیفی داده ها با استفاده از جداول و نمودارهای توصیفی 63
۴-۲-۱- طبقه بندی بر اساس نوع مشکل 63
۴-۲-۲- طبقه بندی بر اساس منطقه بروز مشکل 66
۴-۲-۳- شاخصهای توصیفی سرانه 67
۴-۳- تحلیل داده ها با استفاده از تکنیک های داده کاوی 70
۴-۳-۱- شناسایی مناطق همگن از منظر سامانه ۱۳۷ 70
۴-۳-۱-۱ارزیابی خوشه ها 76
۴-۳-۲- پیش بینی وضعیت تماس های آب گرفتگی در هر یک از مناطق به ازای بارش هر میلیمتر باران 77
۴-۳-۲-۱ مدل تعمیم یافته خطی 77
۴-۳-۲-۲مدل شبکههای عصبی 82
۴-۳-۳ تعیین ارتباط میان آب گرفتگی نواحی مختلف یک منطقه 84
۴-۳-۴ تعیین نواحی مستعدتر در هر منطقه در بروز مشکلات و معضلات شهری 86
۴-۴- خلاصه فصل چهارم 87
فصل پنجم: بحث و نتیجه گیری
مقدمه 89
۵-۱-خلاصه 89
۵-۲- دلایل با اهمیت بودن نتایج و دستاوردهای تحقیق 90
۵-۳- جنبه ی نوآوری تحقیق 91
۵-۴- نتایج تحقیق 91
۵-۴-۱- نتایج تحلیل توصیفی 91
۵-۴-۲- نتایج حاصل از تحلیل داده کاوی و ارائه ی دانش استخراج شده 94
۵-۴-۲-۱نتایج حاصل از شناسایی مناطق همگن با استفاده از روش خوشه بندی دو مرحله ای 94
۵-۴-۲-۲- نتایج پیش بینی تماس های آب گرفتگی در هر یک از مناطق به ازای بارش هر میلیمتر باران 95
۵-۴-۲-۳تعیین ارتباط میان آب گرفتگی نواحی مختلف یک منطقه 96
۵-۴-۲-۴نتایج تحلیل قوانین وابستگی برای شناسایی نواحی مستعدتر در هر منطقه در بروز مشکلات و معضلات شهری 97
۵-۵- پاسخ به سوالات تحقیق 97
۵-۶- محدودیتهای تحقیق 98
۵-۷- پیشنهادات تحقیق 99
۵-۸- پیشنهادات جهت تحقیقات آتی 100
۵-۹- خلاصه فصل پنجم 101
فهرست منابع 102
چکیده انگلیسی 105
فهرست جداول
جدول ۲-۱ : نمونه ای از جدول پیام 35
جدول ۲-۲: تحقیقات خارجی در زمینه کاربرد داده کاوی در مراکز تماس 444
جدول۴-۱ : فیلد های جدول پیام 61
جدول ۴-۲: فیلد های جدول اطلاعاتی مربوط به اعتبار مصوب عمرانی مناطق 61
جدول۴-۳: فیلد های جدول اطلاعاتی مربوط به بارش مناطق 61
جدول۴-۴: فراوانی گروه های تماس 63
جدول۴-۵ پراکندگی مشکلات مربوط به گروه جمع آوری و نصب 65
جدول۴-۶ : طبقه بندی مشکلات بر اساس منطقه 66
جدول ۴-۷ سرانه تماس و بودجه مناطق بیست و دو گانه تهران 68
جدول۴-۸: شاخصهای نیکویی برازش 78
جدول۴-۹: آزمون درستنمایی مدل خطی تعمیم یافته 78
جدول۴-۱۰ آزمون عوامل مدل خطی تعمیم یافته 79
جدول۴-۱۱ آزمون ضرائب مدل خطی تعمیم یافته 79
جدول۴-۱۲ بخشی از ارتباطهای دنبالهای شناسایی شده 85
جدول۴-۱۳ قوانین شناسایی شده به روش GRI 86
فهرست شکل ها
شکل ۲-۱ مراحل فرایند کشف دانش و جایگاه داده کاوی. 11
شکل۲-۲ مراحل فرایند CRISP-DM 13
شکل ۲-۱ چرخه گردش پیام- ماخذ: مرکز سامانه ۱۳۷ 36
شکل ۲-۲ساختار سازمانی سامانه مدیریت شهری سامانه ۱۳۷-ماخذ: مرکز مدیریت سامانه ۱۳۷ 39
شکل۲-۳ مدل مفهومی تحقیق 40
شکل۳-۱وضعیت ایستگاه های پنج گانه هواشناسی مستقر در شهر تهران می باشد. 53
شکل۳-۲ روش اجرایی تحقیق 57
شکل۴-۱: درصد فراوانی هر کدام از گروههای تماس 64
شکل ۴-۲ :سهم مناطق در تماس های از نوع "جمع آوری خاک و نخاله" و "نصب سطل زباله مخزن دار" 66
شکل۴-۳: رابطه میان تعداد تماس، جمعیت و اعتبار مصوب عمرانی 69
شکل۴-۴ بررسی نه عامل اول در خوشه بندی 73
شکل۴-۵ بررسی نه عامل دوم در خوشه بندی 74
.شکل ۴-۶ بررسی هفت عامل آخر در خوشه بندی 75
شکل ۴-۷ اعضای خوشه های اول و دوم 76
شکل ۴-۸ : آنالیز مدل خطی تعمیم یافته 81
شکل ۴-۹: نمودار صعود 81
شکل ۴-۱۰: مدل شبکه عصبی 83
شکل ۴-۱۱: آنالیز مدل شبکه عصبی 84
شکل ۵-۱ : رابطه میان تعداد تماس، جمعیت و اعتبار مصوب عمرانی 93
شکل ۵-۲ اعضای خوشه اول و دوم 94
توضیحات بیشتر و دانلود
صدور پیش فاکتور، پرداخت آنلاین و دانلود
قوانین ارسال دیدگاه در سایت