مدیریت سیستم و بهره وری

http://systememanagement.persianblog.ir/

مدیریت سیستم و بهره وری

http://systememanagement.persianblog.ir/

داده کاوی

داده کاوی فرآیند اکتشاف اطلاعات و روندهای نهفته از درون حجم بسیار زیاد داده هایی است که در قالب پایگاه های داده ای، انباره های داده ای، یا هر نوع انباره اطلاعاتی ذخیره می شود.داده کاوی اطلاعات موجود در انبارداده ها را استخراج و دادهها را به دانشی حیاتی و مهم در ارتباط با کسب و کار تبدیل می نماید. این ابزار سایر سیستمهای پشتیبانی تصمیم گیری را کامل نموده و گاهی جایگزین آنها می گردد.

از طریق داده کاوی و دانش جدیدی که در اختیار قرار می دهد، افراد میتوانند از داده ها بعنوان اهرمی جهت خلق فرصتها یا ارزشهای جدید در سازمان خود استفاده کنند. داده کاوی میتواند هم برای مسائل طبقه بندی و هم برای رگرسیون بکار گرفته شود. در مسائل طبقه بندی، دسته ای از اشیاء که در داخل یک طبقه ای قرار دارند پیش بینی می شوند و در مسائل رگرسیون، یکسری از اعداد، پیش بینی می گردند.

داده کاوی فنونی دارد که عبارتند از:

شبکه عصبی- منطق فازی- الگوریتم ژنتیک- درخت تصمیم گیری و...

البته لازم به ذکر است که داده کاوی هیچگاه جای یک مدیر یا تحلیلگر تجاری خبره را نخواهد گرفت بلکه ابزار جدید و قدرتمندی را در اختیار ایشان قرار می دهد تا به کمک آن بتوانند در کارها و وظایف خود موفق تر و دقیق تر عمل نماید.

  مراحل داده کاوی :

روش داده کاوی دارای یازده مرحله است:

تبدیل مسأله کسب و کار و تجارت به یک مسأله داده کاوی / انتخاب داده های مناسب / شناخت داده ها

ساخت مجموعه مدل / رفع مشکلات داده ها / تبدیل داده ها برای استخراج اطلاعات / ساخت مدل ها

ارزیابی مدل ها / پیاده سازی مدل ها / ارزیابی نتایج / شروع دوباره

   انواع داده کاوی:

داده کاوی در دو نوع هدایت شده و غیرهدایت شده ظاهر می شود.داده کاوی هدایت شده دارای هدفی خاص و از پیش تعیین شده است که بدنبال الگویی خاص می گردد . در حالیکه هدف داده کاوی غیرهدایت شده یافتن الگوها یا تشابهات بین گروه هایی از اطلاعات بدون داشتن هدفی خاص و یا مجموعه ای از دسته ها و الگوهای از پیش تعیین شده می باشد . در داده کاوی هدایت شده همیشه یک متغیر هدف وجود دارد، چیزی که باید دسته بندی، تخمین یا پیش بینی شود . در داده کاوی غیر هدایت شده متغیر هدفی وجود ندارد و وظیفه د اده کاوی این است که الگوهای کلی ای را بیابد که متعلق به یک متغیر خاص نیستند.

1.        فعالیت های داده کاوی:

داده کاوی عمدتاً با ساختن مدل ها مرتبط است . یک مدل اساساً به الگوریتم یا مجموعه ای از قوانینی گفته می شود که مجموعه ای از ورودی ها را با هدف یا مقصد خاصی مرتبط می نماید. یک مدل تح شرایط درست می تواند منجر به بینش درست شود.

بسیاری از مسائل محیط اطراف خود را می توان در قالب یکی از شش عمل زیر گنجاند، به عبارت دیگر برای تبدیل یک مسأله کسب و کار و تجارت به یک مسأله داده کاوی باید آن را به یکی از فعالیت های داده کاوی تبدیل نمود، این فعالی تها عبارتند از:

-1 دسته بندی

-2 تخمین

-3 پیش بینی

-4 دسته بندی شباهت

-5 خوشه بندی

-6 توصیف و نمایه سازی

سه مورد اول همگی مثال هایی از داده کاوی هدایت شده هستند که هدف آنها یافتن ارزش یک متغیر هدف خاص است . دسته بندی شباهت و خوشه بندی جزء داده کاوی غیرهدایت شده هستند که در آن هدف، یافتن ساختاری در داده ها بدون توجه به یک متغیر هدف خاص است. نمایه سازی عملی توصیفی است که می تواند هم هدایت شده و هم غیرهدایت شده باشد.

2.       مدل های داده کاوی:

مهمترین مدل های داده کاوی عبارتند از:

1)شبکه های عصبی: شبکه های عصبی با الهام گیری از الگوی مغز انسان ضمن فرآیند آموزش اطلاعات مربوطه را درون شبکه ذخیره می نمایند. این شبکه امکان یادگیری داشته و همانند شبکه های زیستی می تواند با توجه به اطلاعات اولیه چیزی را بیاموزد ویا بر اساس آموخته های خود تصمیم گیری نماید.

2)درخت تصمیم: یک ساختار درختی خاص که برای کمک به تصمیم گیری ساخته می شود و از آن برای تقسیم مجموعه ای بزرگ از داده های جمع آوری شده به مجموعه های کوچکتر زنجیره وار داده ها استفاده م ی شود و این عمل به واسطه یک سری قوانین ساده تصمیم گیری صورت می گیرد.در هر تقسیم بندی متوالی، اعضای مجموعه های حاصله بیش از پیش به یکدیگر شبیه م یشوند.

3) استنتاج قوانین: استنتاج قوانین روشی برای مجموعه ای از قوانین است که موارد را دسته بندی می کند.اگرچه درخت های تصمیم می توانند مجموعه ای از قوانین را ایجاد کند، متدهای استنتاج قوانین، مجموعه ای از قوانین مستقل را ایجاد می کند که لزوما یک درخت را ایجاد نمی کنند.

4)مدلهای جمعی تعمیم یافته: یک مدل آماری برای ترکیب خواص مدل های تعمیم یافته ومدل های جمعی است . درمدل های جمعی تعمیم یافته، پیشگویی کننده خط ی که درمدل تعمیم یافته خطی استفاده می شود، تابع جمعی ازمتغیرهای مستقل است. این روش در واقع بسطی بر روش های رگرسیون خطی و رگرسیون منطقی است.

3.      اهمیت و علت طرح داده کاوی :

بیشتر تکنیکهای داده کاوی ، حداقل به عنوان الگوریتمهای آکادمیک از سالها یا دهه های قبل وجود داشته اند. با این وجود ، تنها در دهه اخیر است که داده کاوی به ویژه داده کاوی تجاری نقش عمده ای را بازی کرده است .این مساله به دلیل رخداد همزمان عوامل زیراست.

·        حجم بالای داده ها . اغلب الگوریتمهای داده کاوی نیازمند حجم زیاد ی از داده هاست و جایی که داده ها کم باشد الزامی به استفاده از داده کاوی با روشهای پیچیده نیست.

·        توان محاسباتی بالا که قابل دسترسی است .به عبارت دیگر امروزه امکان دسترسی عموم به کامپیوتر با قیمت های نازل فراهم شده است.

·        علاقه به مدیریت روابط با مشتریان فراوان.

محصولات نرم افزاری داده کاوی وجود دارد . همیشه فاصله ای بین زمانی که الگوریتم های جدید برای اولین بار در مجلات دانشگاهی و مقالات کنفرانسها ظاهر می شوند و زمانی که نرم افزارهای تجاری آن الگوریتم ها به بازار ارائه می شود، وجود دارد .همچنین فاصله ای زمانی بین عرضه اولیه اولین محصولات و زمان کسب مقبولیت عمومی آنها وجود دارد . درمورد داده کاوی ، دوره عرضه گسترده و مقبولیت آن فرا رسیده است.

  بهرامی زنوز ، مریم ، داده کاوی: کشف دانش پنهان داد هها،اداره تحقیقات و کنترل ریسک،فروردین89