معرفی داده کاوی :

 

معرفی داده کاوی 

داده کاوی یا کشف دانش در پایگاه داده ها (KDD ) علم نسبتاً تازه ای است که با توجه پیشرفت کشور در زمینه IT و نگاه های ویژه به دولت الکترونیک و نفوذ استفاده از سیستم های رایانه ای در صنعت و ایجاد بانک های اطلاعاتی بزرگ توسط ادارات دولتی، بانک ها و بخش خصوصی نیاز به استفاده از آن به طور عمیقی احساس می شود. داده کاوی یعنی کشف دانش و اطلاعات معتبر پنهان در پایگاه های داده. یا به بیان بهتر تجزیه و تحلیل ماشینی داده ها برای پیدا کردن الگوهای مفید و تازه و قابل استناد در پایگاه داده های بزرگ ، داده کاوی نامیده می شود. داده کاوی در پایگاه های داده کوچک نیز بسیار پرکاربرد است و از نتایج و الگوهای تولید شده بوسیله آن در تصمیم گیری های استراتژیک تجاری شرکتهای کوچک نیز می توان بهره های فراوان برد. کاربرد داده کاوی در یک جمله را این گونه می توان بیان کرد : " داده کاوی اطلاعاتی می دهد ، که شما برای گرفتن تصمیم هوشمندانه ای درباره مشکلات سخت شغلتان به آنها نیاز دارید"...

مثالی کلاسیک از کاربرد داده کاوی

اغلب تجارت ها به تصمیم گیریهای استراتژیك و یا اتخاذ خط مشی های جدید برای خدمت رسانی بهتر به مشتریان نیاز دارند. به عنوان مثال فروشگاهها آرایش مغازه خود را برای ایجاد میل بیشتر به خرید مجدداً طراحی می كنند. این مثال به داده هایی در مورد رفتار مصرفی گذشته مشتریان برای تعیین الگوهایی به وسیله داده كاوی، نیاز دارند.

برای روشن تر شدن مسئله می توان مثال را اینگونه بیان کرد که در یک فروشگاه زنجیره ای پس از داده کاوی مشخص میشود که درصدی از مشتریان خرید تلویزیون ، میز تلوزیون و گلدان کریستالی را هم در همان روز و بعد از خرید تلوزیون میخرند.مدیر فروشگاه می تواند بلافاصله دستوراتی صادر کند که براساس مدلهای تلوزیون موجود میزهایی و براساس مدل میزها گلدانهای کریستالی برای فروش سفارش داده شود و غرفه های جنبی غرفه تلویزیون را به میز و گلدان کریستالی اختصاص دهد. مطمئناً حتی پس از مدت کوتاهی سود حاصل از این بخش از فروشگاه به طور قابل ملاحضه ای ترقی خواهد کرد.

در واقع ابزار داده كــــاوی، داده را می گیرد و یك تصویر از واقعیت به شكل مدل می سازد، این مدل روابط موجود در داده ها را شرح می دهد.
برای بهبود بهره وری از یک فروشگاه داده کاوی از داده های انبار داده ، مدل هایی را ارائه میدهد که بیانگر این هستند که چه محصولات یا خدماتی، به چه مشتریانی، در چه زمانی و از طریق چه كانالی عرضه شود.

بیشتر شركتها، بانكهای داده ای عظیمی شامل داده های بازاریابی، منابع انسانی و مالی را دارا هستند. بنابراین، سرمایه گذاری در زمینه انبار داده، یكی از اجزای حیاتی در استراتژی مدیریت ارتباط با مشتری است.

رابطه مشتری با زمان تغییر می كند و چنانچه تجارت و مشتری درباره یكدیگر بیشتر بدانند این رابطه تكامل و رشد می یابد. چرخه زندگی مشتری چارچوب خوبی برای به كارگیری داده كاوی در مدیریت ارتباط با مشتری فراهم می كند. در بخش ورودی داده كاوی، چرخه زندگی مشتری می گوید چه اطلاعاتی در دسترس است و در بخش خروجی آن، چرخه زندگی می گوید چه چیزی احتمالاً جالب توجه است و چه تصمیماتی باید گرفته شود. داده كاوی می تواند سودآوری مشتری های بالقوه را كه می توانند به مشتریان بالفعل تبدیل شوند، پیش بینی كند و اینكه تا چه مدت به صورت مشتریان وفادار خواهند ماند و چگونه احتمالاً ما را ترك خواهند كرد.

بعضی از مشتریان مرتباً مراجعاتشان را به شركتها برای كسب مزیتهایی كه طی رقابت میان آنها به وجود می آید، تغییر می دهند. در این صورت شركتها می توانند هدفشان را روی مشتریانی متمركز كنند كه سودآوری بیشتری دارند.

بنابراین می توان از طریق داده كاوی ارزش مشتریان را تعیین، رفتار آینده آنها را پیش بینی و تصمیمات آگاهانه ای را در این رابطه اتخاذ كرد.

از کاربرد های داده کاوی می توان به نمونه های زیر اشاره کرد :

1. بانکداری :

·    از جالب توجه ترین کاربرد های داده کاوی می توان به کشف پول شویی اشاره کرد.

·    تشخیص مشتریان ثابت و همیشگی

·    تعیین مشتریان استفاده کننده از یک سرویس خاص

2. بیمه :

·    پیش گویی میزان استقبال از بیمه نامه های جدید

·    تشخیص کلاهبرداری ها و مشخص کردن رفتار های نا متناسب

·    تشخیص نیاز مشتریان و خواسته های آنها

·    تشخیص تخلفات پزشکی

واضح است که زمینه استفاده از داده کاوی بی نهایت گسترده است.و دو مثال فوق به خاطر درک راحت تر انتخاب شده اند.

داده کاوی شباهت زیادی به تحلیل های آماری دارد. ولی داده کاوی از جهات زیادی با آمار متفاوت است و مزیت های زیادی نسبت به آمار دارد. جالب ترین تفاوت داده کاوی با تحلیل های آماری این است که در آمار ما فرضیه ای طرح می کنیم و با استفاده از تحلیل های آماری به اثبات یا رد فرضیه می پردازیم اما داده کاوی به فرضیه احتیاجی ندارد.در واقع ابزار داده کاوی فرض می کند که شما خود هم نمی دانید به دنبال چه می گردید. و این نکته ای است که باعث می شود کار آمدی داده کاوی در مواقع بروز مشکل نمایان شود . برای مثال ما در آمار فرض می کنیم که دو گروه فاصله ای باهم ارتباط دارند سپس با استفاداه از ضریب هم بستگی پیرسون مشخص می کنیم که ارتباط وجود دارد یا خیر . ولی داده کاوی بدون توجه به اینکه ما اینگونه فرضی داشته باشیم یا نه با کاوش میان داده ها اگر ارتباطی مخفی معنی داری وجود داشته باشد آن را به اطلاع ما می رساند .تفاوت بعدی آمار و داده کاوی در این است که آمار فقط می تواند از داده های عددی استفاده کند ولی داده کاوی از داده های غیر عددی هم استفاده می کند . تفاوت های دیگری هم میان آمار و داده کاوی وجود دارد که بحث در مورد آنها در حوصله این مقاله نمی گنجد.

اما برای اولین بار در سال 1950 از رایانه برای تحلیل و ذخیره پایگاه داده ها استفاده شد. ولی حجم اطلاعات و میزان رشد آنها به قدری زیاد بوده است که هم اکنون کسی از میزان اطلاعات ذخیره شده در پایگاه داده های سراسر دنیا به صورت دقیق اطلاعی ندارد ولی مطمئنا حجم اطلاعات و مخصوصا سرعت رشد آنها به قدری زیاد شده که آمار شناسان و تحلیل گران در بررسی و تحلیل پایگاههای داده در زمینه های مختلف ناتوانند. بعضی از پایگاه داده ها به قدری بزرگ و پیچیده شده اند که تحلیل روابط و استخراج اطلاعات مفید پنهان شده در آنها واقعا از ظرفیت ذهنی بشری فراتر رفته است . از زمانی که رشد پایگاه های داده و حجم اطلاعات ، سرعت گرفت و میزان داده ها افزایش یافت ، نیاز به تحلیل ماشینی داده ها و استخراج سریع و دقیق دانش نهفته در آنها احساس شد. شاید بتوان لوول (1983) را اولین شخصی دانست که گزارشی در مورد داده کاوی تحت عنوان « شبیه سازی فعالیت داده کاوی » ارائه نمود.

عمل داده کاوی از یک پایگاه داده به چند مرحله مشخص تقسیم می شود که ما در این مقاله به معرفی و توضیحی مختصر در مورد هر یک از این مراحل اکتفا می کنیم :

1. مرحله اول : تشکیل انبار داده .

با توجه به عنوان ، این مرحله برای تشکیل محیطی پیوسته و یک پارچه جهت انجام مراحل بعدی و داده کاوی در آن، انجام می گیرد.در حالت کلی انبار داده مجموعه پیوسته و طبقه بندی شده است که دائماً در حال تغییر بوده و دینامیک است که برای کاوش آماده می شود.

2. مر حله دوم : انتخاب داده ها

در این مرحله برای کم کردن هزینه های عملیات داده کاوی، داده هایی از پایگاه داده انتخاب می شوند که مورد مطالعه هستند و هدف داده کاوی دادن نتایجی در مورد آنهاست.

3. مرحله سوم : تبدیل داده ها .

مشخص است برای انجام عملیات داده کاوی لزوما باید تبدیلات خاصی روی داده ها انجام گیرد ممکن است این تبدیلات خیلی راحت و مختصر مثل تبدیل byte به integer باشد یا خیلی پیچیده و زمان بر و با هزینه های بالا مثل تعریف صفات جدید و یا تبدیل و استخراج داده ها از مقادیر رشته ای و ... باشد.

4. مرحله چهارم : کاوش در داده ها .

در این مرحله است که داده کاوی انجام می شود.در این مرحله با استفاده از تکنیک های داده کاوی داده ها مورد کاوش قرار گرفته ، دانش نهفته در آنها استخراج شده و الگو سازی صورت می گیرد.

5. مر حله پنجم : تفسیر نتیجه .

در این مرحله نتایج و الگو های ارائه شده توسط ابزار داده کاو مورد بررسی قرار گرفته و نتایج مفید معیین می شود.
طرز کار ابزار داده کاو اینگونه است که ابزار به دنبال اثبات این است که وجود چیزی به معنای وجود چیز دیگری است و سعی می کند در درجه اول از توالی ارتباطات برای کشف یک الگو بهره بگیرد و در نهایت اطلاعات بدست آمده را دسته بندی کند تا به الگوی خاصی برسد که بتواند آن را براساس فاکتورهای داخی به مخاطبش ارائه دهد.

همچنین در داده کاوی از الگوریتم های ژنتیک و شبکه های عصبی هم استفاده می شود.شبکه های عصبی به علت کار آمدی در حل مسائل پیچیده و بزرگ مورد استفاده اند و کاربرد الگوریتم های ژنتیک در داده کاوی برای جستجو و ساختن یک مدل بهینه در میان مدل های بدست آمده است ، به این گونه که مدل های اولیه روی کرومزوم هایی قرار می گیرند و با رقابت بر سر انتقال صفات به نسل بعد ، بهترین مدل و لایق ترین آنها به کاربر ارائه می شوند.

داده کاوی امروز گسترش زیادی یافته است به طوری که اکثر نرم افرار های پایگاه داده ای مثل SQL Server و ORACLE نیز شامل ابزارهایی داده کاوی شده اند ولی هنوز نرم افزار های تخصصی داده کاوی همچون Intelligent Miner , Darwin , Mine Set, Knowledge Studio, Data Mind از مهمترین ابزار های داده کاوی اند.

 

(بزرگترین درس اشتباهات این است که آنها رافقط یکبار انجام دهیم.)

پایان نامه خرگوشی :

 

پایان نامه خرگوشی 

یک روز آفتابی، خرگوشی خارج از لانه خود به جدیت هرچه تمام در حال تایپ بود. در همین حین، یک روباه او را دید.

روباه: خرگوش داری چیکار می‌کنی؟
خرگوش: دارم پایان نامه می‌نویسم.

روباه: جالبه، حالا موضوع پایان نامت چی هست؟
خرگوش: من در مورد اینکه یک خرگوش چطور می تونه یک روباه رو بخوره، دارم مطلب می‌نویسم.

روباه: احمقانه است، هر کسی می‌دونه که خرگوش ها، روباه نمی‌خورند.
خرگوش: مطمئن باش که می تونند، من می تونم این رو بهت ثابت کنم، دنبال من بیا.

خرگوش و روباه با هم داخل لانه خرگوش شدند و بعد از مدتی خرگوش به تنهایی از لانه خارج شد و بشدت به نوشتن خود ادامه داد.
در همین حال، گرگی از آنجا رد می‌شد.
گرگ: خرگوش این چیه داری می‌نویسی؟

خرگوش: من دارم روی پایان نامم که یک خرگوش چطور می تونه یک گرگ رو بخوره، کار می کنم.
گرگ: تو که تصمیم نداری این مزخرفات رو چاپ کنی؟
خرگوش: مساله ای نیست، می خواهی بهت ثابت کنم؟
بعد گرگ و خرگوش وارد لانه خرگوش شدند.
خرگوش پس از مدتی به تنهایی برگشت و به کار خود ادامه داد.
حال ببینیم در لانه خرگوش چه خبره
در لانه خرگوش، در یک گوشه موها و استخوان های روباه و در گوشه ای دیگر موها و استخوان های گرگ ریخته بود.

در گوشه دیگر لانه، شیر قوی هیکلی در حال تمیز کردن دهان خود بود.
نتیجه:
هیچ مهم نیست که موضوع پایان نامه شما چه باشد

هیچ مهم نیست که شما اطلاعات بدرد بخوری در مورد پایان نامه‌تان داشته باشید
آن چیزی که مهم است این است که استاد راهنمای شما کیست.

 

(دیگران به رفتار تو توجه بیشتری دارند ٬ تا به گفتار تو.)

مقدمه ای بر روایی وپایایی:

 

مقدمه ای بر روایی وپایایی:

قبل از بکارگیری ابزارهای اندازه‌گیری لازم است پژوهشگر از طریق علمی، نسبت به روا بودن ابزار اندازه‌گیری مورد نظر و پایایی آن که مکمل هم به حساب می آیند اطمینان نسبی پیدا کند.

روایی:

مقصود این است که آیا ابزار اندازه‌گیری موردنظر می‌تواند ویژگی و خصوصیتی که ابزار برای آن طراحی شده است را اندازه‌گیری کند یا خیر؟ به عبارت دیگر مفهوم روایی(validity) به این سوال پاسخ می‌دهد که ابزار اندازه‌گیری تا چه حد خصیصه مورد نظر را می‌سنجد. بدون آگاهی از روایی ابزار اندازه‌گیری نمی توان به دقت داده‌های حاصل از آن اطمینان داشت. پرسشنامه‌ای (یا بطور کلی ابزار اندازه‌گیری) که مثلا برای ارزیابی «تعهد سازمانی» کارکنان طراحی شده ولی پرسش‌هایش به گونه‌ای طراحی شده‌اند که «رضایت شغلی» کارکنان را ارزیابی می‌کند روایی ندارد (هرچند ممکن است بررسی‌های آماری، پایایی مطلوب آن را نشان دهند.) همین‌طور پرسشنامه‌ای که همه وجوه موضوع مورد تحقیق را در بر نگیرد دارای روایی مطلوبی نیست.

نظر کارشناسان و خبرگان می‌تواند کمک خوبی برای بهبود روایی ابزار اندازه‌گیری باشد. موضوع روایی از آن جهت اهمیت دارد که اندازه گیری‌های نامتناسب می‌تواند هر پژوهش علمی را بی ارزش سازد. متاسفانه در اغلب تحقیقات دانشگاهی در کشور ما به روایی ابزار تحقیق بی توجهی می‌شود.

پایایی:

پایایی(reliability) با این امر سر و کار دارد که ابزار اندازه‌گیری در شرایط یکسان تا چه اندازه نتایج یکسانی به دست می‌دهد. به عبارت دیگر، «همبستگی میان یک مجموعه از نمرات و مجموعه دیگری از نمرات در یک آزمون معادل که به صورت مستقل بر یک گروه آزمودنی به دست آمده است» چقدر است.

به بیان دیگر اگر ابزار اندازه‌گیری را در یک فاصله زمانی کوتاه چندین بار به یک گروه واحدی از افراد بدهیم نتایج حاصل نزدیک به هم باشد. برای اندازه‌گیری پایایی شاخصی به نام ضریب پایایی استفاده می‌کنیم. دامنه ضریب پایایی از صفر تا 1+ است. ضریب پایایی صفر معرف عدم پایایی و ضریب پایایی یک معرف پایایی کامل است. "پایایی کامل" واقعاً به ندرت دیده می‌شود و در صورت مشاهده قبل از هر چیز باید به نتایج حاصل شک کرد.

برای محاسبه ضریب پایایی ابزار اندازه‌گیری، شیوه‌های مختلفی به کار برده می‌شود. از جمله:

الف) اجرای دوباره آزمون یا روش بازآزمایی(Test – Retest)
ب) روش موازی یا روش آزمونهای همتا(Equivalence)
ج) روش تصنیف یا دونیمه کردن آزمون(Split – half)
د) روش کودر _ ریچاردسون(Kuder – Richardson)
ه) روش آلفای کرونباخ(Cronbach s Alpha)
نرم افزار spss یکی از نرم افزارهای متداول برای تعیین پایایی با یکی از روش‌های فوق (و معمولا روش آلفای کرونباخ) می‌باشد.

 

(اگر تا کنون به نصف آرزوهایتان رسیده اید٬ بدون تردید زحمت شما دوبرابر شده است.)

ایبسن

یک فرمول ریاضی برای یافتن شریک زندگی!

 

یک فرمول ریاضی برای یافتن شریک زندگی!

 

یک ریاضیدان استرالیایی در بررسیهای خود یک فرمول ریاضی را برای احتمال یافتن شریک مناسب زندگی ارائه کرد.

کلیو کرسول دانشمند دانشگاه سیدنی با ارائه یک آنالیز پیچیده ریاضی که البته با الگوهای غربی سازگار است نشان داد که این متد تا 75 درصد احتمال یافتن شریک زندگی مناسب را برای افرادی که در جستجوی فرد ایده آل هستند تضمین می کند.

وی در این خصوص اظهار داشت: "بیشتر افراد جستجو برای یافتن فرد مناسب را تکرار می کنند اما همچنان به نتایج غم انگیزی می رسند. به خصوص پیدا نکردن شریک زندگی مناسب موجب افزایش آمار طلاق در کشورهای مختلف شده است."

تئوری این ریاضیدان استرالیایی نشان می دهد که گاهی افراد مجرد چندین شکست عاطفی را تجربه می کنند تا شانس یافتن شریک زندگی مناسب و نیمه گمشده آنها تا 75 درصد افزایش یابد.

این دانشمند افزود: "این یک مسئله درست و یا غلط نیست بلکه تنها یک مدل ریاضی است. نیمه گمشده افراد ناگهان وارد زندگی آنها نمی شود به طوری که افراد باید برای پیدا کردن شریک زندگی تلاش کنند."

براساس گزارش رویترز، این ریاضیدان گفت: "اغلب افراد زمان بیشتری را صرف پیدا کردن یک خودروی مناسب می کنند تا پیدا کردن یک عشق و طبیعی است که نتیجه عشقهای ناگهانی و ناپخته ازدواجهای منجر به طلاق می شود."

 

(زمان برای هیچ کس نه متوقف می شود نه برمی گردد ونه اضافه می شود.)

شیللر