سایت CEB:ترجمه تخصصی رشته کامپیوتر - معرفی و دانلود کتب انگلیسی رشته کامپیوتر

امتیاز کاربران

ستاره غیر فعالستاره غیر فعالستاره غیر فعالستاره غیر فعالستاره غیر فعال
 

انتشارات: John Wiley & Sons Ltd

اثر: Paolo Giudici & Silvia Figini

تعداد صفحه: 260

حجم: 1.32MB

جلد کتاب

توضیحات کتاب (ترجمه فصل مقدمه کتاب):

از یک دید عملیاتی، داده کاوی یک فرایند مرکب تحلیل داده است که شامل یک سری فعالیت ها می شود، از تعریف اهداف مورد تحلیل گرفته تا تفسیر نتایج تحلیل داده ها و ارزیابی نتایج. فازهای مختلف این فرایند از قرار زیر است:

تعریف اهداف برای تحلیل. ارائه یک تعریف آماری برای مسئله ای که می خواهیم آن را تحلیل کنیم همیشه ساده نیست. در واقع، هرچند اهداف سازمانی ای که ما بدنبال آن ها هستیم غالباً واضح هستند، ممکن است تدوین رسمی آن ها مشکل باشد. تدوین واضح مسئله و اهداف مورد نظر در تنظیم درست یک تحلیل بیشترین اهمیت را دارد. این قطعاً یکی از مشکل ترین قسمت های این فرایند است زیرا تعیین کننده روش هایی است که باید به خدمت گرفته شوند. بنابراین اهداف باید واضح باشند و جایی برای شک و عدم اطمینان نماند.

انتخاب، سازماندهی، و پیش-رسیدگی به داده. وقتی اهداف تحلیل شناسایی شدند، سپس لازم است داده مورد نیاز برای تحلیل جمع آوری یا انتخاب شود. اول از همه، لازم است تا منابع داده شناسایی شوند. معمولاً داده از منابع داخلی که ارزان تر و قابل اطمینان تر هستند، گرفته می شود. مزیت دیگر این داده آن است که نتیجه تجارب و رویه های خود سازمان است. منبع داده ایده آل، انبار داده های سازمان است، جایی که داده های سابق که دیگر تغییری در مورد آن ها اعمال نخواهد شد نگهداری می شوند و به راحتی می توان از آن پایگاه های داده موضوع (داده بازارهای) دلخواه را استخراج نمود. اگر انبار داده ای موجود نباشد، باید با روی هم گذاشتن منابع مختلف داده سازمان، داده بازارها را ساخت.

عموماً، ساخت داده بازارها برای تحلیل شان، ورودی اصلی را برای تحلیل های بعدی داده فراهم می کند. و باعث ایجاد نمایشی از داده می شود؛ معمولاً به شکل جدول؛ که به عنوان یک ماتریس داده شناخته می شود و مبتنی است بر نیازهای تحلیلی و اهداف پیشتر مشخص شده.

با داشتن ماتریس داده معمولاً نیاز است تا یک فرایند پاکسازی مقدماتی روی داده انجام گیرد. به عبارت دیگر یک فعالیت کنترل کیفی روی داده در دسترس صورت می گیرد. این یک فرایند رسمی است که با هدف یافتن یا انتخاب متغیرهایی صورت می گیرد که قابل استفاده نیستند، یعنی، متغیرهایی که وجود دارند اما برای تحلیل مناسب نیستند. این کار همچنین یک بررسی مهم است روی محتوای متغیرها و احتمال وجود داده ناقص یا نادرست. اگر هر اطلاعات ضروری ای وجود نداشته باشد، لازم خواهد بود تا داده بیشتری فراهم آید. (1990)Agresti را ببینید.

تحلیل اکتشافی داده و تغییرات شکل آن. این فاز به یک تحلیل اکتشافیِ مقدماتیِ داده می پردازد؛ بسیار مشابه با تکنیک های فرایند تحلیلی بر-خط (OLAP). این فاز در ابتدا به ارزیابی اولیه اهمیت داده جمع آوری شده می پردازد. همچنین ممکن است منجر به تغییر شکل متغیرهای اصلی شود - برای فهم بهتر پدیده مورد بررسی یا این که چه روش آماری ای را باید استفاده کرد. یک تحلیل اکتشافی قادر است تا هر داده نابهنجاری را مشخص کند - داده ای که از بقیه متفاوت است. چنین داده ای لزوماً حذف نخواهد شد زیرا امکان دارد حاوی اطلاعاتی مهم در دسترسی به اهداف تحلیل باشد. از دید ما یک تحلیل اکتشافی ضروریست زیرا به تحلیلگر این امکان را می دهد تا مناسب ترین روش آماری را برای فاز بعدی انتخاب کند. این انتخاب به کیفیت داده در دسترس بستگی دارد. ضمناً در صورتی که داده جمع آوری شده برای اهداف تحلیل ناکافی تشخیص داده شود، تحلیل اکتشافی ممکن است منتج به این شود که به استخراج داده جدید نیاز است.

تعیین روش های آماری. روش های آماری بسیار متنوعی موجود است که می توان از آن ها بهره برد، و بنابراین تعداد زیادی الگوریتم، لذا این مهم است که یک دسته بندی از روش های موجود داشته باشیم. این که کدام روش را در تحلیل بکار بریم بستگی دارد به مسئله پیش رو یا به نوع داده در دسترس. فرایند داده کاوی متأثر از کاربرد آن است. بدین علت، دسته بندی روش های آماری وابسته به هدف تحلیل است. بنابراین، ما روش ها را بنا به ارتباطشان با فازهای جداگانه/متفاوت به دو دسته اصلی تقسیم می کنیم.

  • روش های توصیفی. هدف اصلی این دسته از روش ها (که آن ها را تقارنی، بدون نظارت یا غیر مستقیم هم می نامند) آن است که گروه های داده را بصورت مختصر توصیف کند. این کار می تواند شامل هر دو مورد باشد؛ موردی که به گروه هایی دسته بندی شده اند که قبلاً معلوم نبود (تحلیل خوشه ای، نقشه های Kohonen) و همینطور موردی که متغیرهایی از طریق لینک هایی که قبلاً معلوم نبود باهم متصل هستند (روش های همبستگی، مدل های منطقی-خطی، مدل های گرافیکی). در روش های توصیفی هیچ فرض علت-معلولی بین متغیرهای در دسترس وجود ندارد.
  • روش های پیشگویانه. در این دسته از روش ها (که نامتقارن، نظارتی یا مستقیم هم نامیده می شوند) هدف توصیف یک یا تعداد بیشتری متغیر است در رابطه با همه متغیرهای دیگر. این کار، با توجه به داده، از طریق جستجوی قوانین دسته بندی یا پیشبینی صورت می پذیرد. این قوانین، در ارتباط با آنچه که به سر متغیرهای توضیحی یا ورودی می آید، کمک می کنند به پیشبینی یا دسته بندی نتایج آتیِ یک یا تعداد بیشتری متغیرِ پاسخ یا هدف. روش های اصلی از این نوع، آن هایی هستند که در زمینه یادگیری ماشین ساخته شده اند؛ مثل شبکه های عصبی (پرسپترون چند لایه) یا درخت های تصمیم، اما مدل های آماری کلاسیک از جمله مدل های رگرسیون خطی و منطقی را هم شامل می شوند.

تحلیل داده براساس روش های منتخب. پس از اینکه روش های آماری مشخص شدند، باید به الگوریتم های مناسبی برای محاسبه نتایج مورد نیاز از داده ترجمه شوند. با وجود طیف گسترده ای از نرم افزارهای تخصصی و غیر تخصصی در زمینه داده کاوی، برای اکثر کاربردهای 'استاندارد' نیازی به ساخت دستی الگوریتم های محاسبات نیست. هرچند، این مهم است که کسانی که فرایند داده کاوی را مدیریت می کنند، همانطور که باید درک خوبی از روش های متفاوت در دسترس داشته باشند، از راه حل های نرم افزاری هم آگاهی کافی داشته باشند، آنگونه که بتوانند فرایند را با نیازهای مشخص سازمان تطبیق دهند و بتوانند نتایج تحلیل را بدرستی تفسیر کنند.

ارزیابی و مقایسه روش ها و انتخاب مدل نهایی برای تحلیل. برای اتخاذ تصمیم نهایی لازم است تا بهترین 'مدل' را از بین روش های آماری متنوع در دسترس انتخاب کنیم. انتخاب مدل بر پایه مقایسه نتایج بدست آمده صورت می گیرد. ممکن است هیچ یک از روش های استفاده شده به شکل راضی کننده ای به اهداف تحلیل نرسد. در این صورت باید روش مناسبتری برای تحلیل تعیین شود. هنگام ارزیابی عملکرد یک روش خاص، همانند اندازه گیری های تشخیصیِ یک نوعِ آماری، چیزهای دیگری از جمله محدودیت های کسب و کار - هم از نظر زمان و هم منبع - و همچنین کیفیت و در دسترس بودن داده باید مد نظر قرار گیرند. در داده کاوی این معمولاً ایده خوبی نیست که فقط از یک روش آماری برای تحلیل داده استفاده شود. هر روش این احتمال را دارد که جنبه هایی، که شاید توسط دیگر روش ها نادیده گرفته شده است، را روشن کند.

تفسیر مدل انتخابی و استفاده آن در فرایند تصمیم گیری. داده کاوی نه تنها تحلیل داده است، بلکه دخالت دادن نتایج در فرایند تصمیم گیری سازمان هم هست. دانش کسب و کار، استخراج قوانین و استفاده آن ها در فرایند تصمیم گیری به ما این امکان را می دهد تا از فاز تحلیلی به سمت ساخت یک موتور تصمیم برویم. وقتی که مدل انتخاب و با یک مجموعه داده آزمایش شد، می توان قانون دسته بندی را تعمیم داد. برای مثال، خواهیم توانست تعیین کنیم کدام مشتری ها سود بیشتری خواهند رساند یا سیاست های تجاری بدست آمده را برای گروه های مصرف کنندگان مختلف تنظیم کنیم، تا بدین وسیله سود سازمان را افزایش دهیم.

با توجه به منافعی که می توانیم از داده کاوی ببریم، پیاده سازی درست این فرایند برای به خدمت گرفتن آن در جهت نیل به تمام ظرفیتش حیاتی می نماید. افزوده شدن فرایند داده کاوی به ساختار سازمان باید به تدریج انجام شود، تنظیم اهداف واقع گرایانه و بررسی نتایج باید در طول زمان انجام گیرد. مقصد نهایی برای داده کاوی این است که کاملاً با دیگر فعالیت هایی که برای حمایت از تصمیم گیری در سازمان انجام می شوند، تلفیق شود. این فرایند تلفیق به چهار فاز تقسیم می شود:

  • فاز استراتژیک. در این فاز اولیه روال های کسب و کار را برای شناسایی موقعیت هایی که داده کاوی می تواند در آن ها بیشتر مفید واقع شود مورد مطالعه قرار می دهیم. نتایج پایانی این فاز تعریف اهداف کسب و کار است برای یک پروژه پایلوت داده کاوی و تعریف معیارهایی برای ارزیابی خود پروژه.
  • فاز آموزش (training). این فاز این امکان را به ما می دهد تا فعالیت داده کاوی را با دقت بیشتری ارزیابی کنیم. یک پروژه پایلوت راه اندازی شده و نتایج با توجه به اهداف و معیارهای مشخص شده در فاز قبلی حاصل شده اند. یک جنبه بنیادین پیاده سازی رویه داده کاوی، انتخاب پروژه پایلوت است که باید برای استفاده راحت باشد اما در عین حال باید به اندازه کافی هم مهم باشد که توجهات را بخود جلب نماید.
  • فاز ساخت. در صورتی که ارزیابی مثبت پروژه پایلوت منجر به پیاده سازی یک سیستم داده کاوی کامل شود، آن گاه نیاز خواهد بود که یک برنامه دقیق برای سازماندهی مجدد روال کسب و کار تنظیم شود تا فعالیت داده کاوی را نیز شامل شود. به طور دقیق تر احتمالاً لازم خواهد بود که پایگاه داده کسب و کار را به یک انبار مجهز کنیم؛ تا نمونه داده کاوی قبلاً ساخته شده را تکمیل کنیم؛ تا جایی که یک نسخه عملیاتی اولیه داشته باشیم و تا آنگاه کارکنان و زمان سازمان را به پیگیری پروژه بگماریم.
  • فاز مهاجرت. در این مرحله تمام کاری که باید انجام دهیم این است که سازمان را به شکلی مهیا کنیم که فرایند داده کاوی با موفقیت به آن افزوده شود. این به معنای آموزش توانایی های سیستم جدید به کاربران احتمالی و افزایش اعتماد آن ها به منافعی که سیستم برای سازمان به ارمغان می آورد، می باشد. این به معنای ارزیابی مداوم (و ارتباط دائمی داشتن با) نتایج حاصل از فرایند داده کاوی است.

 

در پایان سایت CEB نظر شما را به فهرست فصل های کتاب جلب می کند:

  1. مقدمه
  2. سازماندهی داده
  3. آمار خلاصه
  4. تعیین مدل
  5. ارزیابی مدل
  6. توصیف بازدید کنندگان وب سایت
  7. تحلیل سبد خرید
  8. توصیف رضایت مشتری
  9. پیشبینی ریسک اعتباری برای کسب و کارهای کوچک
  10. پیشبینی عملکرد دانشجویان دوره های مجازی
  11. پیشبینی ارزش مشتری در دوره حیاتش
  12. مدیریت ریسک عملیاتی

 

آیکن نشانگر نوع فایل در سایت 

CEB دانلود


برای دانلود کتاب، ثبت درخواست ترجمه، و دریافت رایگان خبرنامه‌های سایت نیاز به ثبت نام دارید.

آیا از خواندن متون ترجمه‌ای بی سر و ته خسته شده‌اید؟ و بدنبال راهی برای بهره‌گیری از یک متن اصیل برای یادگیری هستید؟
آیا وقت کافی برای فهم و یا ترجمه‌ی مطلب خود در اختیار ندارید؟
از خواندن متنی که کارتان گیر آن است کلافه شده‌اید؟
کار را به ما بسپارید، خیالتان راحت!

هم اکنون! سايت CEB را به چند نفر از دوستان خود هم معرفی کنيد؛ با اين کار علاوه بر حمايت از ما، به بالا رفتن کيفيت خدمات و پايين ماندن تعرفه‌ی دانلود هم کمک کرده‌ايد.



dear author and publishers!
If you do not agree that your books be freely available through this site to Iranians - Those who are not subject to the Copy Right law - please contact us through your official email address so that we can identify you as the author or publisher of that books and remove all your books that you don't like to be accessible through this site. Note that only downloadable material can be appeared on this website. Also note that this site is not the source of illegal publication of the books; We only gathered the books accessible via the Internet together and maked these books more accessible to Iranians.


Valid XHTML 1.0 Transitional