سایت CEB:ترجمه تخصصی رشته کامپیوتر - معرفی و دانلود کتب انگلیسی رشته کامپیوتر

امتیاز کاربران

ستاره غیر فعالستاره غیر فعالستاره غیر فعالستاره غیر فعالستاره غیر فعال
 

انتشارات: Springer

اثر: Nikhil R. Pal & Lakhmi Jain

تعداد صفحه: 263

حجم: 4.81MB

جلد کتاب

توضیحات کتاب (ترجمه خلاصه پیشگفتار کتاب):

داده کاوی و اکتشاف دانش (DMKD) زمینه ای است در علم کامپیوتر که به سرعت در حال گسترش است. این زمینه به دلیل افزایش نیاز به روش شناسی ها و ابزاری جهت تحلیل و فهم مقادیر انبوه داده های روزانه تولیدی در نهادهایی مثل بیمارستان ها، آزمایشگاه های تحقیقاتی، بانک ها، شرکت های بیمه ای، و فروشگاه های خرده فروشی و توسط کاربران اینترنت، بسیار مهم شده است. این انفجار یکی از نتایج استفاده روزافزون از ابزار های الکترونیکی است.

اما داده کاوی (DM) چیست؟ جستجویی در وب به کمک موتور جستجوی گوگل تعاریف زیادی (واقعاً زیادی) از داده کاوی را بازیابی می کند. چند مورد جالب توجه را اینجا می آوریم:

یکی از تعاریف ساده تر این است: "همینطور که از واژه ها به ذهن خطور می کند، داده کاوی یعنی تحلیل داده برای درک روابط و شناسایی الگوها". این تعریف بر شناسایی رابطه ها در داده تأکید دارد. مثال بعدی ما مفصل تر است:

یک فعالیت استخراج اطلاعات که هدفش کشف حقایق پنهان موجود در پایگاه داده است. داده کاوی، با استفاده از ترکیبی از تکنیک های یادگیری ماشین، تحلیل آماری، مدلسازی و تکنولوژی پایگاه داده، الگوها و روابط ظریف را در داده می یابد و قوانینی را استنباط می کند که پیشبینی نتایج بعدی را ممکن می سازد. موارد استفاده آن عموماً شامل تقسیم بندی بازار، پروفایل سازی برای مشتریان، تشخیص تقلب، ارزیابی اثر تبلیغات بر خرده فروشی، و تحلیل ریسک اعتباری می شود.

تعریف فوق بیان می کند که داده کاوی سعی در یافتن "اطلاعات" مفید از داده دارد که می تواند در پیشبینی آینده کمک کند. این دو تعریف بطور صریح تأکیدی بر حجم انبوه داده ندارند، مسئله ای که تعریف بعدی به آن پرداخته است: "فرایند تحلیل حجم انبوهی از داده برای استخراج انواع جدیدی از اطلاعات مفید (مثل روابط ضمنیِ بین قطعات متفاوت اطلاعات)".

با توجه به تعاریف بالا ممکن است فرد تصور کند که داده کاوی چیزی بیش از شناسایی الگو (PR) نیست. از دیدگاه ما، شناسایی الگوی سنتی زیرمجموعه ای از داده کاویست. اما تفاوت آنها در کجاست؟ در PR ما با مجموعه های داده دارای اندازه متوسط سر و کار داریم، حال آنکه در یک کاربرد معمول DM، ما با مجموعه های داده ای بزرگ از نظر ابعاد و تعداد خوشه ها مواجهیم. و اندازه بزرگ آن ها سبب بروز چالش های جدیدی شده است. برای مثال بسیاری از الگوریتم های خوشه بندی قدیمی، مثل c-means یا دیگر خویشاوندان فازی و غیر فازی آن، برای مجموعه های داده بسیار بزرگ به لحاظ محاسباتی غیر قابل حل شدن هستند. بطور مشابه، استفاده از اکثر تکنیک های تحلیل قدیمی در مجموعه های داده با ابعاد بسیار بزرگ (با حدود هزار خصوصیت) مشکل می باشد. در PR سنتی، داده معمولاً با اهدافی مشخص جمع آوری می شود و می دانیم که با استفاده از این داده، سعی در پاسخ به چه سؤالاتی داریم. اما در بسیاری از کاربردهای داده کاوی، داده بدون در نظر گرفتن هدف خاصی جمع آوری شده است و کاوشگر سعی در یافتن "اطلاعات جالب توجه" از آن دارد. بدلیل استفاده روزافرون از وسایل الکترونیکی، مسائل جدیدی رخ نموده اند. برای مثال، تحلیل الگوهای دسترسی به وب، سعی دارد تا پروفایل های کاربری ای بسازد که می تواند در بازاریابی الکترونیکی و دیگر کاربردها مفید واقع شود (و با عنوان وب کاوی شناخته می شود).

عبارت اکتشاف دانش (KD) اغلب همراه با داده کاوی بکار می رود. KD را بصورت فرایند غیر ناچیز تشخیص الگوهای معتبر، جدید، احتمالاً مفید، و نهایتاً قابل فهم در داده تعریف کرده اند. اکتشاف دانش را نباید مترادف داده کاوی گرفت، هرچند که بسیار درهم تنیده هستند. ما این دو را این طور می بینیم: داده کاوی علت است و اکتشاف دانش اثر (نتایج) - کاوش داده منجر به اکتشاف داده می شود.

بعضی از مهم ترین مسائلی که DM و KD با آن ها سر و کار دارند عبارتست از: استخراج قوانین، تشخیص همخوانی، تحلیل ویژگی، خلاصه سازی زبان شناسانه، خوشه بندی، طراحی کلاس بند، و تشخیص تازگی/نابهنجاری.

معمولاً ما به دنبال الگوریتم های DM ای هستیم که مقیاس پذیرند و خروجی (دانش) آن ها قابل تفسیر است. مسائل DM را می توان به کمک روش های آماری در ابزارهای هوش محاسباتی (CI) مثل شبکه های عصبی (NN)، منطق فازی، مجموعه های نادقیق، و الگوریتم های ژنتیک (GA) حل نمود. ابزارهای CI هر یک مزایایی دارند، سیستم های فازی به آسانی درک می شوند و همچنین سیستم های عصبی-فازی. شبکه های عصبی سیستم هایی قابل سازگاری با محیط اند که قابل موازی سازی هستند، ویژگی ای که ممکن است در مواجه با مجموعه های داده بزرگ بکار آید. الگوریتم های تکاملی، مثل GA، را می توان در حل مسائل بهینه سازی پیچیده بکار برد، و برنامه نویسی ژنتیک (GP) را برای یافتن برنامه هایی جهت حل یک مسئله داده شده.

این کتاب هم به متدولوژی ها می پردازد و هم به کاربردها، از صنعت نیمه هادی ها گرفته تا تشخیص پزشکی. در زیر فهرست فصل های کتاب را می بینید:

  1. Trends in Data Mining and Knowledge Discovery
  2. Advanced Methods for the Analysis of Semiconductor Manufacturing Process Data
  3. Clustering and Visualization of Retail Market Baskets
  4. Segmentation of Continuous Data Streams Based on a Change Detection Methodology
  5. Instance Selection Using Evolutionary Algorithms: An Experimental Study
  6. Using Cooperative Coevolution for Data Mining of Bayesian Networks
  7. Knowledge Discovery and Data Mining in Medicine
  8. Satellite Image Classification Using Cascaded Architecture of Neural Fuzzy Network
  9. Discovery of Positive and Negative Rules from Medical Databases Based on Rough Sets

 

آیکن 

نشانگر نوع فایل در سایت CEBدانلود


برای دانلود کتاب، ثبت درخواست ترجمه، و دریافت رایگان خبرنامه‌های سایت نیاز به ثبت نام دارید.

آیا از خواندن متون ترجمه‌ای بی سر و ته خسته شده‌اید؟ و بدنبال راهی برای بهره‌گیری از یک متن اصیل برای یادگیری هستید؟
آیا وقت کافی برای فهم و یا ترجمه‌ی مطلب خود در اختیار ندارید؟
از خواندن متنی که کارتان گیر آن است کلافه شده‌اید؟
کار را به ما بسپارید، خیالتان راحت!

هم اکنون! سايت CEB را به چند نفر از دوستان خود هم معرفی کنيد؛ با اين کار علاوه بر حمايت از ما، به بالا رفتن کيفيت خدمات و پايين ماندن تعرفه‌ی دانلود هم کمک کرده‌ايد.



dear author and publishers!
If you do not agree that your books be freely available through this site to Iranians - Those who are not subject to the Copy Right law - please contact us through your official email address so that we can identify you as the author or publisher of that books and remove all your books that you don't like to be accessible through this site. Note that only downloadable material can be appeared on this website. Also note that this site is not the source of illegal publication of the books; We only gathered the books accessible via the Internet together and maked these books more accessible to Iranians.


Valid XHTML 1.0 Transitional