آرشیو ماهانه

اکتبر 2019

خانه / اکتبر 2019
مقاله

اهمیت و الگوریتم داده کاوی

داده کاوی علم کشف و بدست آوری دانش از میان مقادیر زیادی داده خام است. به زبان ساده با پیشرفت و حجم بالای داده ها ذخیره شده در این سیستم ها، به ابزاری نیاز است تا بتوان این داده را به صورت ساده نمایش و پردازش کرد و اطلاعات حاصل از آن را در اختیار کاربران قرار داد. در جلسه قبل به موارد همچون تحلیل داده کاوی پرداختیم و توصیه ما اینست در صورتی که هنوز مقاله قبلی را مشاهده نکرده اید اینجا کلیک کنید تا درک بهتری نسبت به این جلسه داشته باشید.
 موارد این جلسه :
– اهمیت داده کاوی
– الگوریتم های داده کاوی و ارزش های آن
و جزئیات دیگر در این باره که در ادامه به صورت کلی بیان خواهیم کرد.

با ما تا اخر این مقاله همراه باشید.

اهمیت داده کاوی


با پیشرفت و حجم سنگین داده ها، نیاز به زمان بیشتری برای تجزیه و تحلیل داده ها لازم است. هر دو سال یک بار، حجم داده‌ها دو برابر می‌شود. ۹۰ درصد اطلاعات دنیای دیجیتال را داده‌های بدون ساختار (unstructured data) تشکیل می‌دهند. از سوی دیگر، اطلاعات بیشتر لزوماً به معنای دانش بیشتر نیست و در نظر داشته باشید که آرشیوهای اطلاعاتی، به دلیل حجم بسیار زیاد، غالباً به مقبره‌های اطلاعات تبدیل می‌شوند.

شما با داده کاوی می‌توانید:
-تمام داده‌های نامرتبط، بی‌فایده و تکراری را از مجموعه داده‌های‌تان حذف کنید.
-موارد مرتبط را شناسایی کرده و از آنها برای نیل به اهداف از پیش تعیین شده خود بهره ببرید.
-به فرایند تصمیم‌گیری آگاهانه سرعت ببخشید.
امروزه داده کاوی به عنوان پایه و مبنای تحلیل‌ها محسوب می‌شود و به شما کمک می‌کند که مدل‌هایی را توسعه دهید که قادر است از میان میلیون‌ها یا میلیاردها رکورد، روابط را شناسایی کند. داده کاوی در حال شکل دادن به جهانی است که در آن زندگی می‌کنیم.

الگوریتم های داده کاوی


داده کاوی شامل چندین الگوریتم مهم است که در ادامه چندمورد از این الگوریتم ها را بررسی خواهیم کرد.
-خوشه‌بندی داده‌ها (Clustering)
خوشه بندی از جمله الگوریتم های دسته‌بندی داده‌کاوی است.یکی از روش‌های بدون ناظر برای اکتشاف دانش از داده‌ها است که بدون پیش‌فرض، داده‌ها را براساس فاصله معنی‌دار تفکیک و دسته‌بندی می‌کند. به صورت ساده الگوریتم خوشه بندی اطلاعاتی را که ویژگی‌های نزدیک به هم و مشابه دارند را در قطعه هایی جداگانه که به آن خوشه گفته می‌شود قرار می‌دهد. نمونه‌هایی از خوشه‌بندی داده‌ها به شرح زیر هستند:

  • بخش‌بندی بازار بر مبنای روند مراجعات و تماس مشتریان با سازمان
  • تقسیم‌بندی مشتریان بر اساس هزینه‌ها و درآمدهایی که برای سازمان ایجاد می‌کنند.
  • تعیین راهبردهای بازاریابی بر مبنای رفتار خرید مشتریان در خوشه‌های مختلف
  • تعیین انواع قراردادهای پیمانکاری بر اساس روند پرداخت وجه از سوی مشتریان

الگوریتم شبکه های عصبی (Neural Network Algorithm)

شبکه­های عصبی از پرکاربردترین و عملی ­ترین روش­های مدلسازی مسائل پیچیده و بزرگ که شامل صدها متغیر هستند، می­باشد.شبکه‌های عصبی، مدل پیشرفته‌ای از رگرسیون‌های پیوسته قابل‌آموزش هستند که می‌توانند آینده را بر مبنای رویدادهای گذشته پیش‌بینی کنند.
هر شبکه عصبی شامل یک لایه ورودی است که هر گره در این لایه معادل یکی از متغیرهای پیش­بینی می­باشد.در شبکه های عصبی هدف اصلی پیش بینی مقادیر داده پیوسته (همانند: مبلغ فروش،معاملات، سود و یا قیمت سهام) است. الگوریتم های عصبی در موارد زیر پیشنهاد میشود :
– بازاریابی، مانند رسیدن به موفقیت در ارسال نامه های تبلیغاتی

– پیش‌بینی حرکت سهام، نوسانات نرخ ارز و یا سایر اطلاعات سیال مالی که دارای پیشینه هستند

– تجزیه و تحلیل فرآیند‌ های تولیدی و صنعتی

– درک نحوه و کیفیت کار کارکنان ممتاز در پاسخگویی به درخواست مشتریان


الگوریتم سری های زمانی (Time Series Algorithm)


این مدل نوعی الگوریتم رگرسیون است که برای پیش بینی مقادیر پیوسته مانند فروش محصولات در طول زمان استفاده می‌شود.در واقع سری های زمانی، مجموعه ای اطلاعات از افزایش های متوالی داده ها که در یک دوره زمانی جمع آوری شده اند می باشد. این الگوریتم یکی از ساده‌ترین روش‌های داده کاوی است که بر اساس روند گذشته، تخمینی از مقادیر آینده ارائه می‌کند. و چند مورد از کاربرد های مؤثر سری زمانی به شرح زیر است:
– شناسایی عوامل و بازه‌های زمانی موثر
– تحلیل روند رشد درآمد‌ها
– مقایسه عملکرد مالی با شرکت های دیگر


طبقه‌بندی داده‌ها (Classification)

 
یکی دیگر از روش‌های مهم، یادگیری نظارت‌شده برای پیش‌بینی طبقه داده‌ها است، که بر مبنای طبقات مشخص شده و تعیین شده اقدام به شناسای طبقه داده های جدید میکند.
چند نمونه از کاربردهای طبقه‌بندی به شرح زیر است:

  • طبقه بندی نمایندگان فروش
  • درخت تصمیم برای تصمیم گیری درباره فرآیند فروش 
  • گروه بندی مشتریان براساس مشخصات تعیین شده
  • تفکیک مشتریان جدید بر اساس مدت زمان و نوع خدمات یا محصول دریافتی با توجه به سوابق یادگرفته شده از مشتریان فعلی و مشتریان جداشده از سازمان

 

نتیجه گیری
در مقاله حاضـر پـس از بررسـي تكنولـوژی داده كـاوي، اهمیت و کاربرد در این زمینه پرداخته شده است . همانگونـه كه بيان گرديد، توان قدرت تحليل تكنولوژی داده كاوی مـدل هـای الگوریتم متنـوعی را شامل می شود که هر کدام کاربرد خاص خود را دارند.
 با ما در مقالات بعدی و با موضوعات جدید همراه باشید.

مقاله

علم و تحلیل داده کاوی

در چندین سال اخیر که جهان پیشرفت چشمگیری از داده شده، حجم این داده‌ها و سرعت تولید آن‌ها با ظهور وب و البته شبکه‌های اجتماعی رشد فرایندی داشته و <<علم داده>> ، <<تحلیل داده>> ، <<داده کاوی>> با نرخ نجومی در حال رشد و توسعه هستند. با این وجود شرکت های زیادی به دنبال کارشناس در مورد تحلیل داده میگرند تا در تصمیم گیری ها کمک کننده باشند.
داده کاوی در سال‌های اخیر رشد زیادی در دنیای فناوری داشته است و نکته‌ی قابل توجه این است که این علم ظرفیت ایجاد تغییرات در تمامی زمینه‌ها را دارد. ما در این مقاله به مواردی همچون :
مفهوم تحلیل داده کاوی چیست؟
منظور از علم داده کاوی چیست؟
و تفاوت داده کاوی با ماشین را بیان خواهیم کرد.
گفته میشود قبل از خواندن ادامه این مقاله برای دید بهتر از تحلیل داده کاوی لطفا مقاله قبلی ما را مطالعه کنید.

داده ها و علم داده ها در دنیای امرزوی


داده‌ها به میزان هوشمندی که می‌توان از آن‌ها استخراج کرد مفید و حائز اهمیت هستند و  استخراج دانش و هوشمندی از داده‌ها، مستلزم انجام تحلیل‌های موثر و قدرت پردازش کامپیوتری بالا برای مواجهه با افزایش حجم داده‌ها است.
علم داده مفهومی است که برای داده های کلان بکار برده میشود، در واقع علوم داده فعالیت‌های گوناگونی را در بر می‌گیرد و شامل پاکسازی، آماده‌سازی و تحلیل داده می‌شود و از ترکیب مباحث مختلفی به وجود آمده و بر مبانی و روش‌های موجود در حوزه‌های مختلف علمی بنا شده‌اس که شامل موارد همچون ریاضیات ، آمار ، علوم کامپیوتری، مهندسی داده و دیگر استفاده میشود. علم داده برای یکپارچه‌سازی آمار، تحلیل داده، یادگیری ماشین و دیگر مفاهیم مرتبط تحت یک عنوان واحد است.

تاریخچه


در سال ۱۹۶۰ آماردانان اصطلاح “Data Fishing” یا “Data Dredging”به معنای “صید داده” را جهت کشف هر گونه ارتباط در حجم بسیار بزرگی از داده‌ها بدون در نظر گرفتن هیچگونه پیش فرضی بکار بردند. بعد از سی سال و با انباشته شدن داده‌ها در پایگاه داده اصطلاح داده کاوی در حدود سال ۱۹۹۰ رواج بیشتری یافت. اصطلاحات دیگری نظیر “Data Archaeology”یا “Information Harvesting” یا “Information Discovery” یا”Knowledge Extraction” نیز بکار رفته‌اند.

مهارت های لازم برای تبدیل شدن به یک متخصص داده


با وجود در خواست شرکت های بزرگ دنیا در حوضه داده باید بگم هر کسی که در این دامنه علاقمند است باید در سه مهارت کلیدی از جمله : تحلیل ، برنامه نویسی و دانش دامنه مهارت لازم را داشته باشد. در قسمت پایین به صورت شکل آن را بیان خواهیم کرد.

مهارت های لازم برای تبدیل شدن به یک متخصص داده

تحلیل داده کاوی


داده‌کاوی و علم داده هر دو از واژگان باب روز در قرن ۲۱ هستند. به همین دلیل است که اغلب افراد تمایل دارند تعاریف و تفاوت‌های آن‌ها را بدانند.علم داده یک واژه مادر است که تحلیل داده، داده‌کاوی، یادگیری ماشین و چندین مبحث مرتبط دیگر را در بر می‌گیرد. تحلیل‌گر داده بینش معنادار را از چندین منبع داده استخراج می‌کند.

مهارت های لازم برای به یک متخصص تحلیل داده کاوی


 یک دانشمند داده پرسش‌ها را طرح می‌کند و تحلیل‌گر داده پاسخ‌های یک مجموعه از پرسش‌ها را فراهم می‌کند. یکی از موارد مهم در این باره ریاضیات و الگوریتم هستند که نقش اساسی در داده‌کاوی دارند.
یک تحلیل‌گر داده باید قادر به دریافت یک مساله، پرسش یا موضوع خاص، تشریح اینکه این داده‌ها چطور به نظر می‌رسند.افرادی که تمایل دارند به تحلیل‌گر داده مبدل شوند، باید چهار مهارت زیر را کسب کنند.
– دانش دامنه

-آمار و احتمالات و جبر خطی

-الگوریتم‌های داده‌کاوی و یادگیری ماشین

-یک زبان برنامه‌نویسی محاسباتی مانند R و یک زبان اسکریپت‌ نویسی مانند پایتون

در این مقاله مفهوم کلی درباره تحلیل داده کاوی و تاریخچه آن را بررسی کردیم و همچنین مهارت لازم برای تبدیل شدن به متخصص داده کاوی که یکی از موارد مهم بشمارد میآید. از آنجا که هنوز داده کاوی موارد مختلفی را دارد پس با ما باشید تا در مقاله بعدی اهمیت و الگوریتم داده کاوی را بررسی کنیم.

Privacy Settings
We use cookies to enhance your experience while using our website. If you are using our Services via a browser you can restrict, block or remove cookies through your web browser settings. We also use content and scripts from third parties that may use tracking technologies. You can selectively provide your consent below to allow such third party embeds. For complete information about the cookies we use, data we collect and how we process them, please check our Privacy Policy
Youtube
Consent to display content from Youtube
Vimeo
Consent to display content from Vimeo
Google Maps
Consent to display content from Google
Spotify
Consent to display content from Spotify
Sound Cloud
Consent to display content from Sound