دسته بندی

مقاله

خانه / مقاله
مقاله

داده کاوی در تجارت الکترونیک

امروزه در دنياي کسب و کار، مشتري ها نسل جديدتري از تجارت را ترجيح مي دهند تا با استفاده از پرتال هاي آنلاين اقدام به خريد کنند، زيرا اين پرتال ها داراي جذابيت هاي زيادي هستند واز طریق اینترنت به راحتی در دسترس عموم قرار دارند.

در تجارت نسل جديد که شکل تازه تري با عنوان تجارت الکترونيکي نام گرفته است که با گسترش و فراگیر شدن آن موجب ایجاد منبع اطلاعات حجمی شده است وبه دلیل استفاده از سيستم هاي داراي پايگاه داده و حجم بسيار بالاي داده هاي ذخيره شده در اين تجارت، نياز به ابزاري که بتوان داده هاي ذخيره شده را پردازش کرده و اطلاعات حاصل از اين پردازش را در اختيار کاربران قرارداد احساس می شود.

 که نياز به روش هايي است که اصطلاحاً به کشف دانش بپردازند يعني با کمترين دخالت کاربر و به صورت خودکار الگوها و رابطه هاي منطقي را بيان نمايند. داده کاوي يکي از مهم ترين اين روش ها است که به وسيله آن داده ها از جنبه های مختلف و با حداقل دخالت کاربران مورد تجزیه وتحلیل قرار می گیرند تا بدین وسیله بتوانیم الگوها ی مفید، تازه و قابل استناد در پایگاه داده های بزرگ را بیابیم و آن ها را در قالب اطلاعاتی مفید، برای بالا بردن میزان بازده کار بیان نماییم. کشف این روابط به بهبود تصمیم های مدیریتی کمک می کند. 

تجارت الکترونیک یک حوزه اساسی برای داده کاوی می باشد. در حقیقت وب یک آزمایشگاه عملی است؛ آزمایشگاهی که سازمان قادر است در آن هر فرضیه و تصوری را به راحتی به چالش بکشد. به عبارت دیگر، تقاضا و نیاز سوخت اصلی تحقیقات بوده است. برای مثال شرکت Netflix (یک شرکت جهانی رسانه سیال و تولیدکننده مجموعه‌های تلویزیونی آمریکایی است که تا آغاز سال ۲۰۱۶ بیش از ۷۵ میلیون مشترک دارد) جایزه ای یک میلیون دلاری برای ارائه راه حل برای مساله سیستم های توصیه در نظر گرفته است که این جایزه به القوه باعث حرکتهای بسیار قوی در این راستا بوده و می باشد. 

برعکس نتایج تحقیقات تئوریک در داده کاوی در اکثر موارد کاربردهایی برای خود در دنیای واقعی پیدا می کنند. حتی کنفرانس های اصلی داده کاوی محلی برای تعامل بین محققین و مهندسین این رشته می باشد. تعداد کثیری از افرادی که در اینگونه کنفرانس ها شرکت می کنند افرادی هستند که از جنبه کاربردی به داده کاوی می نگرند .

پنج کاربرد مهم داده کاوی در تجارت الکترونیک:

شرح داده(Description)

بسياري از بنگاه هاي تجاري دريافته اند كه بزرگترين سرمايه، دانش كاركنان است. لذا همواره سعي مي كنند تا زمينه مناسب را به منظور توليد ، شناسايي ، گردآوري و سازماندهي دانش داخلي بنگاه فراهم نموده واغلب یکی از اولین وظایف مورد نیاز داده کاوی توصیف اطلاعات یک پایگاه داه پیچیده است.که توصیف و شرح داده به منظور تولید دانش است و ایجاد این توصیفات نیاز به انجام عملیات اضافی بروی داده می باشد به عنوان مثال تماس یک مشتری می تواند شامل اطلاعاتی همچون مدت زمان،تعداد کل تماس و غیره باشد.

دسته بندی داده (classification )

طبقه بندی (Classification) یکی از زیرشاخه های اصلی داده کاوی و یادگیری است. عملیات دسته بندی،رده و گروه مجموعه ای از داده  را براساس ویژگی های آن تعیین می کند.این عمل یک فرآیند دو مرحله ای است. در مرحله اول، براساس جمع آوری مجموعه داده های آموزشی، یک مدل برای توصیف ویژگی های یک مجموعه از کلاس های داده، ساخته می شود. از آنجا که کلاس ها از پیش تعریف شده هستند، این مرحله را یادگیری نظارت شده نیز می نامند. در مرحله دوم، این مدل برای پیشبینی دسته های اشیاء یا داده های آینده استفاده می شود.

خوشه بندی(Clustering)

تقسیم بندی برای استخراج گروه هایی است که ناشناخته و دارای خصوصیات مشابهی هستند که خوشه ها نامیده می شوند. از طرف دیگر، جمعیت ناهمگن را به جمعیت همگن تقسیم می کند. بر خلاف طبقه بندی ، زیرمجموع ها از پیش تعیین نشده اند.

خوشه بندی تکنیکی است برای گروه بندی یک مجموعه از آیتم هایی که ویژگی های مشابه دارند، به طوری که آیتم های درون یک خوشه باید خیلی به هم شبیه باشند، همچنین آنها باید غیر مشابه با اشیاء خوشه های دیگر باشند. شباهت بین آیتم ها توسط توابع شباهت تعیین می شوند. معمولا شباهت ها به طور کمی به عنوان فاصله یا معیار های دیگر با توجه به نظر متخصصین حوزه، مشخص می شوند.

مثالی از کاربرد خوشه بندی در وب

خوشه بندی کاربران برای ایجاد گروه هایی از کاربران است که الگوهای جستجوی مشابهی را نشان می دهند و علایق و عادات مشابه دارند. چنین دانشی به ویژه، معمولا برای پی بردن به آمار کاربر به منظور انجام بخش بندی مارکت در کاربرد های تجارت الکترونیک یا تولید محتوای وب شخصی سازی شده برای کاربران، بکار می رود. از طرف دیگر خوشه بندی صفحات، گروه هایی از صفحات را کشف خواهد کرد که محتوای مرتبط دارند و یا براساس درک کاربر، مرتبط به نظر می رسند.

قواعد وابستگی (Association Rule Mining)

 کاوش قواعد وابستگی یا ((Association Rule Mining رده ای از مسائل داده کاوی را شامل می شود که در آن به دنبال استخراج و تعریف قواعد و الگوهایی هستیم که توصیف دقیق تری را از فضای حاکم بر داده ها ارائه می دهند. کاربردهای گسترده این روش ها در هوش تجاری (هوشمندی کسب و کار یا Business Intelligence)، شبکه های اجتماعی و مجازی، تجارت الکترونیک، صنعت بانکداری، وب کاوی (Web Mining)، و ده ها زمینه دیگر، اهمیت دو چندانی به این روش ها اعطا کرده است. از جمله کاربردهای مهم این روش ها، می توان به  طراحی و پیاده سازی سیستم های پیشنهادگر یا (Recommender Systems) اشاره نمود، که هر روز در دنیای وب، شاهد ظهور و بروز آن ها هستیم.

در بسیاری از رشته های علمی و فنی، در نهایت ما با مجموعه ای از داده ها روبرو هستیم که حجم کم یا زیادی را دارند؛ اما مهم ترین کار، به دست آوردن چنین پایگاه داده ای نیست، بلکه باید بتوانیم، سطح بالاتری از دانش را با توجه به پایگاه داده مذکور به دست بیاوریم؛ این یعنی نتیجه گیری و جمع بندی تمام تلاش هایی که برای جمع آوری آن داده ها صرف شده است. 

پیش بینی (Prediction)

فلسفه ی داده کاوی این است که با شناخت درست از گذشته، آینده را می توان پیش بینی کرد. داده کاوی به شما کمک می کند تا رفتار کسب و کار خود را در گذشته دقیقاً بشناسید و براساس آن آینده را با تقریب بالا پیش بینی کنید. به عنوان مثال داده کاوی به شما کمک می کند تا حداقل دو مورد اساسی را در بخش فروش کسب و کار خود پیش بینی کنید:

پیش بینی نیاز های یک مشتری خاص در آینده و در نتیجه حفظ آن مشتری

پیش بینی نیاز بازار در زمان ها و مناطق مختلف و در نتیجه ساماندهی نظام توزیع برای آنها

اگر یک صاحب کسب و کار، رفتار و نیازهای مشتری خود را در گذشته به خوبی بشناسد می تواند نیاز های او را در آینده نیز حدس بزند. اما معمولاً تعداد مشتری ها آنقدر زیاد است که مدیریت آن از عهده ی مدیر آن مجموعه خارج می شود. داده کاوی به شما کمک می کند حجم عظیم مشتری های خود را خوب بشناسید و بصورت خودکار به آن ها پیام دهید که اکنون چه نیازهایی دارند. حتی ممکن است خود آنها نیز فراموش کرده باشند.

 نمونه ایی از کارهایی که برای پیش بینی در کسب و کار اعمال می شود: “پیش بینی ارزش تجاری سهام در سه ماه آینده است “.

حرف آخر

تجارت الکترونیکی شامل کلیه معاملات تجاری است که از راه دور از طریق رابط های الکترونیکی و دیجیتال صورت می گیرد و اساساً شامل معاملات تجاری است که از طریق انواع مختلف پایانه ها (رایانه ها ، تبلت ها ، تلفن های هوشمند وغیره) در اینترنت صورت می گیرد.

اگرچه همه بر این باورند که تجارت الکترونیک فناوری جدید است ، اما اصطلاح تجارت الکترونیکی کاملاً جدید نیست. در واقع تجارت از دهه 60 میلادی وجود داشت اما این روند مربوط به تکامل اینترنت است.

مقاله

SQL

آیا تاکنون از زبان رایانه ای به نام SQL شنیده اید؟ شاید در زمینه تجزیه و تحلیل داده ها درباره آن شنیده باشید ، اما هرگز فکر نمی کردید که به عنوان یک بازاریاب برای شما کاربرد داشته باشد. یا ممکن است با خودتان فکر کرده باشید ، “این برای کاربران داده پیشرفتهواقع شده است. من هرگز نتوانستم چنین کاری کنم”.
با ما باشید تا در این جلسه مفاهیم کلی در مورد SQL را بررسی کنیم.

SQL چیست؟

SQL تلفظ”ess-que-el”)) مخفف Structured Query Language است. SQL برای برقراری ارتباط با یک پایگاه داده استفاده می شود. طبق گفته ANSI (موسسه استاندارد ملی آمریکا) این زبان استاندارد برای سیستم های مدیریت پایگاه داده رابطه است. عبارت SQL برای انجام کارهایی مانند به روزرسانی داده ها در یک پایگاه داده یا بازیابی داده ها از یک پایگاه داده استفاده می شود. برخی از سیستم های مدیریت ارتباط پایگاه داده متداول که از SQL استفاده می کنند عبارتند از: Oracle، Sybase، Microsoft SQL Server، Access، Ingres، و غیره. اگرچه بیشتر سیستم های پایگاه داده از SQL استفاده می کنند ، اما اکثر آنها از پسوندهای اختصاصی دیگری نیز برخوردار هستند که معمولاً فقط در سیستم آنها استفاده می شود. . با این وجود ، از دستورات استاندارد SQL مانند “Select” ، “Insert” ، “Update” ، “Delete” ، “ایجاد” و “Drop” می توان برای دستیابی به تقریباً هر کاری که شخص با بانک اطلاعاتی انجام دهد ، استفاده می شود. این آموزش به شما درمورد اصول اولیه هر یک از این دستورات می پردازد و همچنین به شما امکان می دهد تا با استفاده از SQL Interpreter آنها را به تمرین بپردازید.


چرا از SQL استفاده می کنیم؟


زیبایی SQL این است که هرکسی که در شرکتی کار می کند که داده ها را در یک پایگاه داده رابطه ای ذخیره می کند می تواند از آن استفاده کند.اگر برای یک شرکت نرم افزاری کار می کنید و می خواهید داده های استفاده را روی مشتریان خود جلب کنید ، می توانید با استفاده از SQL این کار را انجام دهید. اگر برای یک شرکت تجارت الکترونیکی کار می کنید که اطلاعاتی در مورد خرید مشتری دارد ، می توانید از SQL استفاده کنید تا دریابید که مشتریان کدام محصولات را خریداری می کنند. البته اینها فقط چند نمونه از نمونه های بسیار زیاد است.
به این روش فکر کنید: آیا تابحال مجموعه داده های بسیار بزرگی را در اکسل باز کرده اید ، آیا با کاربرد های آن آشنا هستید؟ 
SQL به شما امکان می دهد فقط به بخش خاصی از داده های خود به طور همزمان دسترسی داشته باشید ، بنابراین نیازی نیست که داده ها را در CSV بارگیری کنید ، آن را دستکاری کنید و احتمالاً Excel را بیش از حد بارگیری کنید. به عبارت دیگر ، SQL از تجزیه و تحلیل داده هایی که ممکن است شما برای انجام آن در اکسل استفاده می کنید ، مراقبت می کند

.

مزیت های استفاده از SQL :

  • سازگاری با اکثر زبان‌های دستوری
  • سازگاری با اکثر پایگاه‌های داده مثل SQL Server,Oracle و حتی MS ACCESS
  • پس از اینکه برنامه‌نویس این زبان را درک کرد استفاده از آن بسیار ساده‌است.
  • کاربرد در زبان‌های جدید و پیشرفته

حرف آخر


SQL یک سیتسم بانک اطلاعتی است که می توان اطالاعات یک شرکت یا یک سازمان بزرگ را در خود ذخیره کند. این زبان استاندارد برای سیستم های مدیریت پایگاه داده رابطه است و این برنامه را می توان برای روزرسانی داده ها در یک پایگاه داده یا بازیابی داده ها از یک پایگاه داده استفاده کرد. 

 
مقاله

آشنای با OLAP

امروزه با پيشرفت فناوري، سازمان ها به دنبال راه ها و ترفندهايي مي گردند که بقايشان را در اين عرصه تضمين کنند. يک سازمان از زمان استارت ، داده ايجاد مي کند. اين داده معمولا پيرامون دارايي، بازاريابي، فروش، مديريت ارتباط با مشتري و … گروه بندي مي شوند و هر بخش يک وظيفه جدا در شرکت انجام داده و داده هاي مرتبط به خود را جمع آوري مي کند.
موضوع اصلی این مقاله، OLAP است و در ادامه به موارد همچون :
– تعریف OLAP
– مزایای OLAP
– کاربردهای OLAP
و بعضی موارد دیگر را بررسی قرار خواهیم داد.

تعریف OLAP


سیستم های OLAP نام خود را از عبارت سیستم های پردازش تحلیل برخط گرفته اند. می توان به جای OLAP از واژه پردازش سریع اطلاعات چند بعدی و یا به عبارت دیگر از “فن آوری تحلیل داده ها” استفاده کرد. این سیستم ها بر اسای تکامل سیستم ها ی OLAP به معنی پردازش آنلاین تراکنش ها ایجاد شده اند.
این تکنولوژی داده‌های کسب‌وکار را به صورت چندبعدی تجزیه و تحلیل می‌کند و بدین ترتیب توانایی انجام محاسبات پیچیده، تجزیه و تحلیل رویه‌ها و مدل‌سازی داده‌های پیچیده را فراهم می‌کند.OLAP تکنولوژی موجود در بسیاری از برنامه‌های هوش تجاری (BI) است و شامل قابلیت‌هایی مانند مشاهده‌ی گزارشات (بدون محدودیت)، محاسبات تحلیلی پیچیده و برنامه‌ریزی سناریوی پیش‌بینی می‌باشد. OLAP کاربران نهایی را قادر می‌سازد تا به انجام تجزیه و تحلیل داده‌ها در ابعاد مختلف بپردازند و در نتیجه درک کاربر از داده‌ها را در جهت تصمیم‌گیری افزایش می‌دهد.


کاربرد OLAP


سیستم های  OLAP برای اراعه پاسخ های سریع به سؤالات و جستجو های تحلیلی روی داده های ” چندی بعدی ” طراحی شده اند به طور معمول اگر بخواهیم مشابه همین پرس و جوهای تحلیلی را روی سیستم های اطلاعاتی عادی OLAP اجرا کنیم ممکن است نتایج در زمانی طولانی و غیر کاربردی بازگردانده شود در حالیکه استفاده از OLAP تضمین می کند که اطلاعات  و گزارشات تحلیلی با زمان پاسخ مناسبی به کاربر تحویل داده نشود.
کاربرد های معمول  OLAP عبارتند از: گزارشات تجاری فروش، بازاریابی، گزارشات مالی و مواردی از قبیل. این سیستم ها داده های خود را به نخوی خاص نگهداری می کنند که از نظر سرعت در برخودر با داده ها چند بعدی بهتر از سیستم های OLTP عمل میکنند و از این به آنها بانک های اطلاعاتی سلسه مراتبی هم گفته می شود.

تفاوت DATA WAREHOUSE و OLAP در چیست؟

سیستم پردازش تراکنش آنلاین (OLTP) 
 توسط تعداد زیادی از تراکنش های کوتاه آنلاین (افزودن، بروز رسانی، حذف) مشخص شده است. تاکید اصلی برای سیستم های OLTP بر روی اعمال فرآیند های پرس و جوی سریع، حفظ کامل داده ها در محیط های دارای دسترسی های متفاوت و میزان موفقیت که بر طبق تعداد تراکنش ها در ثانیه اندازه گیری می شود، می باشد. داده ها در پایگاه داده OLTP بصورت جامع و به روز می باشند، و طرح مورد استفاده برای ذخیره پایگاه داده تراکنشی ، مدل ورود داده (معمولا از فرم سوم نرمال سازی(۳NF) استفاده می شود) می باشد.

سیستم های پردازش تحلیلی آنلاین (OLAP)
 توسط حجم تقریبا کمی از تراکنش ها مشخص می شود. کوئری ها اغلب بسیار پیچیده و انبوه می باشند. باید توجه داشت که برای سیستم های OLAP، زمان پاسخ، معیار مناسبی است. اپلیکیشن های OLAP بطور گسترده توسط تکنیک های داده کاوی استفاده می شوند. در پایگاه داده ها OLAP داده های قبلی جمع آوری شده و در طرح های چند بعدی ذخیره می شوند (معمولا طرح ستاره می باشد).

مزایای استفاده از OLAP

کسب‌وکار موفق به طور مداوم در پی برنامه‌ریزی، تجزیه و تحلیل فعالیت‌های عملیاتی به منظور به حداکثر رساندن بهره‌وری، کاهش هزینه و به دست آوردن سهم بیشتری از بازار است. محققین حوزه آمار به شما خواهند گفت که اگر داده‌های نمونه شما بیشتر باشند، احتمال رسیدن به نتیجه درست افزایش می‌یابد. طبیعتاً، در یک شرکت داده‌های زیادی در رابطه با یک فعالیت خاص وجود دارد که در این صورت برنامه‌ریزی مؤثرتری برای آن فعالیت‌ خواهیم داشت.فن آوری OLAP به عنوان یک توانایی برای رسیدن به “دسترسی سریع به اطلاعات چندبعدی به اشتراک گذاشته‌شده” تعریف می‌شود. با توجه به توانایی تکنولوژی OLAP برای ایجاد واحدهای بسیار سریع و محاسبات مجموعه داده‌های اساسی، می‌توان به مفید بودن آن برای کمک به رهبران کسب‌وکار پی برد.

حرف آخر


OLAP داده‌های موجود را به صورت چندبعدی تجزیه و تحلیل می‌کند و بدین ترتیب توانایی انجام محاسبات پیچیده، تجزیه و تحلیل رویه‌ها و مدل‌سازی داده‌های پیچیده را فراهم می‌کند.

مقاله

مصور سازی اطلاعات

از آنجا که اطلاعات به شکل انبوه در حال پیشرفت است در همین راستا ما باید راهی برای ساده کردن و بیان کردن این اطلاعات را داشته باشیم تا برای عموم آشکار و قابل فهم باشد. چندین راه برای نمایش اطلاعات یک سازمان وجود دارد که یکی از آنان مصورسازی است و هدف اصلی ما در این مقاله ، آشنای کلی با مصورسازی اطلاعات تا کاربردهای آن است.
مصورسازی اطلاعات یکی از حوزه‌های جدید در زمینه نمایش و بازیابی اطلاعات انبوه است.فنون مصورسازی برای ایجاد ساختار تصاویر و گرافها به کار می­ روند تا به درک ساده­ تر اطلاعات موجود دست یابیم. مصورسازی اطلاعات با استفاده از مکانیسم ها و تکنیک های گرافیکی به ارائه تصویری معنا و مفهوم اطلاعات میپردازد.با مصورسازی اطلاعات میتوان در فاصله زمانی کوتاهی اطلاعات را به گونه ای منتقل کرد که کاربر بتواند به آسانی آنها را درک کند و این امر باعث افزایش تمایل کاربران و درک بهتر نسبت به یک سیستم اطلاعاتی میشود.

تاریخچه مصور سازی اطالاعات


اصطلاح مصورسازی اطلاعات در سال ١٩٨٩ ،توسط گروه تحقيقـاتی رابط کاربر زیراکس  ابداع شد، اما به‌عنوان یک حوزه مستقل تحقيقاتی کمتر از دو دهه عمر دارد.مصورسازی اطلاعات در نتیجه تحقيقات انجام‌شده در دهـة ١٩٩٠ ،پدیدار شد. فرآیند پیشرفت مصورسازی اطلاعات و بکاگیری آن توسط سایر علوم و رشته‌ها به‌کار گرفته مـی‌شـود و به‌زودی توانست در دیگر جوامع علمی نیز راه یابد. در این روش با توجه به ظرفیت بالای اطلاعات توسط تصویر، كوشش میشود تا با نمایش تصویری، قدرت درک و یادگیری كاربر از اطلاعات افزایش داده شود. علاوه بر آن میزان قابل توجهی از اطلاعات به صورت فشرده، با حجم كمتر، كارآیی افزون تر و در قالبی تصویری ارائه میشود. نباید مصورسازی اطلاعات را با نمایش عكس ها و تصاویر ساده یكی دانست. در این شیوه تخصصی، به بهره گیری از برخی مهارت ها و علوم و فنون گوناگون نیاز است. همچنین برخی حوزه های مطالعاتی در ارتباط با مباحث مربوط به داده ها، گرافیك رایانه ها، شناخت مبانی هنری و نیز بهره گیری از خلاقیت در تصویرسازی مفاهیم، به توسعه و پیشرفت این فعالیت یاری میرساند.

کاربرد مصور سازی اطلاعات


از آنجا که مصورسازی اطلاعات به‌نحوی فزاینده توسط سایر علوم و رشته‌ها به‌کار گرفته مـی‌شـود ویکی از مهـم‌تـرین کاربردهـای مصورسازی‌میتوان به داده کاوی(برای اطلاعات بیشتر در مورد داده کاوی کلیک کنید)، ترسیم نقشةعلوم و نيزبازیـابی اطلاعات اشاره کرد. از مصورسـازی اطلاعات میتوان برای ردهبندی موضوعی منابع اطلاعاتی استفاده کرد.
همچنان که در مرور پیشینه ها در زمینه بکارگیری مصورسازی اطلاعات در کتابخانه های دیجیتال مشاهده میشود، ایده های مختلفی را میتوان در بهبود فرایند بازیابی اطلاعات و نمایش نتایج جستوجو بکار گرفت و حتی در  پژوهش ها از ابزارها و روش های مصورسازی متفاوتی استفاده شده است. این نشان دهنده گسترده بودن در زمینه مصورسازی اطلاعات اسـت به گونه ای که هر پژوهشگر با توجه به هدف خود و نیاز کاربرانش روش مناسب را انتخاب کرده و طرحی را در آن زمینه ارائه میکند.


 برخی از مهم‌ترین ویژگی‌های مصور سازی عبارتند از:

  • سهولت ارائه اطلاعات
  • سرعت بالای ارائه اطلاعات
  • جذاب و جالب بودن برای کاربر
  • عدم خستگی
  • ارائه اطلاعات زیاد در زمان اندک
  • امکان نمایش سریع، واضح و زیبای ایده‌های پیچیده
  • امکان برقراری آسان ارتباط بین اجزای ارائه شده موضوع
  • خلاقیت در تصمیم گیری

نتیجه گیری
مصور‌سازی اطلاعات، ارائه داده ها در فرمت تصویری و گرافیکی است. این نوع ارائه تصمیم گیران و صاحبین اطلاعات را قادر می سازد، تا آنالیز داده های خود را به صورت بصری دریافت کنند. همین موضوع باعث می شود تا درک مفاهیم دشوار و شناسایی الگوهای جدید ساده تر گردد.

مقاله

اهمیت و الگوریتم داده کاوی

داده کاوی علم کشف و بدست آوری دانش از میان مقادیر زیادی داده خام است. به زبان ساده با پیشرفت و حجم بالای داده ها ذخیره شده در این سیستم ها، به ابزاری نیاز است تا بتوان این داده را به صورت ساده نمایش و پردازش کرد و اطلاعات حاصل از آن را در اختیار کاربران قرار داد. در جلسه قبل به موارد همچون تحلیل داده کاوی پرداختیم و توصیه ما اینست در صورتی که هنوز مقاله قبلی را مشاهده نکرده اید اینجا کلیک کنید تا درک بهتری نسبت به این جلسه داشته باشید.
 موارد این جلسه :
– اهمیت داده کاوی
– الگوریتم های داده کاوی و ارزش های آن
و جزئیات دیگر در این باره که در ادامه به صورت کلی بیان خواهیم کرد.

با ما تا اخر این مقاله همراه باشید.

اهمیت داده کاوی


با پیشرفت و حجم سنگین داده ها، نیاز به زمان بیشتری برای تجزیه و تحلیل داده ها لازم است. هر دو سال یک بار، حجم داده‌ها دو برابر می‌شود. ۹۰ درصد اطلاعات دنیای دیجیتال را داده‌های بدون ساختار (unstructured data) تشکیل می‌دهند. از سوی دیگر، اطلاعات بیشتر لزوماً به معنای دانش بیشتر نیست و در نظر داشته باشید که آرشیوهای اطلاعاتی، به دلیل حجم بسیار زیاد، غالباً به مقبره‌های اطلاعات تبدیل می‌شوند.

شما با داده کاوی می‌توانید:
-تمام داده‌های نامرتبط، بی‌فایده و تکراری را از مجموعه داده‌های‌تان حذف کنید.
-موارد مرتبط را شناسایی کرده و از آنها برای نیل به اهداف از پیش تعیین شده خود بهره ببرید.
-به فرایند تصمیم‌گیری آگاهانه سرعت ببخشید.
امروزه داده کاوی به عنوان پایه و مبنای تحلیل‌ها محسوب می‌شود و به شما کمک می‌کند که مدل‌هایی را توسعه دهید که قادر است از میان میلیون‌ها یا میلیاردها رکورد، روابط را شناسایی کند. داده کاوی در حال شکل دادن به جهانی است که در آن زندگی می‌کنیم.

الگوریتم های داده کاوی


داده کاوی شامل چندین الگوریتم مهم است که در ادامه چندمورد از این الگوریتم ها را بررسی خواهیم کرد.
-خوشه‌بندی داده‌ها (Clustering)
خوشه بندی از جمله الگوریتم های دسته‌بندی داده‌کاوی است.یکی از روش‌های بدون ناظر برای اکتشاف دانش از داده‌ها است که بدون پیش‌فرض، داده‌ها را براساس فاصله معنی‌دار تفکیک و دسته‌بندی می‌کند. به صورت ساده الگوریتم خوشه بندی اطلاعاتی را که ویژگی‌های نزدیک به هم و مشابه دارند را در قطعه هایی جداگانه که به آن خوشه گفته می‌شود قرار می‌دهد. نمونه‌هایی از خوشه‌بندی داده‌ها به شرح زیر هستند:

  • بخش‌بندی بازار بر مبنای روند مراجعات و تماس مشتریان با سازمان
  • تقسیم‌بندی مشتریان بر اساس هزینه‌ها و درآمدهایی که برای سازمان ایجاد می‌کنند.
  • تعیین راهبردهای بازاریابی بر مبنای رفتار خرید مشتریان در خوشه‌های مختلف
  • تعیین انواع قراردادهای پیمانکاری بر اساس روند پرداخت وجه از سوی مشتریان

الگوریتم شبکه های عصبی (Neural Network Algorithm)

شبکه­های عصبی از پرکاربردترین و عملی ­ترین روش­های مدلسازی مسائل پیچیده و بزرگ که شامل صدها متغیر هستند، می­باشد.شبکه‌های عصبی، مدل پیشرفته‌ای از رگرسیون‌های پیوسته قابل‌آموزش هستند که می‌توانند آینده را بر مبنای رویدادهای گذشته پیش‌بینی کنند.
هر شبکه عصبی شامل یک لایه ورودی است که هر گره در این لایه معادل یکی از متغیرهای پیش­بینی می­باشد.در شبکه های عصبی هدف اصلی پیش بینی مقادیر داده پیوسته (همانند: مبلغ فروش،معاملات، سود و یا قیمت سهام) است. الگوریتم های عصبی در موارد زیر پیشنهاد میشود :
– بازاریابی، مانند رسیدن به موفقیت در ارسال نامه های تبلیغاتی

– پیش‌بینی حرکت سهام، نوسانات نرخ ارز و یا سایر اطلاعات سیال مالی که دارای پیشینه هستند

– تجزیه و تحلیل فرآیند‌ های تولیدی و صنعتی

– درک نحوه و کیفیت کار کارکنان ممتاز در پاسخگویی به درخواست مشتریان


الگوریتم سری های زمانی (Time Series Algorithm)


این مدل نوعی الگوریتم رگرسیون است که برای پیش بینی مقادیر پیوسته مانند فروش محصولات در طول زمان استفاده می‌شود.در واقع سری های زمانی، مجموعه ای اطلاعات از افزایش های متوالی داده ها که در یک دوره زمانی جمع آوری شده اند می باشد. این الگوریتم یکی از ساده‌ترین روش‌های داده کاوی است که بر اساس روند گذشته، تخمینی از مقادیر آینده ارائه می‌کند. و چند مورد از کاربرد های مؤثر سری زمانی به شرح زیر است:
– شناسایی عوامل و بازه‌های زمانی موثر
– تحلیل روند رشد درآمد‌ها
– مقایسه عملکرد مالی با شرکت های دیگر


طبقه‌بندی داده‌ها (Classification)

 
یکی دیگر از روش‌های مهم، یادگیری نظارت‌شده برای پیش‌بینی طبقه داده‌ها است، که بر مبنای طبقات مشخص شده و تعیین شده اقدام به شناسای طبقه داده های جدید میکند.
چند نمونه از کاربردهای طبقه‌بندی به شرح زیر است:

  • طبقه بندی نمایندگان فروش
  • درخت تصمیم برای تصمیم گیری درباره فرآیند فروش 
  • گروه بندی مشتریان براساس مشخصات تعیین شده
  • تفکیک مشتریان جدید بر اساس مدت زمان و نوع خدمات یا محصول دریافتی با توجه به سوابق یادگرفته شده از مشتریان فعلی و مشتریان جداشده از سازمان

 

نتیجه گیری
در مقاله حاضـر پـس از بررسـي تكنولـوژی داده كـاوي، اهمیت و کاربرد در این زمینه پرداخته شده است . همانگونـه كه بيان گرديد، توان قدرت تحليل تكنولوژی داده كاوی مـدل هـای الگوریتم متنـوعی را شامل می شود که هر کدام کاربرد خاص خود را دارند.
 با ما در مقالات بعدی و با موضوعات جدید همراه باشید.

مقاله

علم و تحلیل داده کاوی

در چندین سال اخیر که جهان پیشرفت چشمگیری از داده شده، حجم این داده‌ها و سرعت تولید آن‌ها با ظهور وب و البته شبکه‌های اجتماعی رشد فرایندی داشته و <<علم داده>> ، <<تحلیل داده>> ، <<داده کاوی>> با نرخ نجومی در حال رشد و توسعه هستند. با این وجود شرکت های زیادی به دنبال کارشناس در مورد تحلیل داده میگرند تا در تصمیم گیری ها کمک کننده باشند.
داده کاوی در سال‌های اخیر رشد زیادی در دنیای فناوری داشته است و نکته‌ی قابل توجه این است که این علم ظرفیت ایجاد تغییرات در تمامی زمینه‌ها را دارد. ما در این مقاله به مواردی همچون :
مفهوم تحلیل داده کاوی چیست؟
منظور از علم داده کاوی چیست؟
و تفاوت داده کاوی با ماشین را بیان خواهیم کرد.
گفته میشود قبل از خواندن ادامه این مقاله برای دید بهتر از تحلیل داده کاوی لطفا مقاله قبلی ما را مطالعه کنید.

داده ها و علم داده ها در دنیای امرزوی


داده‌ها به میزان هوشمندی که می‌توان از آن‌ها استخراج کرد مفید و حائز اهمیت هستند و  استخراج دانش و هوشمندی از داده‌ها، مستلزم انجام تحلیل‌های موثر و قدرت پردازش کامپیوتری بالا برای مواجهه با افزایش حجم داده‌ها است.
علم داده مفهومی است که برای داده های کلان بکار برده میشود، در واقع علوم داده فعالیت‌های گوناگونی را در بر می‌گیرد و شامل پاکسازی، آماده‌سازی و تحلیل داده می‌شود و از ترکیب مباحث مختلفی به وجود آمده و بر مبانی و روش‌های موجود در حوزه‌های مختلف علمی بنا شده‌اس که شامل موارد همچون ریاضیات ، آمار ، علوم کامپیوتری، مهندسی داده و دیگر استفاده میشود. علم داده برای یکپارچه‌سازی آمار، تحلیل داده، یادگیری ماشین و دیگر مفاهیم مرتبط تحت یک عنوان واحد است.

تاریخچه


در سال ۱۹۶۰ آماردانان اصطلاح “Data Fishing” یا “Data Dredging”به معنای “صید داده” را جهت کشف هر گونه ارتباط در حجم بسیار بزرگی از داده‌ها بدون در نظر گرفتن هیچگونه پیش فرضی بکار بردند. بعد از سی سال و با انباشته شدن داده‌ها در پایگاه داده اصطلاح داده کاوی در حدود سال ۱۹۹۰ رواج بیشتری یافت. اصطلاحات دیگری نظیر “Data Archaeology”یا “Information Harvesting” یا “Information Discovery” یا”Knowledge Extraction” نیز بکار رفته‌اند.

مهارت های لازم برای تبدیل شدن به یک متخصص داده


با وجود در خواست شرکت های بزرگ دنیا در حوضه داده باید بگم هر کسی که در این دامنه علاقمند است باید در سه مهارت کلیدی از جمله : تحلیل ، برنامه نویسی و دانش دامنه مهارت لازم را داشته باشد. در قسمت پایین به صورت شکل آن را بیان خواهیم کرد.

مهارت های لازم برای تبدیل شدن به یک متخصص داده

تحلیل داده کاوی


داده‌کاوی و علم داده هر دو از واژگان باب روز در قرن ۲۱ هستند. به همین دلیل است که اغلب افراد تمایل دارند تعاریف و تفاوت‌های آن‌ها را بدانند.علم داده یک واژه مادر است که تحلیل داده، داده‌کاوی، یادگیری ماشین و چندین مبحث مرتبط دیگر را در بر می‌گیرد. تحلیل‌گر داده بینش معنادار را از چندین منبع داده استخراج می‌کند.

مهارت های لازم برای به یک متخصص تحلیل داده کاوی


 یک دانشمند داده پرسش‌ها را طرح می‌کند و تحلیل‌گر داده پاسخ‌های یک مجموعه از پرسش‌ها را فراهم می‌کند. یکی از موارد مهم در این باره ریاضیات و الگوریتم هستند که نقش اساسی در داده‌کاوی دارند.
یک تحلیل‌گر داده باید قادر به دریافت یک مساله، پرسش یا موضوع خاص، تشریح اینکه این داده‌ها چطور به نظر می‌رسند.افرادی که تمایل دارند به تحلیل‌گر داده مبدل شوند، باید چهار مهارت زیر را کسب کنند.
– دانش دامنه

-آمار و احتمالات و جبر خطی

-الگوریتم‌های داده‌کاوی و یادگیری ماشین

-یک زبان برنامه‌نویسی محاسباتی مانند R و یک زبان اسکریپت‌ نویسی مانند پایتون

در این مقاله مفهوم کلی درباره تحلیل داده کاوی و تاریخچه آن را بررسی کردیم و همچنین مهارت لازم برای تبدیل شدن به متخصص داده کاوی که یکی از موارد مهم بشمارد میآید. از آنجا که هنوز داده کاوی موارد مختلفی را دارد پس با ما باشید تا در مقاله بعدی اهمیت و الگوریتم داده کاوی را بررسی کنیم.

مقاله

Data Mining(داده کاوی)

تعریف Data Mining(داده کاوی)

در دو دهه قبل توانايي‌های فنی بشر در برای توليد و جمع آوری داده‌ها به سرعت افزايش يافته است. عواملی نظير استفاده گسترده از بارکد برای توليدات تجاری، به خدمت گرفتن کامپيوتر در کسب و کار، علوم، خدمات دولتی و پيشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاوير تا سيستمهای سنجش از دور ماهواره ای، در اين تغييرات نقش مهمی دارند.

به‌طور کلی استفاده همگانی از وب و اينترنت به عنوان يک سيستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. اين رشد انفجاری در داده‌های ذخيره شده، نياز مبرم وجود تکنولوژی های جديد و ابزارهای خودکاری را ايجاد کرده که به صورت هوشمند به انسان ياری رسانند تا اين حجم زياد داده را به اطلاعات و دانش تبديل کند: داده کاوی به عنوان يک راه حل برای اين مسائل مطرح است.

در يک تعريف غير رسمی داده کاوی فرآيندی است، خودکار برای استخراج الگوهايی که دانش را بازنمايی مي کنند، که اين دانش به صورت ضمنی در پايگاه داده های عظيم، انباره داده (Data warehouses) و ديگر مخازن بزرگ اطلاعات، ذخيره شده است.

واژه های «داده کاوی» و «کشف دانش در پایگاه داده» (Knowledge Discovery in Database) اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان يک فرآيند در شکل 1-1 نشان داده شده است. 

داده‌کاوی چیست؟
شکل1: داده کاوی به عنوان يک مرحله از فرآيند کشف دانش

به بیان ساده‌تر، داده کاوی به فرآیند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق می‌شود. تعریف دیگر این است که، داده کاوی گونه‌ای از تکنیک‌ها برای شناسایی اطلاعات و یا دانش تصمیم گیری از قطعات داده است، به نحوی که با استخراج آن‌ها، در حوزه‌های تصمیم‌گیری، پیش‌بینی، پیشگویی، و تخمین مورد استفاده قرار گیرند.

مقاله

از گزارش های مدیریتی طولانی تا داشبوردهای مدیریتی مفید و خلاصه

گزارش های خسته کننده، با تعداد برگهای زیاد، که عموماً زمان و انرژی زیادی از تهیه کننده و خواننده گزارش میگیرد را به یاد بیاورید. این گزارش ها، عموماً یا به شکل دقیق نوشته نمی شوند و یا به صورت نادقیق خوانده می شوند. گزارش هایی که عموماً به خاطر متن های طولانی، بیشتر در قفسه ها، نگهداری می شوند، و معمولاً کسی به سراغ آن ها نمیرود. این در حالی است که گزارش دادن و گزارش گرفتن را نمیتوان از یک سازمان حذف کرد.

با پیشرفت علم و شروع نسل سوم هوش تجاری، آرام آرام، گزارش های طولانی، جای خود را به گزارش های خلاصه به صورت عدد و رقم و نمودار می دهند. این گزارش ها، همیشه به همراه اطلاعات تکمیلی و یا دانش خواننده گزارش، میتواند روند جاری سازمان یا اداره را به مدیران یا کارشناسان عرضه کند. همچنین این سیستم ها، که به نوعی به سیستم های پشتیبانی از تصمیم نیز معروف هستند، اگر درست استفاده شوند، میتوانند تاثیر به سزایی در بهره وری یک سازمان داشته باشند. همچنین جلوگیری از نشر اطلاعات غلط و به طبع آن جلوگیری تصمیمات غلط نیز، از جمله فواید استفاده از این نوع گزارش ها می باشند. گزارش هایی که عموماً با استفاده از داشبوردهای مدیریتی عرضه می شوند.

داشبوردهای مدیریتی را شاید بتوان یکی از نرم افزارهای حساس در یک سازمان معرفی کرد. زیرا ممکن است یک گزارش نادقیق در یک سازمان،‌ به یک تصمیم غلط منجر شود. این در حالی است که تصمیم گیران یک سازمان،‌ احتمالاً نتایج تصمیمات خود را چند ماه یا حتی چند سال بعد میگیرند. تصمیمات غلط که بر اساس داده های غلط به دست می آیند، احتمالاً همیشه میتوانند مشکل ساز باشند.

مورد گفته شده در بالا و موارده دیگری از این جنس، لزوم یک نرم افزار داشبورد مدیریتی کامل به همراه یک تیم پشتیبان، جهت نصب، استقرار، پشتیبانی و مشاوره و آموزش طراحی KPIهای یک سازمان را نشان می دهد. KPI ها در یک سازمان و تبدیل شاخص ها، نیاز به یک مشاور قدرتمند و باتجربه دارد که هم از سازمان اطلاعات دقیقی داشته باشد و هم توانایی ارتبا با داشبورد های مدیریتی را داشته باشد.

داشبورد مدیریتی نگاه، که توسط مهندسان ایرانی، به صورت بومی نوشته شده است، با پیاده سازی موفق موارد متعدد در سازمان های مختلف، نقاط قوت خود را بهینه کرده و نقاط ضعف خود را نیز کاهش داده است تا به صورت کارا، بتواند با کمترین خطای ممکن، داده های سازمان را در لحظه به مدیران و کارشناسان سازمان، نمایش دهد. همچنین طراحی و مشاوره در زمینه شاخص ها و KPIها، از دیگر توانایی های نگاره در حوزه هوش تجاری و نمایش داده ها می باشد.

1 2
Privacy Settings
We use cookies to enhance your experience while using our website. If you are using our Services via a browser you can restrict, block or remove cookies through your web browser settings. We also use content and scripts from third parties that may use tracking technologies. You can selectively provide your consent below to allow such third party embeds. For complete information about the cookies we use, data we collect and how we process them, please check our Privacy Policy
Youtube
Consent to display content from Youtube
Vimeo
Consent to display content from Vimeo
Google Maps
Consent to display content from Google
Spotify
Consent to display content from Spotify
Sound Cloud
Consent to display content from Sound