یادگیری ماشین (Machine Learning) چیست؟ انواع و کاربردهای آن
یادگیری ماشین (Machine Learning) یا به اختصار ML به سیستمها کمک میکند تا به صورت خودکار یادگیری و پیشرفت داشته باشند. یک ماشین به کمک ماشین لرنینگ میتواند از تجربیات و مشاهداتی که بر اساس یک مجموعه داده تجزیه و تحلیل میکند، آموزش ببیند. در این مطلب توضیح میدهیم یادگیری ماشین چیست و علت اهمیت، انواع و نحوهی انتخاب ماشین لرنینگ مناسب را بررسی میکنیم. همچنین بررسی میکنیم که چه کسانی از یادگیری ماشین استفاده میکنند و آیندهی آن چگونه خواهد بود.
یادگیری ماشین چیست؟
بگذارید ابتدا برایتان کامل توضیح دهیم ماشین لرنینگ دقیقاً چیست. یادگیری ماشین نوعی هوش مصنوعی (Artificial Intelligence) و به اختصار AI است که در بین متخصصان استفاده میشود. یادگیری ماشین به برنامههای نرمافزاری اجازه میدهد تا در پیشبینی نتایج خروجی دقیقتر عمل کنند، بدون اینکه به طور مستقیم برای انجام این کار برنامهریزی شده باشند.
الگوریتمهای یادگیری ماشین از دادههای سابق به عنوان ورودی برای یادگیری و سپس پیش بینی مقادیر خروجی جدید استفاده میکنند.
موتورهای توصیهگر یکی از موارد رایج استفاده از سیستم یادگیری ماشین هستند. سایر فناوریهای محبوبی که از یادگیری ماشین استفاده میکنند، عبارتاند از: تشخیص تقلب، فیلتر کردن هرزنامه، تشخیص تهدید بدافزاری (Malware Threat Detection)، اتوماسیون فرایند کسبوکار (BPA: Business Process Automation) و سیستم نگهداری از طریق پیش بینی.
علت اهمیت یادگیری ماشین چیست؟
شاید برایتان جالب باشد بدانید علت اینکه ماشین لرنینگ بسیار مهم است، چیست. یادگیری ماشین به این دلیل مهم است که دیدگاهی جدید از روند رفتار مشتریان در هنگام تعامل با کسبوکار و الگوهای عملیاتی کسبوکار به شرکتها ارائه میدهد و همچنین از توسعه محصولات جدید پشتیبانی میکند. بسیاری از شرکتهای پیشروی امروزی مانند فیسبوک، گوگل و اوبر، یادگیری ماشین را به بخش مرکزی عملیات کسبوکار خود تبدیل کردهاند. به طور کلی، یادگیری ماشین به نوعی مزیت رقابتی مهم برای بسیاری از شرکتها تبدیل شده است.
یادگیری ماشین کلاسیک اغلب بر اساس اینکه الگوریتمهای آن به چه روشی یادگیری را برای ارائهی پیشبینی دقیقتر انجام میدهند، طبقهبندی میشود. نوع الگوریتم یادگیری ماشین که دانشمندان داده انتخاب میکنند، به نوع دادهای بستگی دارد که میخواهند پیش بینی کنند. حال بیان میکنیم که چهار رویکرد اساسی برای ماشین لرنینگ چیست.
یادگیری تحت نظارت (Supervised Learning): در این نوع یادگیری ماشین دانشمندان داده الگوریتمهایی را با دادههای آموزشی برچسبگذاری شده آموزش میدهند و متغیرهایی را مشخص میکنند که میخواهند الگوریتم مورد نظر همبستگی میان آنها را ارزیابی کنند. به عبارتی، در این شیوهی یادگیری ماشین هم ورودی و هم خروجی الگوریتم مشخص میشود.
یادگیری بدون نظارت (Unsupervised Learning): این نوع یادگیری ماشین شامل الگوریتمهایی است که با استفاده از دادههای بدون برچسب آموزش میبینند. الگوریتم یادگیری بدون نظارت از طریق مجموعه دادههای ورودی خود، هر گونه ارتباط معنیدار میان آنها را ارزیابی میکند. به عبارت بهتر، در این شیوهی یادگیری ماشین دادههایی که الگوریتمها روی آنها آموزش میبینند و همچنین پیشبینیها یا توصیههایی که در خروجی تولید میکنند، از پیش تعیین شده هستند.
یادگیری نیمه نظارتی (Semi-supervised Learning): این رویکرد نوعی یادگیری ماشین ترکیب شده از دو شیوهی یادگیری قبلی است. دانشمندان داده در این روش الگوریتم را با دادههای آموزشی برچسبگذاری شده آموزش میدهند. از سوی دیگر این مدل میتواند دادهها را به تنهایی بررسی کرده و درک خود را از این مجموعه دادههای ورودی توسعه دهد و چیزهای بیشتری یاد بگیرد.
یادگیری تقویتی (Reinforcement Learning): دانشمندان داده معمولا از شیوهی یادگیری تقویتی برای آموزش سیستمی و برای تکمیل فرآیندی چند مرحلهای استفاده میکنند؛ فرآیندی که قوانین کاملا مشخصی نیز برای آن وجود دارد. در این روش دانشمندان داده ابتدا الگوریتمی را برای تکمیل یک کار برنامهریزی میکنند. سپس سرنخهای مثبت یا منفیای را در رابطه با نحوهی تکمیل کار مورد نظر به همان الگوریتم میدهند. با وجود این، در بیشتر موارد، الگوریتم یادگیری تقویتی به تنهایی تصمیم میگیرد که در طول مسیر چه مراحلی را طی کند.
نحوهی کار یادگیری ماشین تحت نظارت
همان طور که اشاره شد، یادگیری ماشین تحت نظارت برای آموزش به دانشمند داده نیاز دارد تا الگوریتم را با ورودیهای برچسبگذاری شده و خروجیهای مورد انتظار آموزش دهند. الگوریتم یادگیری تحت نظارت برای انجام کارهای زیر خوب است:
- طبقهبندی باینری (Binary classification): برای تقسیم دادهها به دو دستهی مختلف؛
- طبقهبندی چند دستهای (Multi-class classification): برای انتخاب بین بیش از دو پاسخ ممکن؛
- مدلسازی رگرسیون (Regression modeling): برای پیش بینی مقادیر پیوسته؛
- کلاسهبندی (Ensembling): برای ترکیب پیشبینیهای چندین مدل یادگیری ماشین به منظور ارائهی پیشبینی دقیقتر.
نحوهی کار یادگیری ماشین بدون نظارت
الگوریتمهای یادگیری ماشین بدون نظارت نیازی به برچسبگذاری دادهها ندارند. این الگوریتمها دادههای بدون برچسب را ارزیابی میکنند تا الگوهای مشخصی را در آنها پیدا کنند. الگوهایی که میتوانند برای گروهبندی دادهها در مجموعه دادهها استفاده شوند. بسیاری از روشهای یادگیری ژرف از جمله شبکههای عصبی از الگوریتمهای یادگیری بدون نظارت استفاده میکنند. در ادامه میگوییم کاربرد این الگوریتم ماشین لرنینگ چیست. به طور کلی، الگوریتمهای یادگیری بدون نظارت برای انجام کارهای زیر خوب هستند:
- دستهبندی (Clustering): تقسیم مجموعه دادهها به گروههای مختلف بر اساس شباهت هر داده به سایر دادهها؛
- تشخیص ناهنجاریها (Anomaly detection): شناسایی دادههای غیرعادی در یک مجموعه داده؛
- کاوش ارتباطات (Association mining): شناسایی مجموعهای از آیتمها در یک مجموعه داده که اغلب به هم مرتبط بوده و با هم اتفاق میافتند؛
- کاهش ابعاد (Dimensionality reduction): کاهش تعداد متغیرها در یک مجموعه داده.
نحوهی کار یادگیری ماشین نیمه نظارتی
یادگیری نیمه نظارتی توسط دانشمندان داده کار میکند که مقدار کمی از دادههای آموزشی برچسبگذاری شده را به الگوریتم یادگیری به عنوان ورودی میدهند. الگوریتم مذکور از این طریق، ابعاد مجموعه دادهها را یاد میگیرد. سپس میتواند آموختههای خود را روی دادههای جدید و بدون برچسب اعمال کند. عملکرد این الگوریتمها معمولا زمانی بهبود مییابد که روی مجموعه دادههای برچسبگذاری شده آموزش ببینند. با این حال برچسبگذاری دادهها میتواند زمانبر و پرهزینه باشد. از این روی، یادگیری نیمه نظارتی، عملکرد یادگیری تحت نظارت و همچنین کارایی یادگیری بدون نظارت را با همدیگر ترکیب میکند. برخی از زمینههایی که یادگیری نیمه نظارتی در آنها استفاده میشود، عبارتاند از:
- ترجمه ماشینی (Machine translation): آموزش الگوریتمهایی برای ترجمه زبان بر اساس فرهنگ لغت کامل کلمات آن؛
- تشخیص تقلب (Fraud detection): شناسایی موارد تقلب در مواردی که تنها چند نمونه مثبت در دسترس است؛
- برچسبگذاری دادهها (Labelling data): الگوریتمهایی که با استفاده از مجموعههای داده کوچک آموزش داده شدهاند، میتوانند یاد بگیرند که بهطور خودکار برچسبهای داده را روی مجموعههای بزرگتر نیز اعمال کنند.
نحوهی کار یادگیری ماشین تقویتی
یادگیری تقویتی با برنامهریزی الگوریتمی دارای هدفی مشخص و مجموعهای از قوانین تعیین شده برای دستیابی به هدف مذکور کار میکند. همچنین دانشمندان داده این الگوریتم را به گونهای برنامهریزی میکنند که به دنبال دریافت پاداشهای مثبت (هنگام انجام عملی مفید برای تحقق هدف نهایی دریافت میشود) و اجتناب از تنبیه (هنگام انجام عملی دریافت میشود که الگوریتم را از هدف نهایی خود دورتر میکند) باشد. یادگیری تقویتی اغلب در زمینههایی مانند موارد زیر به کار گرفته میشود:
- رباتیک (Robotics): رباتها میتوانند با استفاده از این تکنیک نحوهی انجام کارها را در دنیای واقعی بیاموزند؛
- انجام بازیهای ویدیویی (Video gameplay): یادگیری تقویتی برای آموزش رباتها به منظور انجام برخی بازیهای ویدیویی به کار گرفته شده است؛
- مدیریت منابع (Resource management): شرکتها منابع محدود و هدفی معین دارند. از این روی، یادگیری تقویتی میتواند به آنها در مدیریت منابع کمک کند تا نحوهی تخصیص منابع را برنامهریزی کنند.
یادگیری ماشینی چه کاربردی دارد؟
امروزه یادگیری ماشین میتواند در طیف وسیعی از صنایع کاربردهای مختلفی داشته باشد. یکی از معروفترین نمونههای کاربرد ماشین لرنینگ در عمل شاید استفاده از آن در هستهی سیستمهای توصیهگر باشد که دادههای سرویس خبری فیسبوک را تأمین میکنند.
فیسبوک از آن برای شخصیسازی نحوهی ارائهی اخبار به هریک از کاربرانش استفاده میکند. اگر یک کاربر به طور مرتب برای خواندن پستهای یک گروه خاص علاقه نشان دهد، موتور توصیهگر فعالیتهای بیشتری از آن گروه را در صفحهی کاربر مورد نظر نشان میدهد. در پشت صحنهی این عملیات نیز موتور توصیهگر تلاش میکند تا الگوهایی را که از رفتار آنلاین کاربران آموخته است، تقویت کند. همچنین اگر کاربری الگوهای رفتاری خود را تغییر دهد و نتواند پستهای گروه مورد علاقهی خود را در هفتههای آینده بخواند، سرویس نمایش اخبار مطابق با رفتارهای جدید وی تنظیم میشود.
علاوه بر موتورهای توصیهگر، کاربردهای دیگری را هم برای یادگیری ماشین میتوان نام برد که برخی از این موارد عبارتاند از:
- مدیریت ارتباط با مشتری: نرمافزار مدیریت ارتباط با مشتری (CRM) میتواند از مدلهای یادگیری ماشین برای تجزیه و تحلیل ایمیلها استفاده و در ادامه اعضای تیم فروش را ترغیب کند که ابتدا به مهمترین ایمیلها پاسخ دهند. سیستمهای پیشرفتهتر میتوانند حتی پاسخهای بالقوهی مؤثر را به اعضای تیم فروش توصیه کنند؛
- هوش تجاری: سرمایه گذاران هوش تجاری (BI) و علم تجزیه و تحلیل از یادگیری ماشین در نرمافزارهای خود برای شناسایی دادههای بالقوهی مهم، الگوهای دادهها و تشخیص ناهنجاریها استفاده میکنند؛
- ماشینهای خودران: الگوریتمهای ماشین لرنینگ میتوانند حتی این امکان را برای یک خودروی نیمهخودران فراهم کنند که یک جسم تقریبا غیرقابل مشاهده را تشخیص، و به راننده هشدار دهد؛
- دستیار مجازی: دستیارهای هوشمند معمولا مدلهای یادگیری ماشین تحت نظارت و بدون نظارت را برای تفسیر گفتار طبیعی و ارائهی راهنماییهای لازم با یکدیگر ترکیب میکنند؛
- سیستم اطلاعات منابع انسانی: سیستم اطلاعات منابع انسانی یا Human Resource Information System و به اختصار HRIS میتواند از مدلهای یادگیری ماشین برای فیلتر کردن تقاضاهای استخدام و شناسایی مناسبترین کارجویان برای موقعیتهای شغلی خالی استفاده کند.
مزایا و معایب یادگیری ماشین چیست؟
همان طور که اشاره شد، یادگیری ماشین موارد استفاده زیادی را شامل میشود که از آن جمله میتوان پیشبینی رفتار مشتری تا تشکیل سیستم عامل برای خودروهای خودران را نام برد. اکنون قصد داریم کاملتر توضیح دهیم مزایا و معایب ماشین لرنینگ چیست. هنگامی که صحبت از مزایا میشود، ماشین لرنینگ میتواند به شرکتها کمک کند تا مشتریان خود را به طور عمیقتری درک کنند. در واقع، الگوریتمهای یادگیری ماشین میتوانند با جمعآوری دادههای مشتریان و برقراری ارتباط میان این دادهها و رفتارهای کاربران در طول زمان، الگوهای مربوطه و ارتباطاتشان را بیاموزند و در نتیجه به کارکنان کسبوکار کمک کنند تا ابتکارات خود برای توسعهی محصول و بازاریابی را با تقاضای مشتریان مطابقت دهند.
همچنین برخی از شرکتها از الگوریتمهای آن به عنوان هستهی اصلی مدلهای تجاری خود استفاده میکنند. برای مثال، اوبر از الگوریتمهایی برای تطبیق رانندگان با مشتریان استفاده میکند. گوگل نیز از آنها برای نمایش تبلیغات در جستجوهای کاربران كمك میگیرد.
با وود این، یادگیری ماشین معایبی نیز به همراه دارد. اول از همه، استفاده از آن ممکن است هزینهبر باشد. پروژههای یادگیری ماشین معمولا توسط دانشمندان داده هدایت میشوند که آنها هم حقوق بالایی دارند. این پروژهها همچنین به زیرساختهای نرمافزاری نیاز دارند که این زیرساختها نیز میتوانند گران تمام شوند. همچنین مشکل دیگری تحت عنوان جهتگیری متعصبانه نیز دارد.
به عبارت دیگر، برخی الگوریتمها ممکن است روی مجموعه دادههایی آموزش داده شوند که گروههای خاصی را حذف میکنند یا در مورد آنها نتایج غلطی ارائه میدهند. این الگوریتمها میتوانند به ارائهی مدلهای نادرستی از دادهها منجر شوند که این مدلها در بهترین حالت شکست میخورند و در بدترین حالت نیز به مدلهای تبعیضآمیز مبدل میشوند. در نتیجه، هنگامی که شرکتی فرایندهای اصلی کسبوکار خود را بر اساس چنین مدلهای تبعیضآمیزی تنظیم میکند، نتیجهی به دست آمده میتواند غیرقانونی بوده یا به محبوبیت کسبوکار آسیب برساند.
در ادامه میآموزیم نحوهی انتخاب مدل ماشین لرنینگ مناسب چیست.
فرایند انتخاب مدل یادگیری ماشین مناسب برای حل یک مشکل، اگر به صورت استراتژیک انجام نشود، میتواند زمانبر باشد. در ادامه، مراحلی استراتژیک برای دستیابی به مدل مناسب ارائه شده است.
گام اول: دادههای بالقوهی ورودی که باید برای راه حل مسئلهی مربوطه در نظر گرفته شوند، در ابتدا بررسی میشوند. این مرحله به کمک دانشمندان داده و کارشناسانی نیاز دارد که درک عمیقی از مسئلهی مذکور دارند؛
گام دوم: دادهها در این مرحله جمع آوری میشوند، آنها به فرمت مشخصی تبدیل شده و در صورت لزوم برچسبگذاری میشوند. هدایت این مرحله معمولا برعهده دانشمندان داده و با کمک افرادی است که دیتاها را آماده کردهاند؛
گام سوم: الگوریتم یا الگوریتمهای مورد استفاده انتخاب، و هر الگوریتم آزمایش میشود تا کارکرد آنها روی دادههای مورد نظر ارزیابی شود. دانشمندان داده معمولا افرادی هستند که این مرحله را انجام میدهند؛
گام چهارم: خروجیها به طور دقیق بررسی میشوند و این مرحله تا زمانی ادامه مییابد که خروجی الگوریتم به سطح قابل قبولی از دقت برسد. این مرحله معمولا توسط دانشمندان داده به همراه ارائهی بازخورد از جانب کارشناسانی انجام میشود که درک عمیقی از مسئلهی مذکور دارند.
درک یادگیری ماشینی توسط انسان چه اهمیتی دارد؟
بیان نحوهی کار یک مدل خاص یادگیری ماشین زمانی که مدل مذکور پیچیده است، میتواند چالش برانگیز باشد. دانشمندان داده در برخی از صنایع عمودی که بازار هدف یا مشتریان هدف مشخصی دارند، به طور معمول از مدلهای سادهای استفاده میکنند. زیرا برای این کسبوکارها مهم است که نحوهی اتخاذ هر تصمیم را به مخاطب غیرمتخصص خود توضیح دهند. این امر به ویژه در صنایعی که هزینههای اداری سنگینی برای حفظ انطباق با مقررات میپردازند، مانند بانکداری و بیمه دیده میشود. مدلهای ماشین لرنینگ پیچیده میتوانند پیشبینیهای دقیقتری ارائه کنند. اما توضیح نحوهی تولید خروجی در این الگوریتمها به یک فرد غیرمتخصص احتمالا دشوار خواهد بود.
خلاصه
ماشین لرنینگ یکی از زیرمجموعههای هوش مصنوعی است و به برنامهها این امکان را میدهد تا بتوانند به دادهها دسترسی پیدا کرده و از آنها برای یادگیری استفاده کنند. در این مطلب مفصل توضیح دادیم ماشین لرنینگ چیست و انواع، مزایا و نحوهی کار با انواع یادگیری ماشین را بررسی کردیم. علاوه بر آن، کاربردها، مزایا و معایب، نحوهی انتخاب ماشین لرنینگ مناسب شرح دادیم. و در انتها به پیشبینی آیندهی پیشروی الگوریتمهای ماشین لرنینگ پرداختیم. اگر سؤال یا نظری دربارهی این مطلب دارید با ما در میان بگذارید.
منبع: کاربوم