مقاله رایگان درمورد الگوریتم، عضویت، پارامترهای

مثلاً به 30 تعلق 0.8 و به 35 تعلق 0.75 و به 90 تعلق 0.1 را بدهیم. اگر اعضای یک مجموعه فازی تنها دارای تابع تعلق 0 و 1 باشند این مجموعه فازی یک مجموعه کلاسیک خواهد بود. نکته جالب توجه این است که مثلا سن 50 می تواند با تعلق 0.5 عضو مجموعه جوان باشد و با تعلق 0.5 عضو مجموعه پیر یعنی یک عضو مجموعه مرجع میتواند با درجههای تعلق مختلف عضو مجموعههای فازی تعریف شده روی مجموعه مرجع باشد.
در خوشهبندی کلاسیک هر نمونه ورودی متعلق به یک و فقط یک خوشه میباشد و نمیتواند عضو دو خوشه و یا بیشتر باشد. حال حالتی را در نظر بگیرید که میزان تشابه یک نمونه با دو خوشه و یا بیشتر یکسان باشد در خوشه بندی کلاسیک باید تصمیم گیری شود که این نمونه متعلق به کدام خوشه است. تفاوت اصلی خوشهبندی کلاسیک و خوشهبندی فازی در این است که یک نمونه میتواند متعلق به بیش از یک خوشه باشد. برای روشن شدن مطلب شکل 3-2 را در نظر بگیرید:
شکل 3-2: مجموعه داده پروانه‌ای.
منبع: (Castellano, & et. al., 2007)
اگر نمونههای ورودی مطابق شکل فوق باشند مشخص است که میتوان دادهها را به دو خوشه تقسیم کرد اما مشکلی که پیش میآید این است که داده مشخص شده در وسط میتواند عضو هر دو خوشه باشد. بنابراین باید تصمیم گرفت که داده مورد نظر متعلق به کدام خوشه است، خوشه سمت راست یا خوشه سمت چپ. اما اگر از خوشهبندی فازی استفاده شود، داده مورد نظر با تعلق 0.5 عضو خوشه سمت راست و با تعلق مشابه عضو خوشه سمت چپ است. تفاوت دیگر در این است که مثلاً نمونههای ورودی در سمت راست شکل 3-3 میتوانند با یک درجه تعلق خیلی کم عضو خوشه سمت چپ نیز باشند که همین موضوع برای نمونههای سمت چپ نیز صادق است.
به عنوان یک مثال دیگر شکل 3-3 را در نظر بگیرید. در این شکل نمونههایی که با علامت بعلاوه مشخص شدهاند به بیش از یک خوشه تعلق دارند.
شکل 3-3: خوشه بندی فازی داده.
منبع: (Singth, & et. al., 2011)
3-4-2- الگوریتم ژنتیک
الگوریتمهای ژنتیکی براساس تئوری تکاملی داروین میباشند و جواب مسالهای که از طریق الگوریتم ژنتیک حل میشود مرتباً بهبود مییابد. الگوریتم ژنتیک با یک مجموعه از جوابها که از طریق کرموزوم‌ها نشان داده میشوند، شروع میشود. این مجموعه جوابها جمعیت اولیه نام دارند. در این الگوریتم جوابهای حاصل از یک جمعیت برای تولید جمعیت بعدی استفاده میشوند. در این فرآیند امید است که جمعیت جدید نسبت به جمعیت قبلی بهتر باشد. انتخاب بعضی از جوابها از میان کل جوابها والدین به منظور ایجاد جوابهای جدید یا همان فرزندان Offspring براساس میزان مطلوبیت آنها می‌باشد. طبیعی است که جوابهای مناسبتر شانس بیشتری برای تولید مجدد داشته باشند. این فرآیند تا برقراری شرطی که از پیش تعیین شده است، ادامه مییابد (Abraham, & Ramos, 2003).
مراحل اصلی الگوریتم ژنتیک در شکل 3-4، نمایش داده شده است.
شکل 3-4: مراحل اصلی الگوریتم ژنتیک.
منبع: (Gonzales, & et. al., 2010)
3-4-2-1- بهینه‌سازی خوشه‌بندی فازی با استفاده از الگوریتم ژنتیک
علم ژنتیک براساس منطق زیستی استوار است و چیزی به عنوان عملگر تصادفی وجود ندارد، یکی از مشکلات اصلی در سیستم فازی، تنظیم صحیح مقادیر پارامترهای این الگوریتم است؛ از همین رو در اکثر مواقع تنظیم مقادیر این پارامترها فرآیند بسیار وقتگیر و مشکل خواهد بود.
پارامترهای ژنتیک برای تعیین اکثر پارامترهای کنترلر فازی، به عنوان نمونه، متغیرهای ورودی و تابع عضویت به کار برده می‌شود. این پارامترها داخل کروموزومها قرار می‌گیرند. این روش، وقتی دانش کنترلی قبلی در دسترس باشد، خیلی قدرتمند است. به عبارت دیگر زمانی که پارامترهای میزانسازی تابع عضویت برای بهبود کارایی کنترلرها استفاده شود، این روش کارایی بالایی دارد (Tang, & Qin, 2010).
طول کروموزومها مطابق با تعداد ویژگی ها می باشد. که در این پایان نامه، منظور از ویژگی ها، ویژگیهای صفحات وب نظیر رنگ پسزمینه یا نوشتههای صفحات وب و …. می باشد. طول کروموزوم‌ها با عملیات کراس اور7 ممکن است تغییر کند. عملیات دیگر ژنتیک مانند selection و reproduction برای همه کروموزوم‌ها در جمعیت اجرا میشود. سرانجام عملیات کراس اور انجام میشود. نقاط کراس اور در کروموزوم پدر و مادر میتواند متفاوت باشد، طول کوروموزومها برای زادو ولد از پدر و مادرشان متفاوت است.
برای تعیین پارامترهای مناسب برای توابع عضویت با استفاده از الگوریتم ژنتیک، ابتدا باید نوع بازنمایی کروموزومها تعیین گردند. شایان ذکر است که هر کروموزوم (انفردای) یک جواب برای مسئله خواهد بود، بدین معنی که هر کروموزوم شامل پارامترهای توابع عضویت برای تمامی ویژگیها خواهد بود. به دلیل این که پارامترهای توابع عضویت میتوانند اعداد اعشاری باشند، در نتیجه بازنمایی هر کروموزوم به صورت آرایهای از اعداد اعشاری در نظر گرفته شد. از آنجایی که میانگین (µ) و انحراف معیار (?) برای توابع عضویت گوسین، و مقادیر ابتدا و انتهای شیب (a، b) برای توابع S شکل و Z شکل، به عنوان پارامترهای این توابع میباشند. در ادامه باید دامنه مقادیر هر یک از توابع عضویت تعیین گردد. برای این منظور با بررسی پایگاههای تصویری متفاوت و مقادیر مختلف ویژگیها ، دامنه هر یک از توابع عضویت تعیین گردید. حال میتوان آماده سازی الگوریتم ژنتیک را آغاز نمود.
پس از تعیین نوع بازنمایی و طول هر کروموزوم، نوبت به ایجاد جمعیت اولیه برای الگوریتم ژنتیک می‌رسد. الگوریتم تولید جمعیت اولیه بدین گونه طراحی شد که هر پارامتر به صورت تصادفی در بازهی مربوط به آن پارامتر مقداردهی میشود. یکی از موارد مهم در تولید جمعیت اولیه، عدم ایجاد تَکالهای (کروموزومهای) ناصحیح است، بدین معنی که تکال ایجاد شده که به عنوان یک کاندید برای جواب مسئله میباشد باید شرایط یک جواب صحیح برای مسئله را داشته باشد. برای رسیدگی به این موضوع شرایطی در الگوریتم تولید جمعیت اولیه درنظر گرفته شد تا در نتیجه پارامترهای توابع عضویت به گونه‌ای انتخاب گردند که برای یک مقدار از ویژگی، دو تابع عضویت درجه تعلق “یک” را گزارش ننمایند. البته از ایجاد پارامترهایی که باعث توی همرفتگی بیش از حد توابع عضویت میشوند نیز جلوگیری میشود.
3-4-3- روش پیشنهادی در این تحقیق
همانطور که اندازه خوشه در طی افزایش کاربران وب افزایش مییابد، نیاز به بهینهسازی خوشهها اجتناب ناپذیر خواهد بود. در این بخش یک متدولوژی بهینهسازی خوشه بر اساس خوشهبندی فازی K-Means ارائه خواهد شد. از آنجا که در سیستم استنتاج فازی تعیین پارامترهای توابع عضویت، تأثیر مهمی در دقت نهایی خوشهبندی دارد. بنابراین در این سیستم برای تنظیم پارامترهای توابع عضویت از الگوریتم ژنتیک استفاده می‌شود. با این کار، دقت خوشهبندی صفحات وب نیز تا حد زیادی افزایش خواهد یافت.
3-4-4- شمای کلی سیستم پیشنهادی
با توجه به توضیحات بیان شده در بخش‌ ‏3-4-، شمای کلی سیستم پیشنهادی شخصیسازی صفحات وب در شکل 3-5 نشان داده شده است.
شکل 3-5: شمای کلی سیستم پیشنهادی
3-4-5- مثالی از سیستم پیشنهادی
در این پایان نامه همانطور که در بخش قبلی گفته شد از روش خوشهبندی فازی- سیمینز برای خوشهبندی صفحات وب استفاده میشود. همچنین الگوریتم ژنتیک را برای بهینه کردن پارامترهای توابع عضویت به کار برده میشود. برای درک بهتر ،روش پیشنهادی بر روی مثال زیر اجرا می شود.
ابتدا داده های آموزشی وارد مرحله خوشه بندی فازی می شوند. یک مثال از داده آموزشی در زیر آورده شده است:
1000000
15
28
100
34573630
10509813
20
34573630
34175267
31
6
34573630
2338823
1
40
250
34573630
1000000
22
29
100
34573634
353552
40
34573634
* ستون اول از سمت چپ شماره نشستهای مختلف میباشد.
* ستون دوم مدت زمان سپری شده از شروع جلسه است.
* ستون سوم نوع فعالیت کاربر را نشان میدهد. مثلاً اینکه کلیک اتفاق افتاده یا فعالیت کاربر پرس و جو است.
* ستون چهارم یک شناسه منحصر به فرد از موتور جستجویی که صفحه وب مورد نظر را پیدا کرده نشان میدهد.
* ستون پنجم یک شناسه منحصر به فرد از کاربر را نشان میدهد.
در این پایان نامه قصد داریم تا بر اساس شماره نشست صفحات وب را خوشه بندی نماییم.
فاکتور اصلی در انتخاب روش خوشه بندی، مقیاس پذیری روش در برابر دیتاستهای بزرگ است. برای اکثر روش های مدلسازی، زمان مورد نیاز برای کامپایل دادهها در یک مدل میتواند، زیاد باشد. بنابراین باید مستقل از پارامترهای کنترل کاربر باشد. علاوه بر این تکنیک مدلهای مطلوب باید در برابر نویز مقاوم باشد. رفتار کاربر در وب نامعین است، هر کاربر ممکن است صفحاتهای مشابهای را برای اهداف مختلف ملاقات کند و هر زمانی که کاربر به سایت دسترسی دارد، او ممکن است اهداف مختلفی داشته باشد. علاوه بر این کاربر مشابه در یک دوره مشابه ممکن است اهداف مختلف داشته باشد. در نتیجه الگوریتمهای خوشهبندی فازی برای حل این مسائل و کندوکاو مناسب است. بنابراین ما در این تحقیق برروی روش خوشه بندی فازی تمرکز داریم. بنابراین برای خوشهبندی این داده ها با استفاده از الگوریتم فازی- سی مینز میپردازیم.
در مرحله تعیین تابع عضویت فازی، از الگوریتم ژنتیک برای بهینهسازی پارامترها و ورودیها استفاده میکنیم. الگوریتم ژنتیک ،یک نوع الگوریتم جستجو و بهینهسازی با مزیت هوش مصنوعی و خودیادگیری میباشد که فرآیند تکاملی بیولوژیکی را شبیهسازی میکند(Ya-ling Tang & Feng Qin,2010). جمعیت اولیه ژنتیک به طور تصادفی انتخاب میشود .سپس تابع شایستگی با استفاده از جمعیت اولیه و پارامترهای ورودی تابع عضویت محاسبه میشود. به منظور حل هر مسئله با استفاده از الگوریتم‏های ژنتیکی, ابتدا باید یک تابع شایستگی برای آن مسئله ابداع شود. برای هر کروموزوم, این تابع عددی غیر منفی را برمی‏گرداند که نشان دهنده شایستگی یا توانایی فردی آن کروموزوم است.در این پایاننامه،تابع شایستگی، KNN Classify میباشد.
در الگوریتم‏های ژنتیکی, در طی مرحله تولیدمثل8 ازعملگرهای ژنتیکی استفاده می‏شود. با تأثیر این عملگرها بر روی یک جمعیت, نسل9 بعدی آن جمعیت تولید می‏شود. عملگرهای انتخاب10 , آمیزش11 و جهش12 معمولاً بیشترین کاربرد را در الگوریتم‏های ژنتیکی دارند.
پس از مرحله تعیین شایستگی هر کروموزوم، با استفاده از عملگر انتخاب، از بین کروموزوم‏های موجود در یک جمعیت, تعدادی کروموزوم را برای تولید مثل انتخاب میکند. Elitist Selectionروشی است که برای انتخاب در نظر گرفته شده است. در این روش، مناسب‌ترین عضو هر اجتماع انتخاب می‌شود. با توجه به مقدار شایستگی که از تابع شایستگی دریافت کرده است.
عملگر بعدی، کراس اور است که این عملگر به صورت اتفاقی بخشهایی از کروموزوم را با یکدیگر تعویض میکند.این عملگر باعث میشود که فرزند ترکیبی از خصوصیات والدین خود را داشته باشد .در این تحقیق از کراس اور چهار نقطهای استفاده میشود، یعنی در این مرحله کروموزومها به چهار گروه تقسیم میشوند و در هر مرحله این عملیات ادامه می یابد.
در مرحله بعد عملگرجهش انجام میشود و دوباره تابع شایستگی برروی دادههای مرحله قبل اجرا میشود. در عملیات جهش، عملگر جهش به صورت تصادفی کروموزومی را از فرزندان انتخاب میکند و شکل آن را تغییر میدهد. وجود این عملگر به منظور اجتناب از نقاط بهینهی محلی ضروری است. از جمله روشهای جهش میتوان به دو روش تبادلی و تصادفی اشاره کرد. در جهش

مطلب مرتبط با این موضوع :  پایان نامه با کلید واژه هایاطلاعات مربوط

دیدگاهتان را بنویسید