مقاله رایگان درمورد وبکاوی، سیستم، شخصیسازی

پابرجایی مشتری به سرویس ارائه شده فراهم میکند.
در سال های اخیر تکنیک‌های وبکاوی کاربرد وب به عنوان رویکردی دیگر که مبتنی بر کاربر است در شخصیسازی وب ارائه شده است که برخی از مشکلات مربوط به فیلترکردن جمعی را کاهش میدهند. به طور خاص وب کاوی کاربرد وب برای افزایش گسترش پذیری سیستمهای شخصیسازی شدهی سنتی که برمبنای تکنیکهای فیلترکردن جمعی میباشند استفاده شده است.
به طور نمونه شخصی سازی برروی پردازش شناسایی کاربر وب، جمع آوری اطلاعات از طریق اولویت یا علاقهمندی های کاربر، تمرکز دارد. به طور مختصر شخصیسازی وب میتواند برای مهیا ساختن سرویس با کیفیتتر استفاده شود و برنامه کاربردی از وب را برای کاربران در طول گشت و گذار آنها در وب مهیا سازد. این فعالیتها میتواند با مشخص کردن لینکها و لینکهای جدید مورد علاقه کاربر به صورت اتوماتیک و ایجاد صفحات ایندکس جدید، ساخته شود.
رویکرد تنها مبتنی بر کاربرد در شخصیسازی وب یک عیب مهم دارد و آن این است که فرآیند توصیه به کاربر تنها براساس دادههای تراکنشی موجود او صورت میگیرد و از این رو اقلام یا صفحاتی که اخیراً به سایت اضافه شدهاند نمیتوانند به او توصیه شوند. این مشکل عموماً مشکل قلم جدید نامیده میشود. از سوی دیگر اگرچه الگوهای کشف شدهی مربوط به کاربرد منابع وب از طریق وبکاوی کاربرد وب در کشف ارتباطات اقلام با یکدیگر یا کاربران با یکدیگر و نیز تعیین شباهت در جلسات کاربر مفیدند اما بدون استفاده از دانش عمیقتری از دامنهی وب سایت مورد نظر چنین الگوهایی درک اندکی از دلایل آن که چرا اقلام یا کاربران در گروههایی با هم قرار میگیرند در اختیار ما قرار میدهند. یک رویکرد معمول برای حل این مشکل در فیلتر کردن جمعی آن است که مشخصات محتوای صفحات را با رتبهبندیها و قضاوتهای کاربر ادغام کنیم. به طور کلی در این رویکردها کلمات کلیدی از محتوای وبسایت استخراج میشوند و برای اندیسگذاری صفحات براساس محتوا یا طبقهبندی آنها به دستههای مختلف مورد استفاده قرار می‌گیرند. در حوزهی شخصیسازی وب این رویکرد به سیستم اجازه میدهد تا صفحات را نه تنها براساس افراد مشابه بلکه براساس شباهت محتوایی آنها به صفحاتی که کاربر اخیراً بازدید کرده است به او توصیه کند.
یک ضعف عمده در بیشتر رویکردهای موجود که از محتوای وب برای بهبود مدل کاربر استفاده می‌کنند این است که این روشها معمولاً از بردار عبارات برای نمایش علایق کاربر استفاده میکنند و ارتباطات معنایی بین این عبارات را نادیده میگیرند. در صورتی که میتوان با استفاده از معنا این روش نمایش را بهبود داد.
روشهایی که تاکنون ارائه شدهاند، در مواردی دارای اشکالاتی بودند. البته تکنیک‌های جدیدی در رفع این مشکلات و بهبود آنها ارائه شده است. اما در بیشتر این تکنیک‌ها، مسائل افزونگی داده و مقیاس‌بندی بالا وجود دارد. الگوریتمهای خوشهبندی متعددی براساس تکنیکهای مختلف وجود دارد. بیشتر این الگوریتمها، اشکالات متعددی دارند. همانطور که اندازه خوشه در طی افزایش کاربران وب افزایش می‌یابد، نیاز به بهینه‌سازی خوشهها اجتناب ناپذیر خواهد بود. در این پایان‌نامه قصد بر آنست تا یک متدولوژی بهینه‌سازی خوشه بر اساس سیستم فازی و الگوریتم ژنتیک ارائه شود.
1-4- شیوه پژوهش
در این پایان‌نامه پس از گردآوری مراجع منتشر شده در پایگاههای اطلاعاتی معتبر در زمینه وب‌کاوی و بهینه‌سازی خوشه و کلیه زمینههای مرتبط با آن، این منابع مطالعه و مورد تحلیل و بررسی قرار گرفته است. با شناسایی دقیق چالشها و مشکلات موجود، بررسی شد که هر یک از فنآوریهای شناخته شدهی حوزه علوم کامپیوتر چه نقشی در مرتفع کردن این موانع و چالش‌ها داشتهاند که حاصل آن، در قالب چارچوبهایی تحلیلی ارائه شده است. این چارچوبهای تحلیلی بستر را برای ارائه رویکردی سودمند در جهت رفع چالشهای موجود فراهم میکنند.
در ادامه‏ی پژوهش، با ارائه رویکرد پیشنهادی مبتنی بر بهینه سازی خوشه با استفاده از منطق فازی و الگوریتمهای تکاملی برای شخصیسازی وب، سعی در برطرف کردن چالشهای موجود در این حوزه شده است.
1-5- چارچوب پایان‏نامه
در فصل اول، مقدمهای بر وبکاوی و کاربردهای آن و حوزه شخصیسازی وب ارائه می‌شود. در ادامه اهداف انجام تحقیق و روش انجام آن بیان می‌شود.
در فصل دوم به مروری بر تحقیقات انجام شده در حوزه بهینه‌سازی خوشه و شخصی‌سازی وب پرداخته شده است.
در فصل سوم، فرضیه های مربوط به شیوه های تحقیق ارائه میشود. ابتدا به توضیح سیستم استنتاج فازی پرداخته میشود. همچنین نحوه استفاده از این سیستم در الگوریتم پیشنهادی شرح داده می‌شود و پس از شرح سیستم استنتاج فازی، به الگوریتم ژنتیک پرداخته خواهد شد.
فصل چهارم این پایان‌نامه مربوط به رویکرد پیشنهادی بهینه‌سازی خوشه با استفاده از منطق فازی و الگوریتم‌های تکاملی برای شخصی سازی وب است. در این فصل، ابتدا شمای کلی سیستم را بیان می‏شود و سپس به جزئیات رویکرد پیشنهادی پرداخته شده و یک متدولوژی بهینه سازی خوشه براساس سیستم فازی ارائه می‌شود. از آنجا که در سیستم استنتاج فازی تعیین پارامترهای توابع عضویت، تاثیر مهمی در دقت نهایی خوشه‌بندی دارد. بنابراین در این سیستم برای تنظیم پارامترهای توابع عضویت از الگوریتم ژنتیک استفاده می‌شود. همچنین برای این که در خوشهبندی تا حد امکان افزونگی نداشته باشد، قصد بر آنست تا در بخش قوانین فازی نیز از الگوریتم ژنتیک استفاده شود تا افزونگی صفحات وب خوشه‌بندی شده تا حد امکان کاهش یابد. با این کار، دقت خوشه بندی صفحات وب نیز تا حد زیادی افزایش خواهد یافت.
در فصل پنجم، به جمع‌بندی تحقیق و نتایج حاصل از انجام آن پرداخته شده و در نهایت پیشنهاداتی برای کارهای آتی ارائه خواهد شد.
مراجع
[1]. Anand, S. S., & Mobasher, B. (2003, August). Intelligent techniques for web personalization. In Proceedings of the 2003 international conference on Intelligent Techniques for Web Personalization (pp. 1-36). Springer-Verlag.
[2]. Baeza-Yates, R. (2004, January). Web mining in search engines. In Proceedings of the 27th Australasian conference on Computer science-Volume 26 (pp. 3-4). Australian Computer Society, Inc..
[3]. Bharat, K., Chang, B. W., Henzinger, M., & Ruhl, M. (2001). Who links to whom: Mining linkage between web sites. In Data Mining, 2001. ICDM 2001, Proceedings IEEE International Conference on (pp. 51-58). IEEE.
[4]. Chakrabarti, S. (2000). Data mining for hypertext: A tutorial survey. ACM SIGKDD Explorations Newsletter, 1(2), 1-11.
[5]. Chakrabarti, S., Dom, B. E., Kumar, S. R., Raghavan, P., Rajagopalan, S., Tomkins, A., & Kleinberg, J. (1999). Mining the Web’s link structure. Computer, 32(8), 60-67.
[6]. Devi, B. N., Devi, Y. R., Rani, B. P., & Rao, R. R. (2012). Design and Implementation of Web Usage Mining Intelligent System in the Field of e-commerce. Procedia Engineering, 30, 20-27.
[7]. Eirinaki, M., & Vazirgiannis, M. (2003). Web mining for web personalization. ACM Transactions on Internet Technology (TOIT), 3(1), 1-27.
[8]. Varghese, N. M., & John, J. (2012, October). Cluster optimization for enhanced web usage mining using fuzzy logic. In Information and Communication Technologies (WICT), 2012 World Congress on (pp. 948-952). IEEE.
فصل دوم:
پیشینه تحقیق
فصل 2-
2-1- مقدمه
در این فصل، به بررسی اجمالی منابع منتشر شده در پایگاههای اطلاعاتی دنیا پرداخته شده است. تأکید بیشتر این تحقیق بر روی شخصیسازی وب می‌باشد.
2-2- مروی بر کارهای انجام شده
در پانزده سال گذشته، رشد تعداد وب سایتها و مراجعهکنندگان به این سایتها به صورت نمایی افزایش یافته است. تعداد کل کاربران تا 30 ژوئن سال 2010، 816/514/966/1 نفر بوده است که حدود 7/28% تعداد کل جمعیت جهان است1. تعداد کل وبسایتهای فعال تا 13 دسامبر سال 2010، 259/522/125 بوده است2. به دلیل این رشد فزاینده، تعداد عظیمی از دادههای وب تولید شده است. به منظور استخراج دادههای مورد نظر از این دریای وسیع، میتوان از تکنیک دادهکاوی بهره گرفت. اما از آنجایی که دادههای وب بدون ساختار یا نیمه ساختاری هستند، نمیتوان به طور مستقیم تکنیک دادهکاوی را به کار گرفت. بنابراین از یک روش دیگر بنام وبکاوی باید بهره جست. وبکاوی به منظور اکتشاف الگوهای جالب که میتواند برای بسیاری از مسائل دنیای واقعی همچون وبسایتهای ارتقاء یافته، رفتارشناسی بهتر کاربران، توصیه محصول و غیره به کار گرفته شود، مورد استفاده قرار میگیرد (Pani, & et. al., 2011).
تحقیق در مورد وبکاوی قسمتی از چندین تحقیق را شامل میشود، مانند پایگاه داده، اطلاعات، زبان ماشین و فرآیند زبان طبیعی. اگرچه وبکاوی ارتباط قوی با دادهکاوی دارد ولی با دادهکاوی یکسان نیست. فرآیندهای کاوش داده در وب، در طبقات و فرمتهای گوناگون رخ میدهد. وبکاوی استفاده از تکنیکهای دادهکاوی برای کشف اتوماتیک و استخراج اطلاعات از سرویسها و اسناد وب می‌باشد. مطابق با دادهی وب استفاده شده به عنوان ورودی در فرآینده دادهکاوی، سه شاخه اصلی در وبکاوی شامل ساختار کاوی وب، محتوا کاوی وب و وب‌کاوی کاربرد وب میباشد (Kosala, & Blockeel, 2000; Markov, & Larosee, 2007).
پیشبینی رفتار کاربر یکی از بحث‌های مهم در کندوکاو کاربرد وب است. به منظور دستیابی به این هدف لازم است تا رفتار مروری کاربر را از طریق تحلیل داده‌های وب یا لاگ‌های وب، تحلیل شود. پیش‌بینی نیازهای بعدی کاربر، به رفتار مشابه قبلی کاربر بستگی دارد. پیش‌بینی رفتار کاربر مزیت‌های زیادی دارد، برای مثال، شخصی‌سازی، ساخت یک وب سایت مناسب، بهبود استراتژی بازاریابی و غیره. لی و همکارش (Leacock, & Chodorow, 1998) دو سطح از مدل پیش‌بینی را ارائه کردند. روش آنها دو سطح از چارچوب کلی برای پیش‌بینی را کاهش می‌دهد. دو سطح از مدل پیش‌بینی با ترکیب مدل مارکوف و قضیه بیزی، طراحی می‌شود. در دو سطح از چارچوب مدل پیش‌بینی، ماتریس انتقال، با استفاده از تحلیل رفتار گشت و گذار کاربر و قضیه بیزی ایجاد می‌شود. نتایج آزمایشات از این مدل، برای پیش‌بینی دسته‌بندی صفحات قابل توجه است. کندوکاو وب برای صفحات وب اجرا می‌شود و سرویس‌های اینترنت به منظور پیدا کردن و استخراج کردن دانش‌های قابل دسترس اجرا می‌شود.
آقای Nina و همکارانش (Nina, & et. al., 2009) یک ایده کامل برای کشف الگوی وبکاوی کاربرد وب معرفی کرده‌اند. سازندگان سایتهای وب باید دانش واضح و روشنی از مشخصات کاربر و نیاز سایت داشته و همچنین اطلاعات مؤکدی از رویکرد کاربران برای جستجو در وب سایت داشته باشند. سازندگان وب میتوانند رفتار بازدید کنندگان را با استفاده از تحلیل وب و تشخیص الگوهای رفتاری کاربران، تجزیه و تحلیل کنند. تحلیل وب شامل تحول و تفسیر سوابق ورود به وب برای شناسایی اطلاعات پنهان یا الگوی تخمین با استفاده از دادهکاوی و فرآیند کشف دانش است. همچنین به منظور پیشبینی مؤثر آنلاین، شینده و همکارش (Shinde, & Kulkarni, 2008) یک معماری برای توصیه آنلاین برای پیشبینی در سیستم وبکاوی کاربرد فراهم ساخته است. این روش به منظور افزایش صحت دستهبندی از طریق تعامل بی

مطلب مرتبط با این موضوع :  منبع مقاله با موضوعزمان واکنش

دیدگاهتان را بنویسید