مقاله رایگان درمورد سلسله مراتب

و گذار، مدیریت ترافیک وب، تجارت الکترونیک، مفید است.
داده ها معمولاً در فایل های لاگ وب با استفاده از فرمت‌های مختلف براساس متن، مانند فرمت لاگ رایج NCSA یا فرمت فایل لاگ W3C ذخیره می‌شود. به‌علاوه، هر فرمت می‌تواند برای اهداف خاص وابسته به داده‌ها تغییر کند. به منظور بهبود تحلیل مورد استفاده وب، چندین روش از فرمت طراحی داده‌ها حمایت می‌کنند. دادهای ذخیره شده در فایل‌های لاگ وب مرتبط با استفاده وب سایت است. تحلیل این داده‌ها به منظور بهبود گشت و گذار کاربر است. اما معمولاً دادههای لاگ وب در یک فایل یکنواخت در فرمت‌های مختلف ذخیره می‌شوند که مانع تحلیل‌شان می‌شود، بنابراین الزامی است تا از ابزارهای مخصوص تحلیل لاگ وب استفاده شود. پائول و همکارانش روش‌هایی برای ساخت داده‌های لاگ وب برای تحلیل بهتر ارائه کردند. برای این هدف، آنها یک روش متا مدل برای داده لاگ وب به منظور یکی کردن ویژگی‌ها از هر فرمت ارائه کردند. این متا مدل طرحی از مدل‌های لاگ وب، صرف‌نظر از فرمت فایل‌های لاگ وب را پشتیبانی می‌کند. مجموعه‌ای از راهنما برای تعریف شمای چند بعدی از یک انبار داده از مدل لاگ وب با استفاده از ابزارهای تحلیل پیشرفته مانند OLAP یا ابزارهای داده‌کاوی، به منظور بهبود تحلیل وب با استفاده از لاگ وب پیشنهاد می‌شود (Dumais, et. al., 1998).
3-3-3-3- تکنیک براساس محتوای وب
روش‌های داده‌کاوی ابزاری برای کمک به مدیریت وب در بهبود کار است. اما برخی از ابزارها نتایج مفیدی برای بهبود وب سایت تولید نمی‌کند. بحث دیگری که می‌تواند در تکنیک‌های وب‌کاوی مشاهده شود، این است که ارتباط معنایی بین مستندات وب که برای تحلیل استفاده می شود، در نظر گرفته نمی‌شود. یک روش برای حل این مسئله، استفاده از هستی‌شناسی برای تحلیل معنایی است. اما هزینهی توسعه دامنهی هستی‌شناسی، برای یک وب سایت با اندازه کوچک، به سختی تصدیق میشود.
استاندارد کندوکاو کاربرد وب، اطلاعات معنایی از مستندات وب که ممکن است موجب اشتباهاتی شود را پردازش می‌کند. برخی سیستم‌ها برای مهیا ساختن نتایج خوب در رفتار گشت وگذار وب، توسعه یافته است. روش‌های جدیدی از کندوکاو وجود دارد که شامل ارتباط معنایی از محتویات وب است. وقتی با وب سایت‌های کوچک کار می‌شود، معمولاً کاربران احساسی خوبی دارند از این که چیزهایی که می‌خواهند را بدست می‌آوردند و می‌تواند پیش‌بینی شود. اما اکثر ابزارها بر کشف اتوماتیک از دانش بدون دانش‌های قبلی از وب سایت یا پردازش کندوکاو، تمرکز دارند. این ابزارها تعداد زیادی الگو که می‌بایست با تحلیل در بهبود وب سایت ترجمه و تفسیر شوند، تولید می‌کنند. در برخی موارد، تحلیل و فهمیدن الگوها خیلی پیچیده است.
امروزه روش‌های کندوکاو کاربرد وب اجازه می‌دهد تا پردازش کندوکاو را براساس لیستی از کلمه و جلسه‌های کاربر انجام دهد. استخراج تغییرات مفید از محتویات سایت برای بدست آوردن آن، سخت است. بنابراین به روشی برای بهبود پردازش کندوکاو کاربرد وب نیاز داریم تا اجازه دهد نتایج، نزدیک به اولویت‌های واقعی کاربر باشد. پردازش کندوکاو کاربرد وب معنایی توسعه یافته بود و از روشی براساس محتوای برای اضافه کردن محتوا به پردازش کندوکاو استفاده کردند. راه‌حل پیشنهاد شده ژوان و همکارانش برای یک وب سایت واقعی اجرا می‌شود تا ساختار و محتویات را بهبود دهد. این روش با چهار روش مختلف کندوکاو کاربرد وب مقایسه می‌شود. بعد از آن کیفیت بهبود با 100 موضوع مروری ارزیابی می‌شود و کارایی این روش را به اثبات می‌رساند (Rada, et. al., 1989).
3-3-3-4- تکنیک براساس فراهم کردن داده‌های مؤثر (ODP)
در این روش پروفایل کاربران با استفاده از مجموعه‌ای از سلسله مراتب ODP مشخص می‌شود. پروفایل‌های کاربر به دسته‌هایی از مسیرها که به طور معمول برای شخصی‌ساری وب استفاده می‌شود، متصل می‌شود. شخصی‌سازی مسیرهای وب اساساً با استفاده از سرویس‌هایی مانند یاهو ارائه می‌شوند که انتخاب مورد علاقه کاربر را پشتیبانی می‌کند. یک روش ابتدایی برای اتوماتیک کردن این روش، سیستم مونتاژ است که برای ایجاد پورتال‌های شخصی سازی از لینک‌هایی برای صفحات وب که یک کاربر ملاقات می‌کند، استفاده می‌شود. سپس این لینک‌ها به یک دسته بندی مطابق با مسیر ODP سازماندهی می‌شوند. در (Eirinaki, et. al., 2003; Eirinaki et. al., 2005) از روش دسته‌بندی ODP برای خوشه‌بندی استفاده می‌شود، سپس این خوشه‌ها برای پیشنهاد مسیرهای کوتاه وب مورد بهره‌برداری قرار می‌گیرند.
3-3-3-5- شخصیسازی وب با استفاده از روشهای ترکیبی
سیستمهای شخصیسازی وب براساس وبکاوی سعی میکند تا الگوهای رفتاری کاربر را از لاگهای دسترسی وب و سایت متا دیتا، استخراج کند. صفحات پیشنهاد شده برای کاربر آنلاین، به وسیله تطبیق رفتار مرورگر کاربر با الگوهای رفتاری کاربر قبلی انجام میشود. روشهای پیشنهاد شده در کارهای قبلی، هنوز نمیتواند کاربر را در وب‌سایت‌های بزرگ و دینامیک خشنود نگه دارد. در (Bergmann, & Stahl, 1998) روشی برای شخصیسازی براساس وب ارائه شده است که دادههای وب را با محتوای وب ترکیب میکند. نتایج آزمایشات این تحقیق نشان میدهد که روش آنها میتواند دقت را بهبود داده و پیشنهادهایی را برای کاربران ایجاد کند.
3-3-3-6- شخصیسازی وب براساس الگوریتم استقرایی و تکنولوژی tf-idf
اکسپینگ و همکارانش یک مدل شخصی‌سازی برای پیشنهاد منابع مورد علاقه کاربر براساس لاگ‌های قابل دسترسی وب کاربر ارائه کرده‌اند. این مدل براساس الگوریتم استقرایی و تکنولوژی tf-idf ساخته می‌شود که شامل سه قسمت است: شرح منابع، استخراج اولویت‌های کاربر و پیشنهاد شخصی‌سازی. ابتدا، مدل آنها فضای متنی منابع را تولید می‌کند که با استفاده از تحلیل اطلاعات منابع بدست آورده شده از لاگ‌های دسترسی وب کاربر بدست می‌آید. سپس مجموعهی مورد علاقه یا مورد نظر، برای الگوریتم‌های اولویت استفاده می‌شود. سرانجام پیشنهادها فیلتر می‌شود و منابع برای کاربران براساس مدل پیشنهادی ذخیره می‌شوند (Gabrilovich, & Markovitch, 2007).
3-3-3-7- شخصیسازی وب با استفاده از کندوکاو الگوی ترتیبی و درخت الگو
معمولاً برای دسترسی به رفتار وب مدل کاربر، لازم است تا سرویس‌های آنلاین شخصی‌سازی هوشمند مانند پیشنهادهای وب، تهیه شود. یکی از روش‌های امید‌بخش، کندوکاو کاربرد وب‌کاوی است که لاگ‌های وب را برای مدل‌های کاربر و پیشنهادات، کندوکاو می‌کند. برعکس سیستم‌های پیشنهاد کننده که اکثراً براساس خوشه‌بندی و قانون‌های انجمنی است، مینیو و همکارش یک سیستم شخصی سازی وب را پیشنهاد کرده‌اند که از کندوکاو الگوی دسترسی ترتیبی استفاده می‌کند. در سیستم پیشنهادی آنها یک الگوریتم کندوکاو الگوی ترتیبی موثر، برای شناسایی الگوهای دسترسی ترتیبی وب استفاده می‌شود. الگوهای دسترسی در یک ساختار درختی فشرده ذخیره می‌شود که درخت الگو نام دارد و سپس برای تطبیق و ایجاد لینک های وب برای پیشنهاد، استفاده می‌شود (Minio, & Tasso, 1996).
3-4- خوشه‌بندی برای شخصی‌سازی وب
شخصی‌سازی صفحه وب شامل خوشه‌بندی صفحات مختلف وبی است که الگوی مشابهی دارند. شخصی‌سازی وب از تکنیک کاربرد وبکاوی برای سفارشی کردن صفحات وب برای یک کاربر خاص استفاده میکند. این مسئله شامل استخراج جلسات کاربر از فایلهای ورود به سیستم میشود. یک جلسه کاربر، دنباله صفحات وبی که توسط کاربر در یک دوره زمانی خاص مورد دسترسی قرار گرفته، میباشد. در حال حاضر، برای شخصی سازی وب چندین متد خوشهبندی در دسترس هستند.
الگوریتمهای خوشهبندی متعددی براساس تکنیکهای مختلف وجود دارد. بیشتر این الگوریتم‌ها، اشکالات متعددی دارند. در ادامه به معرفی این الگوریتم‌ها پرداخته خواهد شد.
3-4-1- خوشهبندی فازی
خوشهبندی فازی را می‌توان بخشی از تحلیل داده فازی دانست که دارای دو بخش است: یکی تحلیل دادههای فازی و دیگری تحلیل دادههای قطعی با استفاده از تکنیکهای فازی. ایده بنیادین در خوشهبندی فازی به این ترتیب است که فرض شود هر خوشه مجموعهای از عناصر است. سپس با تغییر در تعریف عضویت عناصر در این مجموعه از حالتی که یک عنصر فقط بتواند عضو یک خوشه باشد، به حالتی که هر عنصر میتواند با درجه عضویتهای مختلف داخل چندین خوشه قرار بگیرد، دستهبندیهایی را انجام میدهد (Suryavanshi, et. al., 2006).
3-4-1-1- الگوریتم پایه‌ای خوشه‌بندی فازی
الگوریتم‌های پایه‌ای در زمینه خوشه‌بندی فازی محدود به Fuzzy C-Means و Possibilistic C-Means است که از Hard C-Means که در ادبیات موضوع با عنوان الگوریتم K-Menas معرفی شده است، استخراج شده‌اند. هر دو این الگوریتم‌های ارائه شده در این بخش مبتنی بر تابع هدف هستند که خوب بودن خوشه‌بندی را می‌سنجند (Castellano, & et. al., 2007).
3-4-1-2- الگوریتم فازی کا-مینز4
این الگوریتم ابرهای کروی از نقاط را در یک فضای p بعدی شناسایی میکند. این خوشهها به طور مفروض تقریباً هم اندازه هستند. هر خوشه با مرکزش نمایش داده میشود. این نحوه نمایش خوشهها، مدل یا نمونه نیز نامیده میشود. زیرا اغلب به عنوان نماینده همه دادههای تخصیص داده شده به خوشه، انگاشته میشود. برای فاصله، فاصله اقلیدسی بین یک نقطه و یک نمونه مورد استفاده قرار میگیرد. در انتخاب مرکز خوشه، مقدار میانگین مورد استفاده قرار میگیرد. برای محاسبه مرکز خوشه مجموع درجات عضویت هر عنصر به توان M در خودش به حاصلضرب توان M درجه عضویت‌ها تقسیم میشود. M یک عدد حقیقی بزرگتر است که در اکثر موارد مقدار دو برای این پارامتر در نظر میگیرند. در این پایان‌نامه برای M مقدار دو در نظر گرفته شده است. از مزایای آن، کاهش زمان محاسباتی است و با تکرار کم میتوان به حلی تقریباً نهایی رسید (Singh, et. al., 2011).
3-4-1-3- خوشهبندی صفحات وب با استفاده از خوشهبندی فازی k-means
برای درک بهترخوشهبندی فازی و الگوریتمهای مختلف آن لازم است تا ابتدا با مفهوم مجموعههای فازی و تفاوت آنها با مجموعههای کلاسیک بیان شود. در مجموعههای کلاسیک یک عضو از مجموعه مرجع یا عضوی از مجموعه A است یا عضو مجموعه A نیست. مثلاً مجموعه مرجع اعداد حقیقی را در نظر بگیرید. عدد 2.5 عضو مجموعه اعداد صحیح نمیباشد حال آن که عدد 2 عضو این مجموعه است. به زبان دیگر تعلق5 عدد 2.5 به مجموعه اعداد صحیح صفر است و تعلق عدد 2 به این مجموعه یک است. در واقع میتوان برای هر مجموعه یکh تابع تعلق تعریف کرد که مقدار این تابع تعلق برای اعضای مجموعه یک میباشد و برای بقیه صفر. در مجموعههای کلاسیک مقدار این تابع تعلق یا صفر است یا یک. حال مجموعه انسانهای جوان و پیر را در نظر بگیرید. سؤالی که در اینجا مطرح میشود این است که آیا فردی با سن 25 جزء این مجموعه است یا خیر؟ سن 30 چطور 35 همانطور که حدس زدید نمیتوان به طور قطع و یقین مرزی برای انسانهای جوان و پیر در نظر گرفت. دلیل آن هم این است که اگر فرضاً 35 جوان محسوب شود 36 نیز میتواند جوان باشد و همینطور 37 و 38 و غیره . در واقع در اینجا با مفهوم عدم قطعیت6 مواجه هستیم. ما خودمان نیز از عدم قطعیت در زندگی روزمره بارها استفاده کردهایم مثلاً هوای سرد، آب داغ و غیره. در واقع تمامی مثالهای بالا مثالهایی از مجموعههای فازی میباشند. تفاوت اصلی مجموعههای فازی و مجموعههای کلاسیک در این است که تابع تعلق مجموعههای فازی دو مقداری نیست (0 یا 1) بلکه میتواند هر مقداری بین 0 تا 1 را اختیار کند. حال مجموعه انسانهای جوان و پیر را در نظر بگیرید اگر 25 سال را سن جوانی در نظر بگیریم میتوانیم به 25 تعلق 1 بدهیم و

مطلب مرتبط با این موضوع :  پایان نامه ارشد دربارهزنان باردار، افراد مبتلا، هورمون رشد

دیدگاهتان را بنویسید