ترجمه مقاله در زمینه صفحات وب
ترجمه مقاله در زمینه صفحات وب
دسته بندی | مقالات ترجمه شده |
فرمت فایل | docx |
حجم فایل | 1.271 مگا بایت |
تعداد صفحات | 18 |
14 2. پیش پردازنده برای مدلهای پیشنهاد دهنده برای صفحات وب
ارائه دهنده (ISP) و یا پروکسی سرور شرکت به اتصال TCPIIP کاربر به سایت، از شناسایی منحصر به فرد جلوگیری میکند. گسترده ترین راه حل برای این مشکل استفاده از کوکی ها است. کوکی یک قطعه کوچک از کد است که با یک وب سایت در ارتباط است. آن خودش رادر میزبان کاربرنصب میکند و ، یک شناسه کوکی با مرورگر کاربر مرتبط است.محتویات یک فایل کوکی به وب سایت در حال بازدید و مرورگر بستگی دارد. به طور کلی، یک کوکی حداقل شش مورد زیر را دارد : (1) نام مقدار (2) دامنه، و (3) مسیر و (4) اکسپایرها و (5) امنیت. جفت نام مقدار یک فیلد اجباری است ، که نام کوکی، با آنکه بعدا اشاره میشود ،تعیین میشود . این شامل اطلاعات واقعی که کوکی تصمیم به ذخیره دارد.فیلدهای باقیمانده اختیاری هستند.فیلد دامنه بخشی از دامنه URL کوکی های تخصیص داده شده ،راتعیین میکند.فیلد مسیر دایرکتوری که در آن کوکی فعال میباشد را تعیین میکند .فیلد اکسپایرها برای تنظیم تاریخ اکسپایر کوکی استفاده میشود ، و پس از آن کوکی دیگر توسط مشتری ذخیره و یا به سرورارسال نمیشود. اگر فیلد امنیت مشخص است، یک کوکی به سرورهای HTTP با استفاده از SSL (لایه امن سوکت) پروتکل شناخته شده به عنوان سرور HTTPفرستاده میشود. اگر این ویژگی مشخص نشده است، کوکی به روی هر کانال فرستاده میشود ، که شامل یک ناامن نیز می باشد. وب سایت این داده ها را بر روی دستگاه کاربر،ذخیره میکند و بعد از آن، بازگشت آن را ،دریافت میکند . وب سایت فقط می تواند فایل کوکی خود را بر روی دستگاه کاربر استفاده کند. اگر یک کاربر به وب سایت دسترسی یابد، مرورگر کاربر بر دستگاه کاربر برای یک فایل کوکی که وب سایت قبلا فرستاده است ،نگاه میکند. اگر آن یک فایل کوکی را برای وب سایت،تعریف کند ، آن همه جفت نام-مقدار در فایل کوکی را به سرور وب سایت همراه با URL ارسال میکند. اگر آن یک فایل کوکی پیدا نکند ، آن داده های کوکی را ارسال نمیکند. اگر یک کاربربه یک وب سایت برای اولین باردسترسی یابد، بازگشت فایل کوکی برای آن دامنه وجود نخواهد داشت به این دلیل که کوکی تا به حال ایجاد نشده است.وب سرور یک ID جدید برای کاربر در پایگاه داده وب سایت ایجاد میکند و سپس جفت نام-مقدار را به دستگاه کاربر در هدر برای صفحه وب آن میفرستد. هدر صفحه وب محتوایی است که بین <head> تگ HTML وجود داشته باشد. این محتوا از نقطه نظر کاربرقابل مشاهده نیست. (به جز برای عنوان، که در عنوان صفحه) آشکار است. راه دیگر شناسایی کاربران منحصر به فرد با استفاده از یک روش هیوریستیک میباشد، که یک آدرس IP منحصر به فرد یک کاربررا مشخص میکند، با در نظر گرفتن این که یک IP مجزا می تواند توسط یک گروه از کاربران استفاده شود. در مواردی که آدرس IP به نام حوزه یک شخص و یا شرکت ثبت میشوند ، این امکان وجود دارد که اطلاعات مشخص تر جم آوری کنیم . هر دو روش معایب خاص خود را دارد . روش شناسایی کاربر بر اساس کوکی ها، ممکن است هنگامی که پشتیبان کوکی در مرورگرخاموش است ،با مشکل مواجه شود . مشکل دیگر این روش ممکن است رخ دهد هنگامی که کاربر فایل های کوکی واقع در دستگاه های محلی را حذف میکند . هنگامی که این فرد وب سایت را دوباره بازدید میکند ، کاربر به عنوان یک کاربر جدید در نظر گرفته میشود . امکان دیگر این است که همان کامپیوتر ممکن است توسط کاربران مختلف استفاده شود.مشکل دیگر که ممکن است هنگام شناسایی کاربران توسط آدرس IP رخ دهد این است که همان آدرس IP ممکن است توسط یک گروه از کاربران استفاده شود. انتخاب روش خاص به ویژگی های داده در دست بستگی دارد. درخواستهای صفحه توسط عوامل خودکارساخته شده است و لینک پیمایش برنامه های اسپایدر اغلب می تواند سبب تجزیه و تحلیل اریب شود. ساده ترین روش برای برخورد با عامل ترافیک عامل برای بررسی فیلدهای عامل داده های استفاده شده می باشد .تطبیق رشته ساده در طول مرحله تمیز کردن داده ها می تواند مقدار قابل توجهی ازعامل ترافیک را حذف کند. روباتهایی که دنبال کنوانسیون مشخص شده در پروتکل حذف ربات ،را دنبال میکند ،که برای ارائه تنظمات مشاوره برای روباتها پیشنهاد شده اند ، [کوستا، 1996]، و برای وجود یک فایل به نام “robot.txt ” بررسی میشود.یک عامل می تواند از طریق فیلد عامل و یا توسط درخواست فایل “robot.txt ” شناسایی شود.مطالب ورودی که توسط یک عامل ساخته شده از داده های ورودی حذف خواهند شد.مراحل فوق در نهایت مجموعه ای از کاربران U = {1، …، uk} با شناسه کاربر منحصر به فرد (1 … K) تولید میکنند ،که از وب سایت بین دوره زمانی از فایل های ورودی سرور بازدید میکنند. هنگامی که کاربران شناسایی شده اند، داده های ورودی سرور از طریق یک گام بازسازی دوره عبور می کند. روند بازسازی جلسات اصلی کاربران با استفاده از داده های ورودی سرور به عنوان بازسازی جلسه تعریف شده است. با این حال، قبل ازساخت جلسات کاربر ، URL ها در فایل ورودی باید به منظور تعیین صفحات همان وب ، که توسط URL های مختلف نشان داده شده نرمالیزه شوند .
قوانین ارسال دیدگاه در سایت