Menu

اخبار کتابخانه

شنبه 05 مهر 1399
تعداد بازدید: 1024
تعداد نظرات: 0

دورهمی علمی کتابدارن استان قم با موضوع پژوهش در محیط وب (نشست بیستم) به صورت آنلاین برگزارشد

بیستمین جلسه کارگاه پژوهش در محیط وب

دکتر سید مهدی طاهری نخست به معرفی سربرگ آمار و لاگ‌ها (statistics and logs) و کارکرد لاگ‌های موتور کاوش شخصی گوگل پرداخت و گفت:لاگ‌ها،پارامترهایی هستند که تراکنش‌های سیستم، فعالیت‌ها و اطلاعات کاربران را در پایگاه داده ثبت می‌کنند. پیش از این، لاگ‌های گوگل مبتنی بر کنش‌هایی بودند که با استفاده از ورودی‌هایی همانند صفحه کلید و از طریق عملیاتی مانند تایپ، کلیک یا تب ثبت می‌شدند. اکنون حتی حرکات و چرخش چشم نیز ردیابی و تمرکز آن برروی یکمطلب خاص ثبت می‌شوند.

در حال حاضر،موتورهای کاوش پس از ثبت لاگ‌ها به تحلیل رفتار اطلاع‌یابی کاربر می‌پردازند ومتناسب با نیازهای کاربر خدمات شخصی‌سازی‌شده ارائه می‌دهند.زمانی که با حساب کاربری خود در موتورهای کاوش جستجو می‌کنید، موتورهای کاوش براساس اطلاعات حساب کاربری می‌توانند تمامی عملیات و رفتارهای شما را ثبت و تحلیل نمایند.در جستجوهای بعدی، وب‌سایت‌های بازدید شده از سوی کاربر در رتبه بالاتری قرار می‌گیرند و با رنگ متفاوتی (هایلایت) نمایش داده می‌شوند. دلیل آن این است که موتور کاوش براساس لاگ‌های پیشین، این وب‌سایت‌ها را شناسایی کرده است. این قابلیت، نمونه‌ای از یادگیری ماشین (Machine learning) است که براساس تحلیل لاگ‌ها صورت می‌گیرد.

عضو هیأت علمی دانشگاه علامه طباطبایی در ادامه گفت: آخرین ویژگی یا پنل مربوط به ایجاد و مدیریت موتورهای کاوش شخصی در گوگل، سربرگ آمار و لاگ‌ها (statistics and log) است که پس از استفاده از موتور کاوش شخصی، لاگ‌های ثبت شده را نمایش می‌دهد.

وی افزود:برای تحلیل لاگ‌های یک وب‌سایت یا موتورکاوش شخصی به google analytics مراجعه کنید. اگر وب‌سایت داشته باشید، گوگل آنالیتیکس در بخش مدیریت وب‌سایت (Webmaster tools)، آمارها را به صورت نموداری و یا توصیفی نشان می‌دهد. یعنی لاگ‌های کاربران را ثبت و تحلیل می‌کند و نشان می‌دهد چه افرادی، در چه زمانی، از کدام منطقه وب‌سایت را بازدید کرده، و چه واژه‌هایی را جستجو کرده، یا چه بخش‌هایی را مشاهده نموده‌اند.این امکان موتور کاوش به شما کمک می‌کندلاگ‌های موتور کاوش خود را تحلیل کنید.

دکتر سید مهدی طاهری در ادامه افزود: ثبت لاگها براساس کلیک، تایپ، مکث یا حتی حرکت چشمها انجام میشود. یکی از دلایلی که توصیه می‌شود هنگام جستجو در گوگل و یا شبکه‌های اجتماعی، دوربین لپ تاپ یا تلفن همراه را بپوشانید این است که از ردیابی حرکات چشم جلوگیری شود. البته به تازگی سنسورهای دیگری نیز طراحی شده‌اند که از روی دمای بدن و یا تغییر حالات چهره نیز به ثبت لاگ و تحلیل کنش‌های کاربران می‌پردازند.

رئیسکتابخانه مرکزی دانشگاه علامه طباطبایی در ادامه به تشریح نکات مهم موتورهای کاوش پرداخت و گفت: یکی از نکات مهم در مورد موتورهای کاوش، بستر نحوی (Syntax)نشانی اینترنتی (URL) جستجوها و نتایج بازیابی است. بستر نحوی یعنی نشانه‌های و واژه‌هایی که در کنار هم قرار می‌گیرند تا معنای خاصیرا بازنمون نمایند. به‌عنوان‌مثال هر متن یا مقاله‌ دارای syntax خاصی است. به‌طورکلی، جملات، ترتیب قرار گرفتن واژه‌ها کنار یکدیگر، نقطه‌گذاری‌ها (Punctuation) و غیره را بستر نحوی می‌نامند که اغلب براساس گرامر، دستورزبان یا الگوهای نگارشی خاص تنظیم می‌شوند. در موتورهای کاوش نیز بحث بسترهای نحوی مطرح است. بستر نحوی موتورهای کاوشبه‌طورکامل، بر اساس قوانین و الگوریتم‌های از پیش تعریف شده، طراحی شده‌ است.بستر نحوی موتورهای کاوش در اصطلاح بستر نحوی یوآر‌ال (URL syntax) نام دارد و یکی از ویژگی‌هایی است که کاربر می‌تواند برای انجام جستجو از آن بهره گیرد و اصطلاحاً به search in the fly شهرت دارد. براساس این قابلیت، می‌توانیم عبارت جستجو را در قسمت نوار آدرس وارد و به صورت حرفه‌ای جستجو کنیم.این قابلیت افزون بر این که به جستجوهای پیشرفته و افزایش توانایی‌های کاربران کمک می‌کند، سرگرم کننده و جذاب نیز هست.

دکتر طاهری در ادامه به معرفی این قابلیت موتوری کاوش گوگل پرداخت و گفت: صفحه اصلی گوگلرا در اصطلاح صفحه خانگی (home page) گوگل می‌نامند. یعنی هر زمان که صفحه گوگل را باز کنیم،صفحه خانگی به نمایش در می‌آید. زمانی که جستجو می‌کنیم، یک صفحه جدید تولید میشود که به آن صفحه نتایج (result page)می‌گویند. باید توجه داشتصفحه اصلی گوگل صفحه‌ایثابت (static page) است اما صفحه نتایج صفحه‌ای پویا (dynamic page) است. منظور از صفحه پویا این است که نشانی صفحه، ثابت نیست و دلیل آن این است که این صفحه از قبل وجود نداشته، و گوگل براساس جستجوی کاربر این صفحه را ایجاد می‌کند. به این معنا که گوگل واژه‌هایی را که جستجو کردیم با پایگاه داده‌ خود تطبیق داده، و نتایج را طبق الگوریتم‌های از پیش تعریف شده در یک صفحه وب به نام result pageنمایش می‌دهد. در صفحه نتایج، خروجی فرایند بازیابی گوگل ارایه شده، و این صفحه براساس درخواست کاربران تولید (generate) می‌شود.

دکتر طاهری اذعان داشت: صفحات پویا بهتر از صفحات ثابت هستند، اما برخی از صفحات مثل صفحات خانگی (homepages)ماهیت ثابتی دارند و نباید تغییر کنند. داده‌ها در وب‌سایت‌ها به دو شکل ذخیره می‌شوند: روش نخست ذخیره‌سازی این است که داده‌های ثابت در صفحه اچ‌تی‌ام‌ال (HTML) وارد شده‌، و نشانی خاصی به آن‌ها اختصاص یافته، و این نشانی‌ها در اختیار کاربران قرار می‌گیرند. روش دوم ذخیره‌سازی بدین صورت است که نخستپایگاه‌های داده‌ای سیستم‌ها با استفاده از نرم‌افزارهایی به نام سیستم مدیریت پایگاه داده (DBMS) توسعه می‌یابند. براساس این نرم‌افزارها پایگاه داده ایجاد شده و داده‌ها در آن پایگاه داده ذخیره شده‌اند.

صفحات ثابت (static page)در پایگاه داده ذخیره نمی‌شوند. یعنی این صفحاتاز پیشایجاد شده‌اند و نشانی آن‌ها ثابت است. در مقابل آن‌ها،محتوای صفحاتپویا (dynamic page)درپایگاه دادهذخیره شده است. صفحاتی کهمحتوای آنها در پایگاه داده و با رویکرد پویاذخیره می‌شوند، پیشتر ایجاد نشده‌اند، بلکه براساس درخواست کاربر تولید(generate) می‌شوند.

 به عنوان مثال وقتی ترکیب واژه‌های data AND information را جستجو می‌کنیم، گوگل درخواست جستجو شده را با پایگاه داده خود تطبیق داده، و صفحاتی را که در آن‌ها هم واژه data و هم واژه information به کار رفته‌اند، مشخص می‌کند و در قالب صفحه نتایج جدید به همراه اطلاعات کتابشناختی (توصیف) صفحات مرتبط، نشان می‌دهد. نشانی صفحات نتایج در نوار آدرس (Address bar)درج گردیده، و اغلب شامل پارامترهایی مانند: %$#!؟ و غیره است.پارامترهایی که در نشانی وب‌سایت به کار می‌روند، معنادار و غیرتصادفی هستند، و تغییر در هرکدام از آن‌ها نتایج را تغییر می‌دهد.تغییراتی که در بستر نحوی اعمال می‌شود،یکی از مصادیق هک کردن گوگل (google hacking)است. حتی می‌توانیم با این تغییرات تعداد نتایج را در بستر نحوییوآر‌ال (URL syntax) نیز دستکاری کنیم. با یادگیری این ترفندها می‌توانیم بدون وارد کردن عبارت جستجو در جعبه جستجوی گوگل، به انجام کاوش و تنظیم نتایج دست بزنیم، و با تغییر در نشانی صفحات پویا با تغییر در نحوه جستجوی نتایج (result search)،به نتایج متفاوتی دست یابیم.

دکتر سید مهدی طاهری مدرس کارگاه در پایان این جلسه گفت: به تمامی این عملیات search in the fly گفته می‌شود که درجلسه آینده با جزئیات بیشتری در مورد آن صحبت خواهد شد.

گزارش از: بنت الهدا موحدی محب

برای مشاهده فیلم این جلسه به لینک زیر مراجعه کنید

 https://www.aparat.com/v/DKrky

 

تصاویر
  • دورهمی علمی کتابدارن استان قم با موضوع پژوهش در محیط وب (نشست بیستم) به صورت آنلاین برگزارشد