دورهمی علمی کتابدارن استان قم با موضوع پژوهش در محیط وب (نشست هجدهم) به صورت آنلاین برگزارشد.

جلسه 18 پژوهش در محیط وب از سری جلسات دورهمی علمی کتابداران که به همت کتابخانه آیت الله بروجردی و با تدریس دکتر سید مهدی طاهری به صورت مجازی برگزار می شود، در تاریخ 13 شهریور 99 از طریق سامانه وبینار در پلتفرم LMS تشکیل گردید.

جلسه 18 پژوهش در محیط وب

هجدهمین جلسه از کارگاه پژوهش در محیط وب، از سلسله جلسات دورهمی علمی کتابداران که به همت کتابخانه آیت الله بروجردی و با تدریس دکتر سید مهدی طاهری به صورت مجازی برگزار می‌شود، در ادامه بحث طراحی و ایجاد موتور کاوش شخصی از طریق سامانه وبینار در پلتفرم آموزش الکترونیکی برگزار گردید.

دکتر سید مهدی طاهری در جلسه قبل به معرفی موتورهای کاوش شخصی پرداخت و گفت: موتورهای کاوش شخصی با این رویکرد طراحی شده‌اند که برای هر کاربر با نیازهای اطلاعاتی، علایق و سلایق مختلف، رفتار اطلاع‌یابی متفاوت و حتی حس زیبایی شناختی خاص مناسب باشند. به عبارت دیگر، برای اینکه این موتورها بتوانند نیاز همه افراد را برطرف کنند و اجازه دهند کاربر از قابلیت‌های گوناگون این موتورها متناسب با نیازها و علایق خود استفاده نماید، این قابلیت‌ها را فراهم نموده‌اند، البته افزون بر گوگل، موتورهای کاوش دیگر هم مانند موتور کاوش بینگ، چنین امکاناتی را ارائه می‌دهند.

در جلسه گذشته درباره شیوه ایجاد موتورهای کاوش شخصی توضیحاتی ارائه شد، و در ادامه آن، در این جلسه در خصوص امکانات موتورهای کاوش شخصی بحث گردید. موتورهای کاوش شخصی (personalized search engine) که به آن‌ها موتورهای کاوش سفارشی (custom search engine) یا موتورهای کاوش قابل برنامه‌ریزی (programmable search engine) نیز می‌گویند، امکانات وسیع و گوناگونی دارند، و این امکانات به‌طور مرتب در حال گسترش و روزآمدسازی هستند. گوگل تمام این امکانات را ایجاد نموده تا بتواند نیاز اطلاعاتی کاربر را متناسب با نیاز، دیدگاه و رویکرد، و دیگر ویژگی‌های شخصی کاربر فراهم نماید.

این مسئله در درجه اول نشانگر این است که موضوع شخصی‌سازی در سیستم‌های اطلاعاتی بسیار پراهمیت است، و لازم است تمامی سیستم‌ها به سمت رویکرد شخصی‌سازی حرکت کنند و هر کدام متناسب با نیازها و علایق کاربر خدمات پویا (dynamic services)ارائه نمایند. به‌طورمثال، سیستم‌های اطلاعاتی از روی تحلیل لاگ‌های ثبت شده از کاربر و رفتار اطلاع‌یابی آن‌ها (تجربه کاربری) می‌توانند خدمات خود را متناسب با نیاز و سلیقه کاربر ارائه دهند، و منابع مرتبط را بازیابی نمایند. به‌عنوان‌مثال، اگر اولویت جستجوی کاربر منابع دیداری باشد و در کتابخانه دیجیتالی جستجو نماید، ابتدا منابع دیداری برایش بازیابی شده، و در رتبه (Rank) بالاتری قرار می‌گیرند، و یا در سیستم‌های خرید، متناسب با خریدهای پیشین کاربر، به وی پیشنهادهایی ارائه می‌گردد. نیز، در شبکه‌های اجتماعی مثل اینستاگرام در قسمت جستجو، متناسب با آنچه از پیش توسطکاربر جستجو شده است، تصاویر را نمایش می‌دهند. در خدمات ارائه شده دریوتیوب نیزبحث شخصی‌سازی مورد توجه قرار گرفته است.

نکته قابل توجه، در موتورهای کاوش مثل گوگل این است که به‌طور مرتب به این خدمات افزوده شده،و قابلیت‌های مختلفی را ارائه می‌دهد و این‌ها شواهدی بر اهمیت بحث شخصی‌سازیهستند.

عضو هیات علمی دانشگاه علامه طباطبایی در ادامه گفت، در جلسه پیش، بخش setup موتور کاوش شخصی بیان شد. وی اشاره نمود، تمامی این تنظیمات را پس از اتمام، می‌توانیم در قالب فایل مبتنی بربستر نحوی ایکس‌ام‌ال (XML)بارگذاری کنیم و یک موتورکاوش شخصی با قابلیت‌های مختلف متناسب با نیازهایمان داشته باشیم.

دکتر طاهری در خصوص پرسش یکی از کاربران درباره گزینه restrict page using knowledge graph entities توضیح داد: به‌عنوان‌مثال، در گوگل واژه "انیشتین" را جستجو می‌کنیم، زیر هر کدام از نتایج بازیابی شده یک یا چندین فراپیوند موجود استو در سمت راست صفحه، جعبه دانش (knowledge box) گوگل ارائه می‌گردد، که به عنوان جدیدترین پروژه بازنمون دانش در دنیا، و یک هستی‌شناسی از داده‌های وب مطرح است. همه موتورهای کاوش در حال حرکت به سمت این فناوری‌ها و خدمات هستند. در آینده تمام نتایج به این شکل ارائه خواهند شد، چرا که این روش هوشمند است و تشخیص می‌دهد که آلبرت انیشتین یک نظریه‌پرداز حوزه فیزیک بوده، و تمام داده‌های مربوط به انیشتین همانند نقل‌قول‌ها، توصیفات و کتاب‌هایش را نشان می‌دهد.جعبه دانش گوگل برگرفته از پروژه نگاره (گراف) دانش (knowledge graph) است که جستجوهای معنایی (semantic search) انجام داده، و بر اساس معیار ربط (relevance)، مرتبط‌ترین نتایج را به صورت معنادار نمایش می دهند.

این گونهخدمات، آینده موتورهای کاوش را تشکیل می‌دهند که مبتنی بر هوش مصنوعی است و هدف آن بازنمون دانش (knowledge representation) به جای بازنمون اطلاعات (information representation) است. هنگامی که در گوگل واژه "انیشتین" را جستجو می‌کنیم، در سمت چپ تنها اطلاعات را بازنمون می‌کند و صفحات را براساس وجود واژه مورد نظر بازیابی کرده است. در این بخش گوگل نتایج جستجوی نحوی (Syntactic search)را ارائه می‌دهد. در سمت راست با تشخیص اینکه انیشتین یک نظریه‌پرداز است،از وب‌سایت‌های مختلف،داده‌های مربوط به انیشتین، نقل قول‌های مرتبط، کتاب‌هایش، دانشمندان هم رشته و ... را جستجوی معنایی (semantic search) انجام داده و بازیابی نموده است.

افراد حقیقی و حقوقی که داده‌های خود را تهیه و در وب منتشر می‌کنند، اگر صفحات خود را بر اساس معیارهای knowledge graph آماده نمایند، صفحات در knowledge box به نمایش در آمده، و بازیابی معنایی می‌شوند، و گوگل ساختار این صفحات را به‌خوبی تحلیل و شناسایی می‌کند. یعنی در اصل گوگل ساختاری را طراحی نموده است که اگر مدیران وب‌سایت‌ها، پایگاه‌های اطلاعاتی ودیگر خدمات پیوسته، داده‌های خود را متناسب با این ساختارطراحی کنند، موتور کاوش، موجودیت توصیف شده در صفحه وب را به صورت معنادار تشخیص می‌دهد.

صفحات بازیابی شده در knowledge box ساختاری را برای بازنمون دانش استخراج می‌کنند که برای موتور کاوش کاملاً قابل درک است. در واقع موتور کاوش نتایج را به صورت knowledge graph نشان می‌دهد. مهم‌ترین ابزاری که نگاره دانش و خرده‌های غنی (دیگر نمایش معنادار) را ایجاد می‌کند، استاندارد فراداده‌ای schema.org است. این استاندارد باعث می‌شود داده‌ها به‌صورت ساختارمند تولید شوند و موتور کاوش داده‌ها را به صورت معنادار نمایه‌سازینموده، و معنادار نیز نمایش دهد. این استاندارد ساختاری طراحی نموده است که به تولیدکنندگان داده‌های وب نشان می‌دهد چگونه داده‌ها را به شکل ساختارمند تولید نمایند تا موتورکاوش این داده‌ها را به‌صورت معنادار نمایه‌سازی و بازنمون (semantically indexing and visibility) کند.

این استاد برجسته دانشگاه در ادامه افزود: زمانی که درتنظیمات موتور کاوش شخصی خود گزینه using schema.org type را فعال کنیم، می‌توانیم نتایج جستجوی خود را به صفحاتی که دارای ساختارمبتنی بر استانداردSchema.orgهستند، محدود نماییم تا موتور کاوش نتایج را به‌صورت کاملاً معنادار نمایه و بازیابی کند. در این زمینه باید توجه داشت، همه صفحات دارای این ساختارنیستند وشمار زیادی از صفحات وب براساس این ساختار تنظیم نشده‌اند. به همین دلیل وقتی این گزینه را فعال کنید نتایج چندانی بازیابی نخواهد شد. در واقع اگر نتایج را محدود کنیم تا فقط صفحاتی را بازیابی نماید که معنادار و بر اساس استاندارد schema.org و یا بر اساس knowledge graph entitiesایجاد شده‌اند، ممکن است صفحه‌ای بازیابی نشود یا تعداد آنها معدود باشد. مسئله دیگر این است که وقتی از موجودیت‌های نگاره دانش و schema.org صحبت می‌شود بایدنوع موجودیت جستجوی خود را ازfull list of entity types انتخاب نماییم.

برای یافتن این فهرست لازم است در قسمت جستجوی گوگل عبارت schema.org را جستجو نماییم، در نتایج بازیابی شده، گزینه full hierarchy را انتخاب می‌کنیم که انواع موجودیت‌ها را ارائه می‌دهد و از میان آن‌ها می‌توانیم کلیدواژه‌های خود را انتخاب نماییم. نیز می‌توانیم برای یافتن کلیدواژه‌های خود در گوگل عبارت google knowledge graph entities را جستجو نماییم.

دکتر طاهری در ادامه‌، به توضیح گزینه دوم موتور کاوش شخصی‌ یعنی look and feel پرداخت، و همه سربرگ‌های (تب) آن را کاملاً تشریح نموده و گفت: این گزینه دارای چهار سربرگ هست که اعمال تغییرات در هر کدام از این سربرگ‌ها، شکل و ظاهر نمایش نتایج را تغییر می‌دهند.

سربرگ اول(layout) که چگونگی نمایش نتایج بازیابی شده را تنظیم می‌کند، و نمایش می‌دهد؛

سربرگ دوم (themes) که پس زمینه صفحه موتور کاوش شخصی را تغییر می‌دهد؛

سربرگ سوم(customize)، در این سربرگ گزینه (general) مربوط به فونت، رنگ و اندازه واژه‌ها است و همچنین رنگ جعبه جستجو را تغییر می‌دهد. در قسمت (logo) می‌توانیم عکس یا لوگو برای موتور کاوش خود انتخاب کنیم. گزینه (refinement) رنگ متنی را که انتخاب (select) می‌کنیم، تغییر می‌دهد؛گزینه بعدی google branding است که اگر غیرفعال نماییم در قسمت جعبه جستجو عبارت (enhanced by google) حذف می‌شود، و مشخص نمی‌گردد که این موتور کاوش شخصی براساس گوگل ساخته شده است. توصیه می‌شود این گزینه فعال باشد تا عبارت (enhanced by google) نمایش داده شود؛

قسمت‌های بعدی مربوط به رنگ و فونت نتایج بازیابی شده، عناوین و آدرس URL صفحات بازیابی شده است؛

آخرین سربرگ look and feel، سربرگ thumbnails است که اگر فعال باشد، تصاویر کوچک در گوشه نتایج بازیابی شده نمایش داده می‌شوند.

قسمت بعدی تنظیمات موتور کاوش شخصی، ویژگی‌های جستجو (search features) است که بسیار مهم است و قابلیت‌های فنی زیادی دارد.

سربرگ نخست این گزینه (promotions) است که اگر این گزینه فعال باشد، می‌توانیم در نحوه نمایش نتایج بازیابی شده تغییرات اعمال نموده، که به‌طور دقیق عنوان و یا پیوند مربوط به صفحه را نمایش دهد.

عضو هیئت علمی دانشگاه علامه طباطبایی گفت: در قسمت (look and feel) شکل ظاهری نتایج بازیابی شده را می‌توانیم به سلیقه خود تغییر دهیم، ولی در قسمت (search features) می‌توانیم محتوای بازیابی شده را تغییر داده، و تعیین کنیم کدام موارد و به چه ترتیبی بازیابی شود.به‌طورمثال، ابتدا نشانی وب‌سایت و سپس توصیف‌های آننمایش گردد. بنابراین، گزینه (promotions) از لحاظ زیبایی‌شناختی نیست بلکه از لحاظ نوع اطلاعاتی است که می‌خواهیم جستجو و نشان داده شود. حتی می‌توانیم تنظیمات زمان برای آن درنظر بگیریم که از چه زمانی تا چه زمانی این تغییرات اعمال شود. نیز می‌توانیم تعیین کنیم در زمان‌های معین در بازیابی نتایج، آدرس سایت‌های تبلیغاتی را که در بالاینتایج بازیابی شده، نشان دهد. به‌عنوان‌نمونه، اگر بخواهیم همایشی برگزار کنیم، می‌توانیم در موتور کاوش شخصی خود تنظیمات را به گونه ای اعمال نماییم که وقتی کاربر جستجو می‌کند، عنوان یا پیوند مربوط به همایش در بالای نتایج بازیابی شده مشاهده شود.

رئیس کتابخانه مرکزی دانشگاه علامه طباطباییدر ادامه گفت: سربرگ (تب) یا امکان دیگری که در قسمت search features وجود دارد، گزینه پالایش (refinement) است که بر پایه آن، موتور کاوش به کاربر امکان می‌دهد، نتایج بازیابی شده را متناسب با دسته‌های خاص محدود کند. در این زمینه می‌توان چهریزه (facet) تعریف نمود. بدین منظور نخست باید گزینه enable facet search را فعال کنیم تا در این صورت بتوانیم نتایج را دسته‌بندی کنیم. سپس می‌توانیم تعیین نماییم کدام سایت‌ها در یک دسته خاص قرار دارند. به‌عنوان‌مثال، از ده نتیجه بازیابی شده، سه نمونه مربوط به یک دسته، چهارنمونه مربوط به دسته دیگر و به همین ترتیب هستند. این نتایج را موتور کاوش به صورت برچسبی (label) بازنمون می‌کند. قابلیت مورد نظر را نیز می‌توان با استفاده از knowledge graph entities تعریف نمود.

امکان دیگر auto complete مربوط به جستجو است. در صورت فعال بودن این گزینه، در هنگام جستجو، اصطلاحاتپیشنهادی (suggested terms) به جستجوی کاربر نیز نمایش داده می‌شود تا کاربر از میان اصطلاحات انتخاب نماید. می‌توانیم این امکان را نیز شخصی‌سازی کنیم.

قابلیت کاربردی دیگر، سربرگ synonyms است که یک امکان کاملاً تخصصی است. به عنوان مثال می‌توانیم تعریف کنیم که اگر در یک موتور کاوش شخصی عبارت data جستجو شود، با عبارت fact مترادف در نظر گرفته شود و عبارت مترادف نیز بازیابی گردد. به این معنی که اگر fact را جستجو کنیم، data نیز بازیابی شود. خود گوگل از شبکه معناییWordnet استفاده می‌کند و مترادف‌ها را نیز بر اساس واژگان این شبکه معنایی بازیابی می‌نماید. این تنظیمات در موتورکاوش شخصی با استفاده از سربرگ synonyms قابل اعمال است.

بالاخره در سربرگ پایانی (advanced)، چند گزینه به چشم می‌خورد، اولین گزینه results sorting است که اگر این گزینه فعال باشد، نتایج بر اساس ربط (relevance) یا بر اساس تاریخ (date) به‌صورت صعودی و یا نزولی مرتب می‌گردد.

در همین قسمت امکان دیگری وجود دارد با عنوان web search setting که می‌توانیم تنظیم کنیم نتایج بازیابی شده را به صورت سربرگ (تب) و یا پیوند نمایش دهد.

دکتر سید مهدی طاهری در پایان این جلسه گفت: تمامی بخش‌ها و امکانات قسمت تنظیمات search features به‌طور کامل ارائه شد. به این ترتیب جلسه هجدهم کارگاه پژوهش در محیط وب به پایان رسید و ادامه تنظیمات موتورهای کاوش شخصی به جلسه آینده موکول شد.

گزارش از: بنت الهدا موحدی محب

برای مشاهده ویدئو این جلسه به لینک زیر مراجعه کنید

https://www.aparat.com/v/IAZpn/

اخبار کتابخانه

دورهمی علمی کتابدارن استان قم با موضوع پژوهش در محیط وب (نشست هجدهم) به صورت آنلاین برگزارشد.