شانزدهمین جلسه کارگاه آموزشی "پژوهش در محیط وب"، از سری جلسات دورهمی علمی کتابداران استان قم که توسط کتابخانه آیتالله العظمی بروجردی برگزار می شود، مانند جلسات گذشته با پاسخ به پرسشهای مربوط به مباحث جلسه پیشین آغاز شد.
در ابتدای جلسه دکتر طاهری به انواع گروههای کاربری اشاره نموده، و گفتد: به طور کلی در خصوص جستجو در موتورهای کاوش با دو گروه از کاربران روبرو هستیم. گروه نخست، کاربران عمومی هستند که به طور معمول وارد موتور کاوش میشوند، به صورت غیر حرفهای یک واژه را جستجو میکنند، و از میان میلیونها رکورد بازیابی شده به یافتن رکودهای مورد نظر خود میپردازند. گاهی اوقات نیز پس از بازبینی ده صفحه نخست، به دلیل پیدا نکردن مطالب مورد نظر خود، مجبور به تغییر واژه یا عبارت جستجو میگردند، و به همین روال ادامه میدهند. در این حالت فرایند جستجو کوتاه، اما زمان بررسی و مرور نتایج جستجو، و انتخاب منبع مناسب و مورد نظر خیلی طولانی خواهد بود. زیرا به دلیل استفده از راهبرد جستجوی نامناسب، معمولاً منابع مناسبی پیدا نمیکنند.
گروه دوم از کاربران، افرادی هستند که مرحله جستجوی نسبتاً طولانیتری دارند، اما نتایج مرتبطتر و مناسبتری را خواهند یافت. همچنین به راحتی میتوانند به منابع مورد نیاز خویش دسترسی پیدا کنند. دراین کارگاه قصد بر این است که گروه دوم از کاربران را آموزش داده، و اصطلاحاً جستجوگر حرفهای (professional researcher) تربیت کنیم.
ایشان همچنین یادآور شدند که در زمان جستجو ممکن است گزینهای مجازی در ذهن شما شکل گیرد که آیا جستجوگر حرفهای هستید یا آماتور و غیرحرفهای؟ که اگر فرایند بازیابی را به دو مرحله تقسیم کنیم، مرحله اول شامل طراحی راهبرد جستجو، و مرحله دوم شامل ارزیابی و انتخاب مرتبطترین منابع از بین نتایج بازیابی شده خواهد بود. همانطور که پیشتر گفته شد، در جستجوگران غیرحرفهای مرحله اول بسیار کوتاه، ولی در جستجوگران حرفهای زمان طراحی راهبرد به نسبت زمان بیشتر به خود اختصاص میدهد، اما در مرحله بازیابی منابع، بهترین و مرتبطترین نتایج بازیابی میشوند.
استاد طاهری در ادامه سخنان خود افزودند: یک ضعف بزرگ که برای جستجوگران غیرحرفهای، بخصوص در تعامل با موتورهای کاوش وجود دارد، آن است که از آنجایی که موتورهای کاوش ماهیت تجاری دارند، معمولاً وقتی با راهبرهای جستجوی ساده از طرف کاربرغیرحرفهای مواجه میشوند، سایتهای تبلیغاتی و تجاری، نیز وبسایتهایی که برای کسب رتبه بالاتر هزینه پرداخت کردهاند را در اولویت قرار میدهند. به عنوان نمونه، موتور کاوش گوگل برای رتبهبندی وبسایتها بیش از هزاران عامل و سیاست را در نظر میگیرد که متناسب با راهبرد جستجو و موارد دیگر، بخشی از آن عوامل را اعمال مینماید. چند دلیل برای اهمیت طراحی راهبرد جستجوی مناسب وجود دارد: نخست اینکه، با راهبرد جستجوی ساده (نامناسب)، میلیونها رکورد بازیابی میشوند. در حالی کهمطالعات مرتبط نشان داده است که کاربران نهایتاً تا 10 صفحه نسختنتایج هر جستجو را بررسی میکنند، و چنانچه حس کنند منابع مورد نظرشان بازیابی نشده، راهبرد جستجو را تغییر میدهند. البته موتورهای کاوش، و سرآمد آنها یعنی موتور کاوش گوگل هم معمولاً محدودیتهایی دارند و با وجود بازیابی هزاران رکورد، ولی بیش از 1000 رکورد نخست را قابل دسترس نکرده، و به کاربران نشان نمیدهند. دیگر اینکه، موتورهای کاوش ماهیت تجاری دارند، یعنی از برخی وبسایتها هزینه دریافت میکنند تا رتبه آنها را بالاتر نشان دهند. درحقیقت، درآمد عمده موتورهای کاوش، یکی از این راه (اختصاص رتبه بالا به وبسایتها در برابر دریافت هزینه)،دیگر از راه فروش دادههای تحلیل شده، و دو دیگر، از راه تبلیغات در صفحات نتایج تامین میشود. به خصوص اگر در صفحات نخست نتایج بازیابی باشند. چون کاربران همیشه نخستینها را کلیک میکنند، به ویژه ده رکورد نخست را.
وی پس از این مطالب، به معرفی بهینهسازی موتورهای کاوش (Search Engine Optimization یا SEO) پرداخته، و ادامه داد: بسیاری از وبسایتها با پرداخت هزینه به متخصصان این حوزه، از مزایا و خدمات سئو استفاده میکنند. صنعت سئو صنعتی بسیار مهم و پر درآمد است، و شامل ترفندهایی است که در وبسایتها بکار برده میشود. برای مطالعه جدیدترین مقالات و مباحث مرتبط با سئو میتوانید به سایت www.searchenginwatch.com مراجعه کنید که جدیدترین مباحث پیرامون صنعت سئو را در بر میگیرد. به عنوان نمونه، محتوای آن شامل: امکانات و خدمات جدید گوگل و بینگ، و ترفندهای افزایش رتبه وبسایتها در موتورهای کاوش وب است. البته مشابه آن، سایت ClickZ است که دراین سایت نیز راهکارهایی برای بهبود رتبه ارائه میشود، و این اهمیت رتبهبندی (ranking) در نتایج موتورهای کاوش را نشان میدهد.وبسایتی که بتواند بین 10 رکورد نخست، یا بیشینه 20 الی 30 رکورد نخستقرار گیرد، شانس کلیک بیشتری توسط کاربران خواهد داشت. با توجه به این مهم، از دو جنبه نتایجی که موتورهای کاوش وب از جمله گوگل برای جستجوگر غیرحرفهای بازیابی میکنند،معمولاً مناسب نیستند، و آنها نمیتوانند به طور دقیق به منابع مورد نیاز خویش دسترسی پیدا کنند. نخست اینکه،عواملی هست که گوگل از آنها استفاده میکند تا وبسایت در رتبههای بالای نتایج نشان دهد. مثل دریافت هزینه از وبسایتبرای اختصاص رتبه بالاتر به آن، دیگر اینکه مدیران این وبسایتها از قابلیتها سئواستفاده نموده، و باعث میشوند که وبسایتهای آنها در نتایج نخستینموتور کاوش بازیابی شوند. البته باید به این نکته مهم توجه داشت که لزوماً نخستین نتایج بهترین، و مرتبطترین نتایج نیستند. بنابراین از دو جهت به نوعی حیلهها و ترفندهایی به کار میروند تا این وبسایتها در نتایج نخستین موتور کاوشقرار گیرند، و رتبه آنها بالا باشد. نیز نشانگر این مسئله است که برای جستجوگر غیرحرفهای به غیر از اینکه انتخاب از بین انبوه رکوردهای بازیابی شده نه چندان مرتبط، وقتگیر خواهد بود، رتبهبندی هم بیشتر پیرو سیاستهای تجاریموتورهای کاوش، و ترفندهای مدیران وبسایتها خواهد بود. اما زمانی که پژوهشگر یا جستجوگر به صورت حرفهای جستجو انجام میدهد، و در اصل محدودیتهای (limitations) جستجو را افزایش میدهد، یعنی برای جستجوی خود از فیلترهای (filters) بیشتر بهره میبرد، به نتایج مرتبطتری دستیافته، و بر روی سیاستها و فرایند رتبهبندی تاثیر گذاشته و در راستای نیازها و قصد خود آن را کنترل میکند. در واقع، جستجوگر حرفهای با استفاده از راهبردها و طراحی فرمولهای جستجوی مناسب، و اعمال برخی از محدودیتها در نتایج بازیابی و کاهش بازیابی رکوردهای نامرتبط، بر بهبود ربط در بازیابی میافزاید.
عضو هیأت علمی دانشگاه علامه طباطبائی همچنین اذعان کردند: با وجود اینکه برخی از موتورهای کاوش مانند گوگل از بیش از 1000 عامل برای رتبهبندی نتایج استفاده میکنند که به آنها اصطلاحاً سیاستها یا خطمشیهای رتبهبندی (ranking policies) میگویند، با این وجود، به دلیل استفاده از برنامههای ماشینی مبتنی بر هوش مصنوعی، یعنی روباتها یا نرمافزارهای عنکبوت-نمایهساز یا خزنده-نمایهساز برای نمایهسازی محتوای وب، مورد ترفند و مکر مدیران وبسایتها (مبتنی بر هوش واقعی یا انسانی) قرار داده شده، و بسیار تاثیر میپذیرند. افزون بر این مسئله، از سوی کاربران نیز ابزارهایی از جمله طراحی راهبردهای جستجوی ویژه (cheat sheets)، که در زمره راهبردهای هک موتورهای کاوش به شمار میروند، استفاده میشوند، و بر روی بازیابی نتایج مرتبطتر با نیاز اطلاعاتی کاربران، نیز دستیابی به اطلاعاتی خاص برای نیل به اهداف ویژه، کنترلهایی را اعمال خواهند کرد. بنابراین کاربر برای جستجو در موتورهای کاوش و بازیابی نتایج با سه گروه سیاست یا ترفند در رتبهبندی روبرو است:
- سیاستها و عوامل رتبهبندی به کار گرفته شده از طرف موتورهای کاوش (ranking policies)؛
- ترفندهایی که مدیران وبسایتها به کار میبرند (یا همان سئو) تا رتبه بالاتری را در نتایج به دست آورند؛
- ابزارها و ترفندهای مورد استفاده خود کاربران که شامل استفاده از عملگرها (محدودیتها) و شیوه تنظیمآنها در کنار یکدیگر، یا همان طراحی فرمول یا راهبرد جستجو است. طراحی راهبرد و فرمول جستجوی ویژه توسط کاربران برای دسترسی به اطلاعاتی ویژه را هک کردن موتورهای کاوش (search engine hacking) گویند که مثلا اگر در محیط گوگل باشد، هکِ گوگل (google hacking) گفته میشود.
همچنین دکتر طاهری افزودند: به همین دلیل است که طراحی فرمولهای جستجوی ویژه توسط کاربر را موتور کاوشی چون گوگل، هک شناسایینموده، و کاربر را به عنوان یک هکر در نظر میگیرد. زیرا کاربر حرفهای با استفاده از محدودیتهای جستجو و اعمال فیلترهای گوناگون، بر روی سیاستهای رتبهبندی موتورهای کاوش اثر میگذارد، و به عبارتی،به جای آن که موتور کاوش یا مدیران وبسایتها تصمیم بگیرند که چه چیزی بازیابی شود، پژوهشگر، خود، بازیابی نتایج را با طراحی راهبردهای دقیق جستجو کنترل مینماید.
استاد طاهری در ادامه خاطرنشان کردند: بخشی از استفادههایی که از موتور کاوش میشود، در حیطه هک کردنبه حساب میآید. بدین معنی که موتور کاوش، به سبب استخراج همه دادههای یک رسانه وبی (مانند وبسایت) در هنگام نمایهسازی، به منزله ابزاری برای رسانههای وبی دیگر به کار میرود. در این نوع کاربرد، موتور کاوش، برخی از نتایج را که در برابر درخواستهای معمولی (بیشتر از سوی کاربران غیرحرفهای) بازیابی نمیکند، در مقابل راهبردهای جستجوی خاص ارائه میدهد. البته موتورهای کاوش قابلیتهای دیگری چون شخصیسازی (personalization) و یا سفارشیسازی (customization) دارند به تعبیر برخی از متخصصان، مرگ سئو(death of SEO) را در پی خواهد داشت. چرا که راهکارهای سئو بر بهبود رتبهبندی وبسایتهادر فهرست نتایج موتورهای کاوش متمرکز است که بدین گونه، سئو دیگر کارآیی خود را از دست میدهد و کاربر با تعیین بخش عمدهای از سیاستهای رتبهبندی، نتایج دلخواه خود را دریافت خواهد نمود. از این رو، موتورهای کاوش دو امکان مناسب برای کاربران را فراهم نمودهاند: نخست، امکان طراحی راهبردهای جستجوی ویژه که نتایج کنترل شده با بیشترین ربط متناسب با نیاز اطلاعاتی کاربر را در پی خواهد داشت، و دیگری، امکان شخصیسازی یا سفارشیسازی ویژگیهای و خدمات موتور کاوش را برای کاربر قابل برنامهریزی و بومی سازی میکند (programmable search engine).
رئیس کتابخانه مرکزی و مرکز اسناد دانشگاه علامه طباطبائی، همچنین به چگونگی طراحی فرمولها و راهبردهای جستجو به عنوان جستجوگر حرفهای اشاره کردند و گفتند: با طی مراحل هشتگانه جستجو میتوانیم مانند یک پژوهشگر یا جستجوگر حرفهای از موتور کاوش بهره ببریم، و همخوانی نتایج بازیابی شده را با نیازهای اطلاعاتی خود افزایش دهیم.
ایشان سپس اضافه نمودند: در جلسات پیشین به معرفی عملگرها پرداخته، و شیوههای استفاده از آنها متناسب با هر کارکرد یا بافتی بیان شد، و تاکید بیشتر مباحث ارائه شده بر روی طراحی راهبردهای جستجوی پژوهش-مدار برای اجرای یک پژوهش خوب و جامع بود.
لازم به ذکر است مراحلی که در ادامه بیان میگردد، تنها مربوط به جستجو در موتورهای کاوش وب نیست، و در دیگر ابزارهای پژوهشی و پایگاههای اطلاعاتیوبی نیز کاربرد دارند. در حقیقت هر جستجویی که بخواهیم انجام دهیم، باید این مراحل طی شود تا نتیجه مطلوب حاصل گردد.
مراحل هشتگانه جستجو:
- شناسایی و تنظیم مفاهیم: تمام موجودیتهای مفهومی، انتزاعی و ذهنی هستند، و تا به مرحله بیان نرسند و در قالب واژه بازنمون نیابند، به فعلیت نخواهند رسید. لذا باید به فعلیت برسند و بروز خارجی پیدا کنند. هر آنچه که کاربر جستجو میکند، ابتدا در ذهن وی شکل میگیرد. به عنوان مثالفرایند جستجوی پایاننامهها در موضوعی خاص که فقط در وبسایتهای دانشگاهی وجود داشته باشد،در ذهن کاربر متشکل از چند مفهوم است. ابتدا باید فکر کنیم که چه چیزی را جستجو کنیم، چرا که از طریق انتقال مفاهیم است که میتوانیم به پاسخ برسیم؛
- انتخاب کلیدواژه ها و عبارات کلیدی که نمایندگان مفاهیم باشند: در گام دیگر، باید مفاهیم به واژهها و عبارات تبدیل شوند. انتخاب کلیدواژه یا عبارات کلیدی مناسب بسیار مهم است و همانطور که در مباحث پیشین بیان شد، مفاهیم تخصصی بیشتر در قالب عبارت بیان میشوند، مانند: مدیریت اطلاعات، مدیریت دانش، بانکداری اسلامی و نظیر آن؛
- تعیین مترادفها و همنشینها: گام دو دیگر، شامل تعیین مترادفها و همنشینها است که در سیستمهای اطلاعاتی به دو شکل بروز مییابد: نخست آن دسته از سیستمهای اطلاعاتی که از جستجوی معنایی یا مفهومی (conceptual or semantic search) پشتیبانی میکنند، مانند سیستمهای اطلاعاتی (کتابخانههای دیجیتالی، پایگاههای کتابشناختی، و ...) شامل سیستمهای فرعی معنایی از جمله اصطلاحنامهها، مستند نامهای مختلف، فهرست سرعنوانهای موضوعی و جز آن. این گونه از سیستمها، نیازی به اجرای گام سوم از سوی کاربر ندارند و به صورت خودکار از آن حمایت مینمایند. مگر آن که اصطلاح یا عبارت مورد جستجوی کاربر در سیستم معنایی وجود نداشته باشد. دیگر،آن دسته از سیستمهای اطلاعاتی که از جستجوی معنایی پشتیبانی نمیکنند، که در این صورت نیاز به اجرای مرحله سوم هست. به این معنا که اگر بخواهیم به عنوان مثال آموزش و پرورش را جستجو کنیم، باید بدانیم که اصطلاح تعلیم و تربیت با آن مترادف است و برای دستیابی به جامعیت بازیابی، هر دو اصطلاح باید مورد جستجو قرار گیرند (ترکیب شوند). همینطور درباره دموکراسی که به آن مردم سالاری نیز گفته میشود که اگر کاربر این اصطلاحات را در جستجوی خود به کار نگیرد، جامعیت بازیابی از دست میرود و «عدم بازنمون مناسب مفهوم (مفاهیم) موجود در ذهن»را منجر میشود.زیرا این مفهوم (مفاهیم) به دلایل مختلف در قالب واژگان یا عبارات گوناگون بیان میشوند. اما اگر سراغ موتورهای کاوش عمومیمیروید، باید توجه داشته باشید که از آنجا که این دامنه موضوعی زیر پوشش این موتورهای عمومی است و به همه موضوعات دانش بشری میپردازند از ابزارهای معنایی زبانی و نه حوزه علمی خاص، استفاده میکنند. یعنی از سیستمهای معنایی مانند اصطلاحنامههای مبتنی بر زبان (language-based thesauri) شبیه شبکه معنایی (یا هستیشناسی واژگانی)Wordnet که برمبنای واژهها زبان انگلیسی و روابط معنایی میان آنها گسترش یافته است و در جلسات پیشین معرفی شد؛
- انتخاب و تنظیم عملگرها (طراحی راهبرد جستجو): که متناسب با نیاز اطلاعاتی خود فیلترینگ یا محدودیتهای جستجویی اعمال میکنیم که با ایجاد این محدودیتها، دقت و مانعیت جستجو افزایش مییابد. به طور کلی عملگرهای (محدودیتهای) جستجو به دو شکل در سیستمهای اطلاعاتی به کار میروند: نخست، در قالب حروف، واژهها و نشانهها، و دیگر، به صورت فهرستهای انتخابی (Pick lists). البته باید به این نکته هم توجه نمود که فقط انتخاب عملگرها مهم نیست، و تنظیم آنها نیز از اهمیت فراوانی برخودار است، که به این این فرایند (انتخاب و تنظیم)، طراحی راهبرد یا فرمول جستجو گفته میشود؛
- انجام کاوش: که با توجه به مراحل پیشتر گفته شده، فرایند جستجو انجام میشود؛
- ارزیابی نتایج: دراین مرحله بررسی میکنیم که نتایج بازیابی شده با توجه به مفاهیم انتخاب شده برای براین نیاز اطلاعاتی، کلیدواژهها و عبارتهای کلیدی، مترادفها و همنشینها (شبه مترادفها)، عملگرها و تنظیم راهبرد جستجو، مناسب و مرتبط با درخواست ما بوده است یا خیر؟. اگر کاربر هم چون یک پژوهشگر حرفهای جستجو کند، زمانی که برای ارزیابی نتایج اختصاص میدهد، کوتاه خواهد بود. چراکه با طراحی فرمولهای جستجوی خوب و دقیق، نتایج مفید و خوبی رادریافت نموده است؛
- اصلاح کاوش: در صورت نیاز و نداشتن رضایت کامل از نتایج جستجو، اعمال محدودیتهای جستجوی کمتر یا بیشتر، برای دستیابی به نتایج بهتر تلاش میکنیم؛
- جستجو در دیگر سیستمهای اطلاعاتی برای دسترسی به منابع بیشتر.
دکتر طاهری در ادامه یادآور شدند: همانطور که پیشتر نیز اشاره شد، 90% از زمانی که کاربران صرف جستجو در وب میکنند، در محیط موتورهای کاوش است، و فقط 10% باقیمانده به دیگر ابزارهای کاوش و پایگاههای اطلاعاتی اختصاص دارد. بنابراین یادگیری چگونگی استفاده از این ابزار محبوب و ارزشمند، برای پژوهشگران از اهمیت بالایی برخوردار است.
دکتر طاهری در ادامه این نشست، به معرفی و چگونگی جستجو درفهرست دسترسپذیر همگانی (اُپک) کتابخانه ملی جمهوری اسلامی ایران به نشانی اینترنتی: http://opac.nlai.irپرداخت و استفاده از این ابزار را برای پژوهشگران ایرانی و فارسی زبان مفید ارزیابی کرد. وی اشاره کرد، پایگاههای مستند که به اشتباه "بانک مستندات" ذکر شده است، امکان افزایش جامعیت و مانعیت بازیابی در ابزارهای کاوش از جمله موتورهای کاوش و پایگاههای کتابشناختی را برای کاربران فراهم مینماید.بدین صورت که تمامی شکلهای اصطلاحات به کار رفته برای بازنمون معنای یک مفهوم را نشان داده، و پژوهشگر میتواند از تمام آنها در جستجوی خود بهره گیرد؛
ایشان با ارائه یک مثال نحوه کار و طریقه استفاده از پایگاههای مستند دسترسپذیر در اُپکِ کتابخانه ملی را شرح دادند:
در قسمت جستجوی مستند موضوعی این پایگاهها، عبارت "کتابخانه مجازی" را وارد نموده، و به جستجو میپردازیم. چنان که در تصویر مشاهده میشود، شش رکورد نتیجه برای ما بازیابی میشود با عناوین: کتابخانههای الکترونیکی، کتابخانههای کامیپوتری، و جز آن. اما هیچ کدام عبارت "کتابخانه مجازی" را نشان نمیدهد. به این دلیل که کتابخانه مجازی اصطلاح مرجح نیست، بلکهکتابخانه الکترونیکی اصطلاح مرجح است، ودر ذیل آن تمام اصطلاحات غیرمرجح مربوط به آن آورده شده که اصطلاح"کتابخانه مجازی" نیز از آن جمله است.
به این ترتیب اگر بخواهیم در گوگل عبارت کتابخانه مجازی را به تنهایی و بدون طراحی راهبرد مناسب و شامل مترادفها، جستجو کنیم، نتایج بازیابی شده ناقص خواهند بود، و بسیاری از منابع مرتبط را از دست میدهیم. چراکه اصطلاح کتابخانه مجازی تنهای اصطلاح نماینده مفهوم مرتبط نیست، و ممکن است در برخی منابع از دیگر مترادفهای آن استفاده شده باشد. بنابراین باید تمامی اصطلاحات (مرجح و غیرمرجح) بیانگر مفهوم مرتبط را در طراحی راهبرد جستجو لحاظ کنیم تا نتایج جامع و بیشتری بازیابی شود.
یکی از مهمترین کاربردهای پایگاههای مستند یافتن همین مترادفها، شبه مترادفها و شکلهای دیگر نامها که برای دستیابی به جامعیت بازیابی بسیار مناسب هستند. برای زبان فارسی، پایگاههای مستند کتابخانه ملی ایران، و برای منابع انگلیسی، پایگاههای مستند کتابخانه کنگره آمریکا (https://authorities.loc.gov/cgi-bin/Pwebrecon.cgi?DB=local&PAGE=First و https://id.loc.gov/) پیشنهاد میشوند. در پایان، به برخی از پرسشهای کاربران پاسخ داده شد.
گزارش از: بنت الهدا موحدی محب
برای مشاهده فایل تصویری این کارگاه می توانید به لینک زیر مراجعه کنید:
https://www.aparat.com/v/iX8y0