Menu

اخبار کتابخانه

چهارشنبه 27 فروردین 1399
تعداد بازدید: 1393
تعداد نظرات: 0

سواد پژوهشی: آموزش عملیاتی پژوهش در محیط وب

متن حاضر برگرفته از کارگاه "آموزش عملیاتی پژوهش در محیط وب"، از مجموعه کارگاه های دورهمی علمی کتابداران با تدریس دکتر سید مهدی طاهری بوده که در کتابخانه آیت الله بروجردی برگزار شده است.

به کوشش: بنت الهدی موحدی محب (کارشناس کتابخانه آیت الله بروجردی)

پژوهشگران و محققان برای افزایش اعتبار علمی و پژوهشی خود، نیاز دارند تا از پژوهش های مختلف انجام شده (مانند مقالات علمی، پایان نامه و کتاب و ...) توسط دیگر پژوهشگران استفاده کنند. در گذشته از منابع علمی چاپ شده در نشریات و کتابها استفاده می شد، اما امروزه به دلیل پیشرفت در زمینه ارتباطات، از منابع علمی الکترونیکی (وب) استفاده می گردد. به این منظور باید روش استفاده و چگونگی استخراج اطلاعات را از وب بدانیم، در این راستا، ابتدا کلیاتی درباره ساختار موتورهای کاوش ارائه خواهد شد:

اصطلاح پژوهش در وب یا research in the internet , research in the web که به ترتیب تداول و استفاده در منابع علمی به کار می رود.

با توجه به ظهور فناوری های نوین اطلاعاتی و ایجاد محیط ها و رسانه های جدید مثل رایانه و اینترنت، دسترسی به اطلاعات و منابع دانش بسیار بیشتر و آسان تر شده است، اینترنت به بخش های مختلفی تقسیم می شود و مهمترین بخش آن شبکه وب است که در عین حال از بستر اینترنت استفاده می کند، حدود 4/3 اینترنت را شبکه وب تشکیل می دهد، و 4/1 بقیه را بخش های دیگری مثل تل نت، یوزنت و ... شامل می شود.

شبکه وب از فناوری های وبی است که اصطلاحاً web technology می گوییم. لزوماً فناوری های وب در شبکه نیست و ممکن است به شکل آفلاین هم استفاده شود.

قابلیت های وب برای پژوهش

1. مهمترین ویژگی سامانه وب استفاده از پروتکل http بوده که علامت اختصاری Hyper text transfer protocol است که مربوط به شبکه وب می باشد.

2. یکی دیگر از ویژگی های آن فراپیوند یا  Hyper link است که صفحات با هم پیوند می شوند.

3.سومین ویژگی که وب دارد امکان چند رسانه ای یا Multi media است که در تک تک صفحات وب امکان مشاهده عکس، متن و صوت به صورت همزمان وجود داشته و امکان راهبری و کنترل فراهم است.

4.  دیگر ویژگی آن تنوع ابزار است، مانند موتورهای جستجو، عوامل هوشمند، راهنماهای موضوعی و ... .

5. امکان اشتراک گذاری دانش در سطح گسترده از طریق شبکه های اجتماعی، درگاه های اطلاعاتی، سایت ها و ... . 

6. ابزارهای ارتباطی مثل پست الکترونیک یا Email و چت  .chat

از آنجایی که بیشترین استفاده از وب از طریق موتورهای کاوش صورت می گیرد، یعنی تقریباً 90 درصد زمان که صرف جستجو در وب می شود از طریق موتورهای کاوش است، باید به چگونگی عملکرد موتورهای کاوش و فرایند بازیابی اطلاعات از طریق آنها بپردازیم:

وب به عنوان بزرگترین محیط ذخیره و بازیابی داده ها در دنیاست و  به دلیل گستردگی و اهمیت آن تمام مباحثی که در حوزه مدیریت اطلاعات و دانش مطرح می شود، یک بعد وبی هم پیدا می کند. محیط وب خیلی گسترده است و در آن از  فناوری‌های مختلفی استفاده می شود. موتورهای کاوش سه بخش اصلی دارند:

1. Data base: جایی که دیتاها در آن ذخیره می شوند. مورتوهای کاوش اول داده یا اطلاعات را به صورت مغلوب نمایه یا Index  می کنند که تقریباً چیزی شبیه نمایه انتهایی کتاب است، با این تفاوت که بجای شماره صفحه، آدرس صفحه (URL) قرار می گیرد.

2. ربات های موتور کاوش که به آن نرم افزار خزنده نمایه ساز می گویند.

3. پردازشگر درخواست یا query processor . کار پردازشگر این است که درخواست‌ها را از کاربر دریافت می کند و از پایگاه داده یاdata base   پاسخ می آورد و در این کار از نمایه مقلوب استفاده می کند و این بخش کوچکی از ساختار موتورهای کاوش است. نرم افزار موتور کاوش از طریق یو آر آی (URL) صفحه را پیدا می کند، برای آنکه بتواند این کار را انجام دهد، یک سری feed غذا یا  خوراک در اختیارش می گذارند، یک سری صفحات لینک  اینها را fetch می کنند، یعنی صفحات را می آورد یا بازخوانی می کند،  در داخل صفحه ای که باز کرده احتمالا صفحات دیگری هم وجود دارد که می تواند داخل آنها رفته و اطلاعات داخل آن را هم استخراج کند و به همین ترتیب پیش می رود که اصطلاحا به این کار  crawling(خزیدن) می گویند. سپس از صفحه ای به صفحه دیگر رفته و اطلاعات آنها را استخراج کرده و به پایگاه داده یاdata base  منتقل می کند و بعد از آن از طریق نرم افزاری به نام پردازشگر درخواست یا query processor  مطالب برای ما بازیابی می شود.

باید توجه داشته باشید که فقط حدود20 درصد داده های وب، نمایه می شوند و باقی وب عمیق (deep web ) یا وب نامرئی (invisible web ) یا وب مخفی(hidden web ) است که ما به آن دسترسی پیدا نمی کنیم. بخش کوچکی در حدود 10درصد از وب عمیق را وب تاریک (dark web) گویند که یک ساختار چند لایه دارد و در این قسمت همه آدرس ها inscribed می شوند و کسی آدرس سایت ها را نمی بیند و از ورود و خروج به سایت مطلع نمی شوید، تمام سایت های خرید و فروش انسان، فحشا، جاسوسی (سازمان های موساد و سیا)، خرید و فروش اسلحه، مواد مخدر و ... در قسمت وب تاریک فعالیت می کنند.

اصل هر موتور کاوشی ربات آن موتور کاوش است که هزینه ایجاد و گسترش و بروزرسانی آن بسیار بالاست. به همین خاطر بسیاری از موتورهای کاوش دیگر  بروزرسانی نمی شوند و از اعتبار آن کاسته شده است.

در حال حاضر فقط چهار موتور کاوش وجود دارد که دارای ربات هستند: ربات موتور کاوش گوگل ((Google bot، ربات موتور کاوش بینگ (bing bot) و ربات موتور کاوش بایادو (bot Baidu) که یک موتور کاوش چینی است و از روی گوگل کپی برداری شده است. موتور کاوش قوی دیگر محصول کشور روسیه، موتور کاوش یاندکس (Yandex) است که از بایادو ضعیف تر، ولی با سرویس های فراوان (ترکیبی از گوگل و یاهو است) و بیشتر اختصاصی خود روس ها است و تمام سرویس های ملی روسیه از طریق یاندکس پشتیبانی می شود. از بین این چهار موتور کاوش از همه مهمتر گوگل است که دارای فناوری ای با نام(GWT) یا فناوری وب گوگل است که منحصر به فرد می باشد و هیچ موتور کاوشی در دنیا این فناوری را ندارد.

حوزه پژوهش درباره موتورهای کاوش بسیار گسترده و جذاب است و اگر مایل به پژوهش در این زمینه باشید، می توانید از طریق وب سایت: searchenginewatch.com  به اطلاعاتی در این زمینه دست پیدا کنید و با عضویت در mail list آن از تمامی مقالات و دستاوردهای روزآمد دنیا در زمینه موتورهای کاوش برخوردار شوید.

انواع جستجو

1. جستجوی ساده(simple search): در این نوع جستجو فیلترها و محدودکننده ها کم هستند و یک جستجوی کلی برای ما انجام می شود.

2. جستجوی پیشرفته (advanced search): در این نوع جستجو فیلترها و محدودکننده ها بیشتر از جستجوی ساده است و نتایج تخصصی تر و نزدیک تری را برای ما بازیابی می کند. به طبع نتایج کمتر ولی مرتبط تری نسبت به جستجوی ساده به دست می دهد.

مهمترین تفاوت و برتری جستجوی پیشرفته نسبت به ساده امکان استفاده از عملگرهای بولی (Boolean operator ) است. AND, OR NOT که به ترتیب (و، یا ، بجز) معنی می دهند.با این ابزار و عملگرها مانعیت و دقت جستجو بالا می رود.

3. جستجوی پایه (basic search): ترکیبی از جستجوی ساده و پیشرفته است. به این معنا که ظاهرش جستجوی ساده بوده، ولی کارکرد و عملکرد آن جستجوی پیشرفته است. به این شکل: به عنوان مثال در گوگل دو کلمه را با یک فاصله یا با عبارت AND جستجو می کنیم، درواقع در محیط جستجوی ساده، جستجوی پیشرفته انجام گرفته است.

4. جستجوی فوق پیشرفته (super advanced search): همان جستجوهای پیشرفته است با قابلیت های بیشتر و فیلدهای بیشتر

5. جستجوی خبره (expert): همان جستجوهای پیشرفته است با قابلیت های بیشتر و فیلدهای بیشتر

6. جستجوی یکپارچه (integrated search): اگر بتوانیم در یک سیستم اطلاعاتی همزمان در چند پایگاه مربوط به همان سیستم جستجو انجام دهیم یک جستجوی یکپارچه انجام داده ایم.

7. جستجوی متحد (federated search): جستجویی که از داخل سیستم محلی خود بتوانیم سیستم دیگری را در خارج از پایگاه خود جستجو کنیم.

موتور کاوش گوگل بیش از 100هزار سرور در کل دنیا دارد که در کشورهایی مثل امارات متحده عربی، چین، آلمان و غیره قرار دارند. در نتیجه جستجوها در گوگل بسته به نوع منطقه جغرافیایی محل جستجو متفاوت خواهد بود، اصطلاحاً GEO-IP-based search یعنی مبتنی بر منطقه جغرافیایی است.

در اینجا و به منظور کاربردی تر کردن فرایند جستجو سه مرحله را باید فرا بگیریم:

1.آشنایی و شناخت عملگرها و چگونگی کارکرد آنها

2.فراگیری مهارت های اطلاع یابی متناسب با گام های هفتگانه پژوهش

3.طراحی راهبردهای جستجو، تا به نتایج دقیق و منطقی در فرایند پژوهش دست پیدا کنیم.

عملگرها:

محیط کار ما محیط گوگل و قسمت جستجوی آن می باشد که با جستجوی پایه شروع می کنیم و در آن از عملگرها استفاده خواهیم کرد.

نکته: موتور کاوش گوگل non case sensitive است، یعنی به حروف کوچک و بزرگ حساس نیست. اما در عملگرها حروف کوچک و بزرگ باید رعایت شود.

عملگر عبارتی «""» : اولین عملگری که استفاده می کنیم quotes ، «""» است، که برای جستجوهای عبارتی استفاده می شود. معمولا در پژوهش های آکادمیک و حرفه ای به جای جستجوی تک کلمه، عبارت ها را یعنی بیش از یک واژه را جستجو می کنیم تا نتایج دقیق تر و مرتبط تری بدست بیاوریم، لذا لازم است تا از علامت  «""»  استفاده کنیم تا موتور کاوش دقیقاً عین عبارت را برای ما جستجو کند:

عملگر عبارتی «""»، عملگر مجاوتی است که ترتیب در آن مهم است و اگر عبارتی را در «" "»  قرار دهیم به همان ترتیبی که نوشته شده جستجو می شود و ترتیب رعایت می شود.

عملگر «site:»: این عملگر به شما کمک می کند تا جستجو را فقط در یک سایت خاص انجام دهید.

جستجو در دو یا بیش از دو سایت:

با عملگر site:  علاوه بر سایت مشخص می توانیم دامنه خاصی را جستجو کنیم، هر سایت یک دامنه خاصی دارد که نشان دهنده فعالیت آن سایت در زمینه ای خاص می باشد.

دامنه .com برای سایت های تجاری

دامنه .ir برای سایت های ملی ایران و دامنه .uk برای سایت های کشور انگلستان است.

دامنه .edu برای سایت های آموزشی

دامنه org.  برای سایت های سازمانی

دامنه gov.  برای سایت های دولتی ایران .gov.ir برای کشور انگلستان  .gov.uk

دامنه .ac برای دانشگاه های هر کشور. ir برای ایران و برای کشورهای دیگر همراه با دامنه کشور مربوطه.

عملگرهای بولی «AND,OR,NOT» ( Boolean operators ) 

AND یعنی صفحاتی را برای ما جستجو می کند که هم کلمه قبل و هم کلمه بعد از AND در آن قید شده باشد.

به صورت پیش فرض گوگل فاصله بین کلمات را AND به حساب می آورد، اما بهتر است که از عملگر AND استفاده شود.

نکته: بین دو سایت مختلف نمی توانیم از عملگر AND استفاده کنیم، چون از لحاظ منطقی نیز نمی توان مطلبی را در آن واحد در دو سایت مختلف یافت.

OR یعنی صفحاتی را برای ما جستجو می کند که هم کلمه قبل و هم کلمه بعد از OR و یا هر کلمه را به تنهایی دارد. ما ناچار هستیم به دلیل عدم انسجام و همبستگی در مفاهیم تخصصی، حتما از عملگرOR استفاده کنیم، در غیر این صورت جستجوی مفاهیم زیادی را از دست می دهیم که ممکن است در پژوهش ما بسیار مفید و تاثیرگذار باشند و به دلیل عدم استفاده صحیح از عملگرها نتوانیم از آن در پژوهش خود استفاده کنیم.

NOT یعنی (-): قبل از هر عبارتی که قرار بگیرد و بعد از آن بدون فاصله کلمه یا عبارتی قرار بگیرد آن عبارت یا کلمه از جستجو حذف می شود.

عملگر یا علامت (*): این علامت زمانی کاربرد دارد که شما در جستجوی یک عبارت، یک و یا چند کلمه از آن عبارت را فراموش کردید. بنابراین، به جای کلماتی که فراموش کرده اید از علامت ستاره استفاده می کنید تا به نتیجه صحیح تری برسید.

عملگرهای contextual operators

این نوع عملگرها،  قسمت های خاصی از صفحه را جستجو می کنند: چهار نوع هستند:

intitle: در عنوان مقالات جستجو می کند، یعنی صفحاتی را بازیابی می کند که حتما در عنوان آن عبارت مورد جستجو باشد.

به این خاطر که بیش از 90درصد عناوین مقالات علمی محتوانما هستند و اگر عبارت مورد جستجو در عنوان مقاله ای باشد، احتمالا ربط آن مقاله به موضوع ما بیشتر می شود. با این روش احتمال اینکه منبع علمی معتبری پیدا کنید، بیشتر است.

allintitle: با این عملگر می توانید بیش از یک واژه یا عبارت را در عنوان جستجو کنید.

inurl: این عملگر در آدرس اینترنتی جستجو را انجام می دهد.

عملگر filetyp :این عملگر نوع فایل را به همان شکل که جستجو می کنیم بازیابی می کند.

ممکن است چند فرمت را با هم جستجو کنیم:

در نتایج یافته ها صفحاتی را بازیابی کرده که با موضوع مدیریت منابع و با فرمت pdf  و word هستند.

عملگرextension (ext:) عملگر دیگری که عملکرد آن مشابه filetype بوده، عملگر extension است، به معنای پسوند فایل که با علامت مخففext  نمایش داده می شود و بسیار قوی تر و دقیق تر از filetype است، زیرا در همه قسمت ها جستجو می کند، مثلا در دیتابیس هایی مثل screensaver هم با پسوند sql را جستجو می کند.

  عملگر intext: به وسیله این عملگر می توانیم درون متن صفحات را جستجو کنیم، چون ممکن است عبارت کلمه یا موضوعی که ما به دنبال آن می گردیم درعنوان آورده نشده، ولی در متن از آن صحبت شده باشد. به وسیله این عملگر می توانیم آن را بازیابی کنیم.

عملگرrelated:  اگر ما سایت یا صفحه ای را پیدا کنیم که بسیار برای ما مفید باشد می توانیم با این عملگر سایت ها و صفحاتی را که با این صفحه مرتبط هستند، پیدا کنیم.

بعضی از عملگرها هم هستند که منسوخ شده اند، در گوگل مانند:

 link: ، صفحاتی که به صفحه ما لینک کرده اند، بازیابی می شود.

inlink: ، صفحاتی که ما به آنها لینک کرده ایم، بازیابی می شود.

outlink:  صفحات داخلی که به خود صفحه لینک شده، بازیابی می شود.

selflink: اگر مبادله لینک با صفحه ای داشته باشیم می شود، بازیابی می شود.

موتور کاوش گوگل زیاد روی این عملگر سرمایه گذاری نکرده است و موفق عمل نمی کند و زیاد دقیق نیست.

فهرست عملگردها و کارکرد آنها را در بخش فایل های پیوست دانلود کنید.

منابع

https://www.lisna.ir/main/40336-%D9%BE%DA%98%D9%88%D9%87%D8%B4-%D8%AF%D8%B1-%D9%85%D8%AD%DB%8C%D8%B7-%D9%88%D8%A8-%D8%AC%D8%B3%D8%AA%D8%AC%D9%88%DB%8C-%D8%A8%D8%A7%D9%81%D8%AA%DB%8C-%D9%81%DB%8C%D9%84%D9%85

https://www.lisna.ir/main/40173-%D9%BE%DA%98%D9%88%D9%87%D8%B4-%D8%AF%D8%B1-%D9%85%D8%AD%DB%8C%D8%B7-%D9%88%D8%A8-%D9%85%D9%88%D8%AA%D9%88%D8%B1%D9%87%D8%A7%DB%8C-%DA%A9%D8%A7%D9%88%D8%B4-%D9%88-%D9%86%D9%85%D8%A7%DB%8C%D9%87%E2%80%8C%D8%B3%D8%A7%D8%B2%DB%8C-%D9%88%D8%A8-%D9%81%DB%8C%D9%84%D9%85

https://www.aparat.com/v/3Z9kF/%D8%B3%D9%88%D8%A7%D8%AF_%D8%A7%D8%B7%D9%84%D8%A7%D8%B9%D8%A7%D8%AA%DB%8C_%D9%88_%D9%85%D9%87%D8%A7%D8%B1%D8%AA_%D9%87%D8%A7%DB%8C_%D9%BE%DA%98%D9%88%D9%87%D8%B4%DB%8C_%28%D9%BE%DA%98%D9%88%D9%87%D8%B4_%D8%AF%D8%B1_%D9%85%D8%AD%DB%8C%D8%B7_%D9%88%D8%A8

https://server303.iranlms.org/playback/presentation/2.0/playback.html?meetingId=5909ac528f2c3da6a8719a8ef7a30e972c38a652-1584621024522

https://server303.iranlms.org/playback/presentation/2.0/playback.html?meetingId=5909ac528f2c3da6a8719a8ef7a30e972c38a652-1585222006169

https://server303.iranlms.org/playback/presentation/2.0/playback.html?meetingId=5909ac528f2c3da6a8719a8ef7a30e972c38a652-1585826928352

https://moz.com/learn/seo/search-operators

https://shadangroup.com/%D9%86%D8%AA%D8%A7%DB%8C%D8%AC-%D8%A8%D9%87%D8%AA%D8%B1-%D8%AF%D8%B1-%D8%B3%D8%B1%DA%86-%DA%AF%D9%88%DA%AF%D9%84/

 

تصاویر
  • سواد پژوهشی: آموزش عملیاتی پژوهش در محیط وب
فایلهای پیوست