بسم الله الرحمن الرحیم
شانزدهمین جلسه از «دوره جامع نمایهسازی و چکیدهنویسی» از سری جلسات دورهمی علمی کتابداران که هر هفته به همت کتابخانه آیتالله العظمی بروجردی و با تدریس دکتر سیدمهدی طاهری دانشیار گروه علم اطلاعات و دانششناسی دانشگاه علامه طباطبایی برگزار میگردد، در روز پنجشنبه 13بهمن ماه 1401 به صورت مجازی تشکیل شد.
ابتدای این جلسه با طرح سوالی آغاز گردید:
- با توجه به قدیمی بودن استاندارد، خیلی از محیطها را درک نکرده و همین باعث گردیده که مثالها قدیمی باشند و امروزه متداول نیستند، و این روی کاربردپذیری متن استاندارد تأثیرگذار است. اگرچه از لحاظ توضیح در مورد ساختار چکیده ها و تفاوت آن با دیگر شکلهایی که محتوا را بازنمون میکنند، خوب کار کرده و نکات جالبی را بیان نموده است. البته از نظر مفهومی تفاوهایی وجود دارد ولی در کل خوب است، منتها میخواهیم که روی محتوای استاندارد نسبت به محیط جدید و تحولات امروز داشته باشیم، که چه اندازه این محتوا با تحولات روز مرتبط است و چقدر قابل استفاده است؟ آیا این تحولات تأثیری روی محتوا نداشته اند؟ و آیا هنوز هم این متن استاندارد قابل استفاده است؟
در پاسخ، سرکار خانم طباطبایی دانشجوی دکترای علم اطلاعات و دانش شناسی دانشگاه شهید چمران اهواز گفتند: با توجه به متن استاندارد و کاربردپذیری آن که باید دقت نظر بیشتری شود، با توجه به مطالعه ای که اخیراً روی اسکیما داشتم، یکی از عناصری که به چشم می آید، و بسیار برجسته شده، روی عنصر description و عنصر چکیده و خلاصه ای که از مطالب و محتواهای اشیاء دیجیتالی ارائه می شود، و تأثیری که روی بازاریابی الکترونیکی و میزان فروش دارند، خیلی تأکید شده است. حتی قبل از اینکه بخواهند سایر عناصر فراداده ای را در نظر بگیرند و درمورد اهمیت آن صحبت کنند، بیشتر مقالات روی کلیدواژه، چکیده و description تأکید ویژهای دارند و اکثراً با این دو عنصر بحث خود را شروع میکنند. با مطالبی هم که در جلسات اخیر گفته شده، عناصر دیگری مثل خلاصه ها و annotation و ... و تفاوت آنها با چکیده مطرح شد، به این نتیجه رسیدیم که در حال حاضر مباحث زیربنایی که این متن استاندارد ارائه می کند، هنوز می تواند مورد استفاده باشد و نه تنها می تواند کاربرد داشته باشد، بلکه بسیار هم حائر اهمیت است و ما باید آن ساختاری که برای نوشتن همه عناصری که در بازیابی، رویت پذیری، فروش و همه مباحثی که امروزه مطرح است، را رعایت کنیم و همه اینها می تواند کمک کننده باشد که بدانیم با چه ویژگی هایی این عنصر فراداده ای را بازنمون کنیم و مزایای دیگری که در ادامه خواهند داشت.
در ادامه دکتر طاهری مدرس کارگاه ضمن تأیید صحبتهای خانم طباطبایی افزودند: پاسخ ایشان بیشتر به بخش دوم سوال برمی گشت که چقدر در رخدادهای جدید، چکیدهها کاربردپذیر هستند؟ که توضیح خواهیم داد و روی آن بحث خواهیم کرد.
نکته مهمی را اشاره کردند که بحث مارکتینگ را مطرح نمودند. موضوع ایشان در حوزه نشر و اسکیما دات اورگ است که کار غنیسازی این استاندارد را در حوزه نشر انجام میدهند که چگونه این استاندارد میتواند useability را در حوزه نشر افزایش دهد و چطور میتوان از این استاندارد در حوزه نشر استفاده نمود.
ما اگر مارکتینگ را در حوزه نشر در نظر بگیریم برای فروش محصولاتی مثل کتاب و تولیدات دیگر، همانطور که میدانید در کتابخانهها هم ما بحث مارکتینگ را داریم که اگر کاربر ما از کتابها استفاده کند، ما سود کردهایم و سود، فقط مادی نیست، چرا که کتابخانهها هزینهای دریافت نمیکنند و اگر هزینه هم باشد در حد ارائه خدماتی مثل پرینت و کپی و هزینههای مختصری از این این دست میگیرند که در اصل پول همان موادی است که استفاده شده است و رویکرد اتنفاعی ندارند. همانطور که گفتیم در مارکتینگ، استفاده از چکیدهها و توصیفات خیلی موثر و مناسب است و خیلی به کاربران در جذب کمک میکند. مثل خرید یا استفاده از منبع و مطالعه آن. اگر بخواهیم با رویکرد جدید نگاه کنیم و کارکردپذیری چکیدهها را بررسی کنیم، مهمترین کاربردی که در چکیدهها وجود داشته، اگر با استانداردهای جدید بگوییم و با مفاهیم جدید تطابق بدهیم، کارکرد اصلی چکیدهها to identify میشود یعنی شناسایی. چرا که اطلاعاتی اضافی در خصوص منبع ارائه میدهند و باعث میشوند که شخص شناخت بیشتری پیدا کند. اگرچه ما چکیده را در رویکرد جدید به عنوان یک عنصر فرادادهای میبینیم. پیشتر چکیدهها همانند TOC (table of contents) یا فهرست مندرجات بودند. اینها به عنوان attachment، company material یا مطالب همراه متادیتا بودند، نه بهعنوان عنصری از متادیتا و آمده بودند که متادیتا را غنیسازی کنند و کمک کنند که آن متادیتا کارآیی بیشتری داشته باشد، غنای بیشتری داشته باشد و بیشتر به کاربر کمک کند که کاربر در مورد آن منبع تصمیم بگیرد که بخرد، بخواند، دانلود کند یا منتقل کند. اما جالب این است که در استانداردهای جدید چکیده دیگر بهعنوانattachment نیستند و عنصری از متادیتا هستند و بررسیها نشان داده که میتوانند بخشی از متادیتا باشند و کارکردهای متادیتا را کامل کنند که متادیتا بتواند هم کارکرد توصیفی داشته باشد و هم مدیریتی و بتواند نقش بهتری را ایفا کند برای تصمیمگیری کاربر در مورد منبع. این نکته یکی از تأثیراتی است که محیط جدید گذاشته و نشان میدهد که چکیده و توصیفگر و ... میتوانند یک عنصر یا پراپرتی از یک شیء باشند و در دل متادیتا قرار بگیرند و متادیتا فقط شامل اطلاعات کتابشناختی، about، subject، و ... نباشد و بتواند to identify و to select و ... را هم ساپورت کند. مهمترین کاربرد چکیده to identify است، یعنی شناسایی کردن. شناسایی اگر خاطرتان باشد دومین کارکرد در user tasks ها است که در مدلهای مفهومی به کار میروند. یعنی اول fined است که متادیتا کمک میکند تا ما دیتا را پیدا کنیم و در دومین مرحله شناسایی یا to identify کنیم. این برای محیط جدید، ابزارهایی مثل چکیدهها و ... و به هر شکلی که باشد، نقش بهتر و برجستهتری نسبت به گذشته دارد. چرا که الان حجم دادهها بیشتر است. وقتی در نظامهای ذخیره و بازیابی اطلاعات جستجو انجام میدهیم، حجم بالایی از دیتا برای ما بازیابی میشود. در این قسمت نقش شناسایی یا to identify پررنگتر و بولدتر میشود به دلیل اینکه قبلاً منابع کمتر بودند و ما میتوانستیم مروری روی آن داشته باشیم و زمان کمتری از ما میگرفت و کاملاً بدیهی است که الان که حجم دیتا بالا هست، کاربر برای اینکه ببیند منابع بازیابی شده، چقدر با نگرش او تطابق دارد، نیاز به شناسایی دارد. اینجاست که چکیده اهمیت پیدا میکند، یعنی شما مجبوری که در هر سیستم بازیابی اطلاعات، افزون بر اینکه یک سری اطلاعاتی مثل اطلاعات کتابشناختی را برای یوزر قابل دسترس کنید، حتماً از توصیف و چکیده هم استفاده کنید. یعنی این اِلِمانها به شناسایی کمک میکنند و الان اهمیت شناسایی به دلیل حجم بالای دادههای بازیابی شده، از گذشته بیشتر است.
نکته دیگری که باید اضافه کنم بحث user orientation است. در حال حاضر بیشتر سیستمها تلاش میکنند که کاربرمداری بیشتری داشته باشند و بیشتر روی نیاز کاربران متمرکز شوند و بحثهای شخصیسازی خدمات و personalization که کم و بیش دوستان آشنایی دارند. این بحثها ناشی از رویکرد کاربرمدار است و تمرکز روی end user است که یوزر بتواند از دادهها حداکثر بهروری را داشته باشد و کار یوزر تسهیل شود. به این دلیل که ما یک سری syntax داریم که سعی کردهاند ماشینخوان و ماشینفهم باشند، مثل جیسان که ویژگی مهم آن این است که علاوه بر ماشینخوان بودن، human readable هم هست، یعنی انسان هم راحتتر با جیسان ارتباط برقرار میکند نسبت به XML و HTMLو ... یعنی مقداری user oriented هم شده است. به این معنا که هدف این بوده که قبل از syntax هایی که ماهیت end-coding داشتند، تمرکزشان بیشتر بر این بود که ماشینخوان و ماشینفهم باشند، اما کمکم به این سمت آمدند که باید انسان هم این markup language را بفهمد و باعث درک بیشتر انسان از markup language شود. جیسان و ... syntax هایی هستند که انسان هم راحتتر آنها را متوجه میشود، این رویکرد خیلی جالب است. این را روی اهمیت چکیدهها تعمیم میدهیم. چکیدهها یا رویکردهای دیگر مثل nlp یا text mining که مبتنی بر nlp است و الان خیلی مطرح است، همه اینها نشان میدهد که user orientation امروزه بسیار مهم است و میخواهند که به یوزر نزدیک شوند. بحث اینجاست که چکیدهها چون زبان طبیعی هستند، مثل نمایههایی که وارد زبان طبیعی شدهاند، مقداری برای انسان قابل فهمترند و برای end user قابل استفادهترند و وقتی در زبان طبیعی هستند، بهتر درک میشوند. چون با زبان طبیعی یعنی زبانی که کاربر برای ارتباطش با دیگران استفاده میکند، نزدیکتر هستند. بنابراین از دو بعد مفید هستند، بهغیر از اینکه کارکرد to identify را ساپورت میکنند و خیلی کمککننده است، بخصوص زمانی که حجم دادههای بازیابی شده زیاد است؛ الان هم در عصری هستیم که سیستمهای بازیابی گسترش پیدا کردهاند. این حجم از دیتا نیاز دارد به ابزارهایی که کمک کنند به شناسایی منابع بازیابی شده که آیا مفید هستند یا خیر. توصیفات مختصری که گوگل در زمان سرچ نشان میدهد، که اصطلاحاً استخراج خودکار هستند، چیزی که باعث میشود کاربر روی رکوردهای بازیابی شده، تمرکز کند و آن را باز کند، همان توصیف مختصر است. این description بسیار ارزشمند است، چون کمک میکند که یوزر روی آن رکورد کلیک کند. این اهمیت description را نشان میدهد. آیا میتوانیم بگوییم که این description یک نوع چکیده است؟ در استاندارد ایزو214 چنین چیزی نیست چون extract را از چکیده جدا میکند. اما در رویکرد جدید بله میتوانیم، به ویژه اینکه ماشین به صورت خودکار این description را ایجاد کند. از طرفی میتواند عامل انسانی آن را تهیه کند، یعنی شخص از متن جملاتی را انتخاب کند و در کنار هم قرار دهد و چکیده درست کند.
نکته:
در متن استاندارد، بین summery، extract، abstract و annotation تفاوت قائل شد. پس استاندارد، extract را یک چکیده نمیداند، در حالی که گفتیم یک نوع چکیده وجود دارد به نام extracted abstract یا چکیده برهیخته. (چکیدهای که از خود متن استخراج میشود و جملات در کنار هم قرار میگیرند و چکیده ساخته میشود.)
یکی از تفاوتها این است که واژه چکیده انواع بیشتری را در بر میگیرد. انواع چکیدهها نشان میدهد که این دامنه چقدر تغییر کرده و گسترش داشته است.
چیزی که به یوزر خیلی کمک میکند، همان توصیف است. چرا که وقتی توصیف را میخواند تصمیم میگیرد که کلیک کند یا نه. همین توصیف است که مشخص میکند که آیا منبعی که بازیابی شده مرتبط با نیاز اطلاعاتی یوزر هست یا خیر. این توصیف بحث relevance را ساپورت میکند و بسیار به تصمیمگیری کاربر کمک میکند.
به تازگی رویکرد جدیدی بخصوص در امریکا ایجاد شده است، و آن اینکه زبان بسیار پویاست و در جامعه مهاجرپذیری مثل امریکا که افراد با ساختارهای زبانشناختی بومی خود وارد میشوند و درکی از زبان انگلیسی دارند و قطعاً درکشان با یک بومی امریکایی متفاوت است و برای یادگیری زبان انگلیسی به مشکل برمیخورند و این تطابق کامل انجام نمیشود. اینها باعث میشوند که زبان انگلیسی آنها نسبت به زبان انگلیسی خالص تفاوت پیدا کند و الان به شکلی شده که در جامعه امریکا میگویند که مخاطب باید زبان تو را بفهمد، در حالی که خیلی مهم نیست که از واژههای بومی و اصیل استفاده کنید و یا گرامر را درست به کار برید! همین که بتوانید با یکدیگر ارتباط برقرار کنید، کافی است. کسانی که در انگلیس زندگی میکنند بخصوص آنها که در آکسفورد که اصل زبان انگلیسی است، زندگی میکنند، همیشه این بحث را دارند که زبان امریکایی یک زبان انگلیسی دقیق نیست به دلیل اینکه در آن خیلی تحول ایجاد شده و تغییر کرده و خیلی متفاوت شده و دلیل آن این است که مهاجر خیلی به امریکا وارد شده و با زبانهایی با ساختارهای مختلف صحبت کردهاند و عقیده بر این بوده که فقط منظور را به یکدیگر بفهمانید. این عقیده را در چکیدهها هم میبینیم که کارکرد یا function چکیدهها مورد توجه قرار میگیرد تا ساختار آنها و مرزبندیها و دامنههای قراردادی. البته تفاوتهایی بین چکیده و سامری و ... وجود دارد و تا حدودی به آن تفاوتها توجه میشود. الان انواع مختلف چکیده را داریم که خیلی از آنها با سامری و ... همپوشانی دارند. در حال حاضر میگویند که چکیده یک نوع سامری ساختارمند و هدفمند است.
منظور از چکیده در متن استاندارد هم الان خیلی تغییر کرده با چیزی که در محیطهای علمی به عنوان چکیده شناخته میشود؛ به عبارت دیگر مفهوم امروزی چکیده خیلی گستردهتر از چیزی است که در متن استاندارد گفته شده.
نکته دیگر اینکه تحولاتی که در حوزه فناوریها صورت گرفته، بیشتر روی محملهای اطلاعاتی (information carrier ) و رسانههای اطلاعاتی (information media) است؛ یعنی ما این تحولات را روی محملها میبینیم تا روی محتوا. محتوا چون ماهیت انتزاعی دارد و از ذهن پیروی میکند، همان روند را طی کرده است. البته این به آن معنا نیست که این تحولات هیچ تأثیری روی محتوا نگذاشته، ولی تأثیر کمتری داشته است. چرا که محتوا از یک اصول و نظاممندی خاصی تبعیت میکند، چیزی که تغییر زیادی کرده، فناوریهاست؛ با تغییر فناوریها، محیط، محملها و رسانههای اطلاعاتی تغییر کردند. زمانی که محیط تغییر میکند، قطعاً شکل خدمات هم تغییر خواهد کرد و خود بخود تأثیر خواهد داشت و الان شکلهای بیشتری از بروندادهای علمی داریم و با افزودن اینها قطعاً روی مفهوم چکیده هم اثر میگذارند.
نکته دیگر اینکه علاوه بر اینکه چکیدهها (to identify) را مثل گذشته ولی با اهمیت بیشتری پشتیبانی میکنند، روی انتخاب (select) هم تأثیر زیادی دارند. منابع مرتبط با نیاز اطلاعاتی خود را از طریق چکیده شناسایی کردهایم، اما آیا از همه این منابع شناسایی شده میتوان استفاده کرد؟ آیا زمان استفاده از همه این منابع شناسایی شده را داریم؟ مسلماً خیر. در اینجا به ناچار باید دست به انتخاب بزنیم، با معیارهای مختلف؛ چکیدهها به دلیل نوع محتوایی که ارائه میدهند، به دلیل ساختارها و انواع مختلفی که دارند، به کاربر نهایی کمک میکنند که دست به انتخاب بزند. مثلاً در چکیده تمامنما که معمولاً برای گزارشهای پژوهشی مثل پایاننامهها، مونوگرافها، مقالات پژوهشی و ... تهیه میشوند، میتواند برای پژوهشگری که در حال تهیه مقاله مروری است، در تصمیمگیری، کمککننده باشد. در این زمان به دلیل حجم بالای اطلاعات این دو کارکرد چکیدهها بسیار با اهمیت شدهاند.
نکته بعدی درباره کارکرد (to find) است که آن هم توسط چکیدهها پشتیبانی میشود، به چند دلیل: یکی اینکه چکیده خود به عنوان متادیتا-پراپرتی استفاده میشود، در حالی که متادیتا یکی از مهمترین ابزارهای مدیریت اطلاعات از جمله بازیابی دادههاست، بنابراین کاملاً توسط ماشین ایندکس میشود و کاملاً کاربرد (to find) دارد. یعنی چکیده به عنوان متادیتا-پراپرتی ایندکس میشوند و محتوای آن باعث بازیابی محتوا یا اشیاء مرتبط با آن متادیتا هستند. دوم اینکه مبنای نمایههاست، یکی از مهمترین بخشهای یک شیء یا منبع که برای نمایهسازی یا انتخاب اصطلاحات نمایهای، استفاده میشود، چکیدهها هستند؛ یعنی با این بحث که همان اصطلاحات نمایهای که در زبان طبیعی پیاده شده و حروف ربط و اضافه و فعل و ... دارد، و از طرف دیگر چکیدههایی داریم که تلگرافی هستند و فعلها و حروف ربط و اضافه آنها حذف شده و یک سری اسم و عبارت اسمی مانده، همین، منبع بسیار مناسبی برای نمایهسازی است و باعث بازیابی متن میشوند. این نشان میدهد که چکیدهها کاربردپذیری زیادی دارند.
نکته سوم، automatic extraction یا چکیدههای خودکار هستند. در حال حاضر چکیدههای خودکار داریم، یعنی چکیدهای که مبتنی بر استخراج خودکار است. ما همین مدل را در نمایهسازی نیز داریم، (automatic extraction indexing) نمایهسازی استخراجی خودکار. مهمترین نوع نمایهسازی که در موتورهای کاوش و دیتابیسها میبینیم، همین نوع است. هر چیزی که ایندکس شده باشد، سرچ میشود، بنابراین چکیدهها به دلیل اینکه استخراج میشوند و بخشی از محتوا هستند، بنابراین برای بازیابی، بسیار مناسب هستند؛ یعنی (to find) را هم به خوبی پشتیبانی میکنند. در واقع این سه کارکرد را چکیدهها به خوبی پشتیبانی میکنند و اهمیتشان هم از گذشته بیشتر است.
در قسمتی از متن اصلی استاندارد، بحث style مطرح شده است. همانطور که قبلاً هم گفتیم، چیزی که بسیار در چکیده مهم است، سبک و style است. در این قسمت گفته میشود که معمولاً چکیدهها با یک جمله موضوعی یا (topic sentence) آغاز میشود؛ جمله موضوعی یعنی جملهای که موضوع آن محتوا را نشان دهد. تحقیقات نشان میدهد بیش از 80 درصد جملههای موضوعی اولین جمله پاراگراف هستند. و حدود 10 درصد هم جملات آخر هستند. یا جملاتی که در آنها یک سری از حروف بولد یا ایتالیک شدهاند. معمولاً جملات موضوعی اول پاراگراف میآیند و بیانگر توضیحی درباره محتوای پاراگراف هستند و موضوع اصلی را بیان میکنند، بقیه جملات را جملات پشتیبان یا (supporter) میگویند.
نکته:
الان بین summery و چکیده تفاوت قائل نمیشوند، اما summery که استایل و ساختار داشته باشد و هدفمند باشد را چکیده میگویند. بنابراین style در چکیدهها بسیار مهم است. چون چکیده را از معرفیهای دیگر متمایز می کند. به طور مثال معرفیهایی که در سایتهای مختلف ارائه میشوند، چکیده به حساب نمیآیند چون استایل ندارند و در اصل یک نوع annotation هستند.
نکته:
اگر در عنوان، موضوع محتوا گنجانده نشده بود و نتوانستیم در عنوان سند، بخوبی موضوع اصلی محتوا را نشان دهیم، میتوانیم با یک جمله که (topic sentence) است، شروع کنیم که کار عنوان را انجام دهد و موضوع محتوا را بیان کند. برخی عقیده دارند که چکیده را باید با این جمله شروع کنند که صحیح نیست. ما زمانی میتوانیم از جمله (topic sentence) استفاده کنیم و به کار ببریم که عنوان، محتوانما نباشد. وقتی شما گزارش پژوهشی نوشتهاید، حتماً عنوان، محتوانما خواهد بود. بیشترین کاربرد (topic sentence) در چکیدههای راهنماست که ممکن است برای منابع مختلف تهیه شود. وگرنه در بروندادهای علمی به اجبار باید از عنوانهای مناسب محتوانما استفاده کنید. اما ممکن است در چکیده از عنوان فرعی استفاده شود،
در متون علمی اجازه نمیدهند که جای عنوان مبهم از (topic sentence) استفاده کنید، بنابراین (topic sentence) کاربرد کمی دارد و فقط در شرایط خاصی به کار می رود.
در بخش دیگری از این متن بیان میکند که اگر این چکیدهها برای کاربردهای ثانویه و برای خدماتی مثل استفاده در دیتابیسهای چکیده استفاده شوند، اگر نوع منبع در خود منبع تعیین نشده است، باید شما تعیین کنید. یا اگر رویکرد و نقطهنظر نویسنده بیان نشده، باید در چکیده به آن اشاره شود...
ادامه مباحث در جلسات آینده بیان خواهد شد.
تهیه و تنظیم گزارش:
بنت الهدی موحدی محب