جلسه شانزدهم دوره جامع نمایه‌سازی و چکیده‌نویسی: استاندارد چکیده‌نویسی ایزو214 (3)

چکیده و توصیفگر و ... می‌توانند یک عنصر یا پراپرتی از یک شیء باشند و در دل متادیتا قرار بگیرند و متادیتا فقط شامل اطلاعات کتابشناختی، about، subject، و ... نباشد و بتواند to identify و to select و ... را هم ساپورت کند. مهمترین کاربرد چکیده to identify است، یعنی شناسایی کردن.

بسم الله الرحمن الرحیم

شانزدهمین جلسه از «دوره جامع نمایه‌سازی و چکیده‌نویسی» از سری جلسات دورهمی علمی کتابداران که هر هفته به همت کتابخانه آیت‌الله العظمی بروجردی و با تدریس دکتر سیدمهدی طاهری دانشیار گروه علم اطلاعات و دانش‌شناسی دانشگاه علامه طباطبایی برگزار می‌گردد، در روز پنجشنبه 13بهمن ماه 1401 به صورت مجازی تشکیل شد.

ابتدای این جلسه با طرح سوالی آغاز گردید:

با توجه به قدیمی بودن استاندارد، خیلی از محیطها را درک نکرده و همین باعث گردیده که مثالها قدیمی باشند و امروزه متداول نیستند، و این روی کاربردپذیری متن استاندارد تأثیرگذار است. اگرچه از لحاظ توضیح در مورد ساختار چکیده ها و تفاوت آن با دیگر شکلهایی که محتوا را بازنمون می‌کنند، خوب کار کرده و نکات جالبی را بیان نموده است. البته از نظر مفهومی تفاوهایی وجود دارد ولی در کل خوب است، منتها می‌خواهیم که روی محتوای استاندارد نسبت به محیط جدید و تحولات امروز داشته باشیم، که چه اندازه این محتوا با تحولات روز مرتبط است و چقدر قابل استفاده است؟ آیا این تحولات تأثیری روی محتوا نداشته اند؟ و آیا هنوز هم این متن استاندارد قابل استفاده است؟

در پاسخ، سرکار خانم طباطبایی دانشجوی دکترای علم اطلاعات و دانش شناسی دانشگاه شهید چمران اهواز گفتند: با توجه به متن استاندارد و کاربردپذیری آن که باید دقت نظر بیشتری شود، با توجه به مطالعه ای که اخیراً روی اسکیما داشتم، یکی از عناصری که به چشم می آید، و بسیار برجسته شده، روی عنصر description و عنصر چکیده و خلاصه ای که از مطالب و محتواهای اشیاء دیجیتالی ارائه می شود، و تأثیری که روی بازاریابی الکترونیکی و میزان فروش دارند، خیلی تأکید شده است. حتی قبل از اینکه بخواهند سایر عناصر فراداده ای را در نظر بگیرند و درمورد اهمیت آن صحبت کنند، بیشتر مقالات روی کلیدواژه، چکیده و description تأکید ویژه‌ای دارند و اکثراً با این دو عنصر بحث خود را شروع می‌کنند. با مطالبی هم که در جلسات اخیر گفته شده، عناصر دیگری مثل خلاصه ها و annotation و ... و تفاوت آنها با چکیده مطرح شد، به این نتیجه رسیدیم که در حال حاضر مباحث زیربنایی که این متن استاندارد ارائه می کند، هنوز می تواند مورد استفاده باشد و نه تنها می تواند کاربرد داشته باشد، بلکه بسیار هم حائر اهمیت است و ما باید آن ساختاری که برای نوشتن همه عناصری که در بازیابی، رویت پذیری، فروش و همه مباحثی که امروزه مطرح است، را رعایت کنیم و همه اینها می تواند کمک کننده باشد که بدانیم با چه ویژگی هایی این عنصر فراداده ای را بازنمون کنیم و مزایای دیگری که در ادامه خواهند داشت.

در ادامه دکتر طاهری مدرس کارگاه ضمن تأیید صحبتهای خانم طباطبایی افزودند: پاسخ ایشان بیشتر به بخش دوم سوال برمی گشت که چقدر در رخدادهای جدید، چکیده‌ها کاربردپذیر هستند؟ که توضیح خواهیم داد و روی آن بحث خواهیم کرد.

نکته مهمی را اشاره کردند که بحث مارکتینگ را مطرح نمودند. موضوع ایشان در حوزه نشر و اسکیما دات اورگ است که کار غنی‌سازی این استاندارد را در حوزه نشر انجام می‌دهند که چگونه این استاندارد می‌تواند useability را در حوزه نشر افزایش دهد و چطور می‌توان از این استاندارد در حوزه نشر استفاده نمود.

ما اگر مارکتینگ را در حوزه نشر در نظر بگیریم برای فروش محصولاتی مثل کتاب و تولیدات دیگر، همانطور که می‌دانید در کتابخانه‌ها هم ما بحث مارکتینگ را داریم که اگر کاربر ما از کتابها استفاده کند، ما سود کرده‌ایم و سود، فقط مادی نیست، چرا که کتابخانه‌ها هزینه‌ای دریافت نمی‌کنند و اگر هزینه هم باشد در حد ارائه خدماتی مثل پرینت و کپی و هزینه‌های مختصری از این این دست می‌گیرند که در اصل پول همان موادی است که استفاده شده است و رویکرد اتنفاعی ندارند. همانطور که گفتیم در مارکتینگ، استفاده از چکیده‌ها و توصیفات خیلی موثر و مناسب است و خیلی به کاربران در جذب کمک می‌کند. مثل خرید یا استفاده از منبع و مطالعه آن. اگر بخواهیم با رویکرد جدید نگاه کنیم و کارکردپذیری چکیده‌ها را بررسی کنیم، مهمترین کاربردی که در چکیده‌ها وجود داشته، اگر با استانداردهای جدید بگوییم و با مفاهیم جدید تطابق بدهیم، کارکرد اصلی چکیده‌ها to identify می‌شود یعنی شناسایی. چرا که اطلاعاتی اضافی در خصوص منبع ارائه می‌دهند و باعث می‌شوند که شخص شناخت بیشتری پیدا کند. اگرچه ما چکیده را در رویکرد جدید به عنوان یک عنصر فراداده‌ای می‌بینیم. پیشتر چکیده‌ها همانند TOC (table of contents) یا فهرست مندرجات بودند. اینها به عنوان attachment، company material یا مطالب همراه متادیتا بودند، نه به‌عنوان عنصری از متادیتا و آمده بودند که متادیتا را غنی‌سازی کنند و کمک کنند که آن متادیتا کارآیی بیشتری داشته باشد، غنای بیشتری داشته باشد و بیشتر به کاربر کمک کند که کاربر در مورد آن منبع تصمیم بگیرد که بخرد، بخواند، دانلود کند یا منتقل کند. اما جالب این است که در استانداردهای جدید چکیده دیگر به‌عنوانattachment نیستند و عنصری از متادیتا هستند و بررسی‌ها نشان داده که می‌توانند بخشی از متادیتا باشند و کارکردهای متادیتا را کامل کنند که متادیتا بتواند هم کارکرد توصیفی داشته باشد و هم مدیریتی و بتواند نقش بهتری را ایفا کند برای تصمیم‌گیری کاربر در مورد منبع. این نکته یکی از تأثیراتی است که محیط جدید گذاشته و نشان می‌دهد که چکیده و توصیفگر و ... می‌توانند یک عنصر یا پراپرتی از یک شیء باشند و در دل متادیتا قرار بگیرند و متادیتا فقط شامل اطلاعات کتابشناختی، about، subject، و ... نباشد و بتواند to identify و to select و ... را هم ساپورت کند. مهمترین کاربرد چکیده to identify است، یعنی شناسایی کردن. شناسایی اگر خاطرتان باشد دومین کارکرد در user tasks ها است که در مدلهای مفهومی به کار می‌روند. یعنی اول fined است که متادیتا کمک می‌کند تا ما دیتا را پیدا کنیم و در دومین مرحله شناسایی یا to identify کنیم. این برای محیط جدید، ابزارهایی مثل چکیده‌ها و ... و به هر شکلی که باشد، نقش بهتر و برجسته‌تری نسبت به گذشته دارد. چرا که الان حجم داده‌ها بیشتر است. وقتی در نظامهای ذخیره و بازیابی اطلاعات جستجو انجام می‌دهیم، حجم بالایی از دیتا برای ما بازیابی می‌شود. در این قسمت نقش شناسایی یا to identify پررنگتر و بولدتر می‌شود به دلیل اینکه قبلاً منابع کمتر بودند و ما می‌توانستیم مروری روی آن داشته باشیم و زمان کمتری از ما می‌گرفت و کاملاً بدیهی است که الان که حجم دیتا بالا هست، کاربر برای اینکه ببیند منابع بازیابی شده، چقدر با نگرش او تطابق دارد، نیاز به شناسایی دارد. اینجاست که چکیده اهمیت پیدا می‌کند، یعنی شما مجبوری که در هر سیستم بازیابی اطلاعات، افزون بر اینکه یک سری اطلاعاتی مثل اطلاعات کتابشناختی را برای یوزر قابل دسترس کنید، حتماً از توصیف و چکیده هم استفاده کنید. یعنی این اِلِمان‌ها به شناسایی کمک می‌کنند و الان اهمیت شناسایی به دلیل حجم بالای داده‌های بازیابی شده، از گذشته بیشتر است.

نکته دیگری که باید اضافه کنم بحث user orientation است. در حال حاضر بیشتر سیستم‌ها تلاش می‌کنند که کاربرمداری بیشتری داشته باشند و بیشتر روی نیاز کاربران متمرکز شوند و بحثهای شخصی‌سازی خدمات و personalization که کم و بیش دوستان آشنایی دارند. این بحثها ناشی از رویکرد کاربرمدار است و تمرکز روی end user است که یوزر بتواند از داده‌ها حداکثر بهروری را داشته باشد و کار یوزر تسهیل شود. به این دلیل که ما یک سری syntax داریم که سعی کرده‌اند ماشین‌خوان و ماشین‌فهم باشند، مثل جیسان که ویژگی مهم آن این است که علاوه بر ماشین‌خوان بودن، human readable هم هست، یعنی انسان هم راحت‌تر با جیسان ارتباط برقرار می‌کند نسبت به XML و HTMLو ... یعنی مقداری user oriented هم شده است. به این معنا که هدف این بوده که قبل از syntax هایی که ماهیت end-coding داشتند، تمرکزشان بیشتر بر این بود که ماشین‌خوان و ماشین‌فهم باشند، اما کم‌کم به این سمت آمدند که باید انسان هم این markup language را بفهمد و باعث درک بیشتر انسان از markup language شود. جیسان و ... syntax هایی هستند که انسان هم راحت‌تر آنها را متوجه می‌شود، این رویکرد خیلی جالب است. این را روی اهمیت چکیده‌ها تعمیم می‌دهیم. چکیده‌ها یا رویکردهای دیگر مثل nlp یا text mining که مبتنی بر nlp است و الان خیلی مطرح است، همه اینها نشان می‌دهد که user orientation امروزه بسیار مهم است و می‌خواهند که به یوزر نزدیک شوند. بحث اینجاست که چکیده‌ها چون زبان طبیعی هستند، مثل نمایه‌هایی که وارد زبان طبیعی شده‌اند، مقداری برای انسان قابل فهم‌ترند و برای end user قابل استفاده‌ترند و وقتی در زبان طبیعی هستند، بهتر درک می‌شوند. چون با زبان طبیعی یعنی زبانی که کاربر برای ارتباطش با دیگران استفاده می‌کند، نزدیک‌تر هستند. بنابراین از دو بعد مفید هستند، به‌غیر از اینکه کارکرد to identify را ساپورت می‌کنند و خیلی کمک‌کننده است، بخصوص زمانی که حجم داده‌های بازیابی شده زیاد است؛ الان هم در عصری هستیم که سیستم‌های بازیابی گسترش پیدا کرده‌اند. این حجم از دیتا نیاز دارد به ابزارهایی که کمک کنند به شناسایی منابع بازیابی شده که آیا مفید هستند یا خیر. توصیفات مختصری که گوگل در زمان سرچ نشان می‌دهد، که اصطلاحاً استخراج خودکار هستند، چیزی که باعث می‌شود کاربر روی رکوردهای بازیابی شده، تمرکز کند و آن را باز کند، همان توصیف مختصر است. این description بسیار ارزشمند است، چون کمک می‌کند که یوزر روی آن رکورد کلیک کند. این اهمیت description را نشان می‌دهد. آیا می‌توانیم بگوییم که این description یک نوع چکیده است؟ در استاندارد ایزو214 چنین چیزی نیست چون extract را از چکیده جدا می‌کند. اما در رویکرد جدید بله می‌توانیم، به ویژه اینکه ماشین به صورت خودکار این description را ایجاد کند. از طرفی می‌تواند عامل انسانی آن را تهیه کند، یعنی شخص از متن جملاتی را انتخاب کند و در کنار هم قرار دهد و چکیده درست کند.

نکته:

در متن استاندارد، بین summery، extract، abstract و annotation تفاوت قائل شد. پس استاندارد، extract را یک چکیده نمی‌داند، در حالی که گفتیم یک نوع چکیده وجود دارد به نام extracted abstract یا چکیده برهیخته. (چکیده‌ای که از خود متن استخراج می‌شود و جملات در کنار هم قرار می‌گیرند و چکیده ساخته می‌شود.)

یکی از تفاوتها این است که واژه چکیده انواع بیشتری را در بر می‌گیرد. انواع چکیده‌ها نشان می‌دهد که این دامنه چقدر تغییر کرده و گسترش داشته است.

چیزی که به یوزر خیلی کمک می‌کند، همان توصیف است. چرا که وقتی توصیف را می‌خواند تصمیم می‌گیرد که کلیک کند یا نه. همین توصیف است که مشخص می‌کند که آیا منبعی که بازیابی شده مرتبط با نیاز اطلاعاتی یوزر هست یا خیر. این توصیف بحث relevance را ساپورت می‌کند و بسیار به تصمیم‌گیری کاربر کمک می‌کند.

به تازگی رویکرد جدیدی بخصوص در امریکا ایجاد شده است، و آن اینکه زبان بسیار پویاست و در جامعه مهاجرپذیری مثل امریکا که افراد با ساختارهای زبانشناختی بومی خود وارد می‌شوند و درکی از زبان انگلیسی دارند و قطعاً درکشان با یک بومی امریکایی متفاوت است و برای یادگیری زبان انگلیسی به مشکل برمی‌خورند و این تطابق کامل انجام نمی‌شود. اینها باعث می‌شوند که زبان انگلیسی آنها نسبت به زبان انگلیسی خالص تفاوت پیدا کند و الان به شکلی شده که در جامعه امریکا می‌گویند که مخاطب باید زبان تو را بفهمد، در حالی که خیلی مهم نیست که از واژه‌های بومی و اصیل استفاده کنید و یا گرامر را درست به کار برید! همین که بتوانید با یکدیگر ارتباط برقرار کنید، کافی است. کسانی که در انگلیس زندگی می‌کنند بخصوص آنها که در آکسفورد که اصل زبان انگلیسی است، زندگی می‌کنند، همیشه این بحث را دارند که زبان امریکایی یک زبان انگلیسی دقیق نیست به دلیل اینکه در آن خیلی تحول ایجاد شده و تغییر کرده و خیلی متفاوت شده و دلیل آن این است که مهاجر خیلی به امریکا وارد شده و با زبانهایی با ساختارهای مختلف صحبت کرده‌اند و عقیده بر این بوده که فقط منظور را به یکدیگر بفهمانید. این عقیده را در چکیده‌ها هم می‌بینیم که کارکرد یا function چکیده‌ها مورد توجه قرار می‌گیرد تا ساختار آنها و مرزبندی‌ها و دامنه‌های قراردادی. البته تفاوتهایی بین چکیده و سامری و ... وجود دارد و تا حدودی به آن تفاوتها توجه می‌شود. الان انواع مختلف چکیده را داریم که خیلی از آنها با سامری و ... همپوشانی دارند. در حال حاضر می‌گویند که چکیده یک نوع سامری ساختارمند و هدفمند است.

منظور از چکیده در متن استاندارد هم الان خیلی تغییر کرده با چیزی که در محیطهای علمی به عنوان چکیده شناخته می‌شود؛ به عبارت دیگر مفهوم امروزی چکیده خیلی گسترده‌تر از چیزی است که در متن استاندارد گفته شده.

نکته دیگر اینکه تحولاتی که در حوزه فناوری‌ها صورت گرفته، بیشتر روی محملهای اطلاعاتی (information carrier ) و رسانه‌های اطلاعاتی (information media) است؛ یعنی ما این تحولات را روی محملها می‌بینیم تا روی محتوا. محتوا چون ماهیت انتزاعی دارد و از ذهن پیروی می‌کند، همان روند را طی کرده است. البته این به آن معنا نیست که این تحولات هیچ تأثیری روی محتوا نگذاشته، ولی تأثیر کمتری داشته است. چرا که محتوا از یک اصول و نظام‌مندی خاصی تبعیت می‌کند، چیزی که تغییر زیادی کرده، فناوری‌هاست؛ با تغییر فناوری‌ها، محیط، محملها و رسانه‌های اطلاعاتی تغییر کردند. زمانی که محیط تغییر می‌کند، قطعاً شکل خدمات هم تغییر خواهد کرد و خود بخود تأثیر خواهد داشت و الان شکلهای بیشتری از بروندادهای علمی داریم و با افزودن اینها قطعاً روی مفهوم چکیده هم اثر می‌گذارند.

نکته دیگر اینکه علاوه بر اینکه چکیده‌ها (to identify) را مثل گذشته ولی با اهمیت بیشتری پشتیبانی می‌کنند، روی انتخاب (select) هم تأثیر زیادی دارند. منابع مرتبط با نیاز اطلاعاتی خود را از طریق چکیده شناسایی کرده‌ایم، اما آیا از همه این منابع شناسایی شده می‌توان استفاده کرد؟ آیا زمان استفاده از همه این منابع شناسایی شده را داریم؟ مسلماً خیر. در اینجا به ناچار باید دست به انتخاب بزنیم، با معیارهای مختلف؛ چکیده‌ها به دلیل نوع محتوایی که ارائه می‌دهند، به دلیل ساختارها و انواع مختلفی که دارند، به کاربر نهایی کمک می‌کنند که دست به انتخاب بزند. مثلاً در چکیده تمام‌نما که معمولاً برای گزارشهای پژوهشی مثل پایان‌نامه‌ها، مونوگرافها، مقالات پژوهشی و ... تهیه می‌شوند، می‌تواند برای پژوهشگری که در حال تهیه مقاله مروری است، در تصمیم‌گیری، کمک‌کننده باشد. در این زمان به دلیل حجم بالای اطلاعات این دو کارکرد چکیده‌ها بسیار با اهمیت شده‌اند.

نکته بعدی درباره کارکرد (to find) است که آن هم توسط چکیده‌ها پشتیبانی می‌شود، به چند دلیل: یکی اینکه چکیده خود به عنوان متادیتا-پراپرتی استفاده می‌شود، در حالی که متادیتا یکی از مهمترین ابزارهای مدیریت اطلاعات از جمله بازیابی داده‌هاست، بنابراین کاملاً توسط ماشین ایندکس می‌شود و کاملاً کاربرد (to find) دارد. یعنی چکیده به عنوان متادیتا-پراپرتی ایندکس می‌شوند و محتوای آن باعث بازیابی محتوا یا اشیاء مرتبط با آن متادیتا هستند. دوم اینکه مبنای نمایه‌هاست، یکی از مهمترین بخشهای یک شیء یا منبع که برای نمایه‌سازی یا انتخاب اصطلاحات نمایه‌ای، استفاده می‌شود، چکیده‌ها هستند؛ یعنی با این بحث که همان اصطلاحات نمایه‌ای که در زبان طبیعی پیاده شده و حروف ربط و اضافه و فعل و ... دارد، و از طرف دیگر چکیده‌هایی داریم که تلگرافی هستند و فعلها و حروف ربط و اضافه آنها حذف شده و یک سری اسم و عبارت اسمی مانده، همین، منبع بسیار مناسبی برای نمایه‌سازی است و باعث بازیابی متن می‌شوند. این نشان می‌دهد که چکیده‌ها کاربردپذیری زیادی دارند.

نکته سوم، automatic extraction یا چکیده‌های خودکار هستند. در حال حاضر چکیده‌های خودکار داریم، یعنی چکیده‌ای که مبتنی بر استخراج خودکار است. ما همین مدل را در نمایه‌سازی نیز داریم، (automatic extraction indexing) نمایه‌سازی استخراجی خودکار. مهمترین نوع نمایه‌سازی که در موتورهای کاوش و دیتابیس‌ها می‌بینیم، همین نوع است. هر چیزی که ایندکس شده باشد، سرچ می‌شود، بنابراین چکیده‌ها به دلیل اینکه استخراج می‌شوند و بخشی از محتوا هستند، بنابراین برای بازیابی، بسیار مناسب هستند؛ یعنی (to find) را هم به خوبی پشتیبانی می‌کنند. در واقع این سه کارکرد را چکیده‌ها به خوبی پشتیبانی می‌کنند و اهمیتشان هم از گذشته بیشتر است.

در قسمتی از متن اصلی استاندارد، بحث style مطرح شده است. همانطور که قبلاً هم گفتیم، چیزی که بسیار در چکیده مهم است، سبک و style است. در این قسمت گفته می‌شود که معمولاً چکیده‌ها با یک جمله موضوعی یا (topic sentence) آغاز می‌شود؛ جمله موضوعی یعنی جمله‌ای که موضوع آن محتوا را نشان دهد. تحقیقات نشان می‌دهد بیش از 80 درصد جمله‌های موضوعی اولین جمله پاراگراف هستند. و حدود 10 درصد هم جملات آخر هستند. یا جملاتی که در آنها یک سری از حروف بولد یا ایتالیک شده‌اند. معمولاً جملات موضوعی اول پاراگراف می‌آیند و بیانگر توضیحی درباره محتوای پاراگراف هستند و موضوع اصلی را بیان می‌کنند، بقیه جملات را جملات پشتیبان یا (supporter) می‌گویند.

نکته:

الان بین summery و چکیده تفاوت قائل نمی‌شوند، اما summery که استایل و ساختار داشته باشد و هدفمند باشد را چکیده می‌گویند. بنابراین style در چکیده‌ها بسیار مهم است. چون چکیده را از معرفی‌های دیگر متمایز می کند. به طور مثال معرفی‌هایی که در سایتهای مختلف ارائه می‌شوند، چکیده به حساب نمی‌آیند چون استایل ندارند و در اصل یک نوع annotation هستند.

نکته:

اگر در عنوان، موضوع محتوا گنجانده نشده بود و نتوانستیم در عنوان سند، بخوبی موضوع اصلی محتوا را نشان دهیم، می‌توانیم با یک جمله که (topic sentence) است، شروع کنیم که کار عنوان را انجام دهد و موضوع محتوا را بیان کند. برخی عقیده دارند که چکیده را باید با این جمله شروع کنند که صحیح نیست. ما زمانی می‌توانیم از جمله (topic sentence) استفاده کنیم و به کار ببریم که عنوان، محتوانما نباشد. وقتی شما گزارش پژوهشی نوشته‌اید، حتماً عنوان، محتوانما خواهد بود. بیشترین کاربرد (topic sentence) در چکیده‌های راهنماست که ممکن است برای منابع مختلف تهیه شود. وگرنه در بروندادهای علمی به اجبار باید از عنوانهای مناسب محتوانما استفاده کنید. اما ممکن است در چکیده از عنوان فرعی استفاده شود،

در متون علمی اجازه نمی‌دهند که جای عنوان مبهم از (topic sentence) استفاده کنید، بنابراین (topic sentence) کاربرد کمی دارد و فقط در شرایط خاصی به کار می رود.

در بخش دیگری از این متن بیان می‌کند که اگر این چکیده‌ها برای کاربردهای ثانویه و برای خدماتی مثل استفاده در دیتابیسهای چکیده استفاده شوند، اگر نوع منبع در خود منبع تعیین نشده است، باید شما تعیین کنید. یا اگر رویکرد و نقطه‌نظر نویسنده بیان نشده، باید در چکیده به آن اشاره شود...

ادامه مباحث در جلسات آینده بیان خواهد شد.

تهیه و تنظیم گزارش:

بنت الهدی موحدی محب

اخبار کتابخانه

جلسه شانزدهم دوره جامع نمایه‌سازی و چکیده‌نویسی: استاندارد چکیده‌نویسی ایزو214 (3)