![]()
مركز اطلاعات و مدارك علمي ايران
|
شماره چهارم دوره دوم |
بازگشت مجله الكترونيكي صفحه اصلي
|
كنترل مستند در يك مفهوم بين المللي در محيط جديد(1) |
Liv Aasa Holm
ترجمه: عبدالرسول خسروي
(دانشجوي كارشناسي ارشد كتابداري و اطلاع رساني پزشكي)
چكيده:
مقاله نتايج آزمون ناشي از پروژه هاي ONE را شرح مي دهدوازاحتمال افزايش دقت و
بازيابي از طريقZ39.50 و پروفايلهايش بحث مي كند.اين مقاله نتيجه مي گيرد كه كنترل
مستند درشبكه اي از سيستمها درمقايسه باسيستمهاي محلي اهميت بيشتري دارد.
1- تاريخچه
كنترل مستند نامها،عناوين وديگراصطلاحات مربوط به جستجو (search)هميشه در کار
کتابخانه حائزاهميت بودده اند.اماحفظ ونگهداري آن هميشه به عنوان يك مشخصه
پرهزينه مورد توجه قرار گرفته است.
درمجموعههاي كوچك،كنترل دقت و بازيابي بدون كنترل مستند امكان پذير است ، زيرا
كتابداران كم و بيش ميدانند که كداميک از مدارك رابايد درجستجو بازيابي نمود.
از طرف ديگر، در مجموعههاي بزرگ،كاربرممكن است نتايج بيشتري بگيردو درنتيجه
اگربازيابي پايين باشد، متوجه نشود. اما دقت پايين ممكن است كاربررا ناراحت سازد.
بنابراين كنترل مستند هميشه در مجموعههاي متوسط و بزرگ درمقايسه بامجموعه هاي کوچک
مهمتربوده است.
كامپيوتري شدن كاركردهاي كتابخانه بسياري از جنبه هاي کتابخانه اي نظير فهرستنويسي
، جستجووبازيابي ، كنترل امانت و غيره راتغيير داده است. استفاده از ارتباطات شبکه
اي نيز محيطي را که درآن از يك محيط محلي به يك محيط بين المللي ديگرعمل مي کنيم،
تغيير داده است.
مسائل فني در ارتباطات سيستمي كم و بيش حل شده است .اما امروزه كيفيت خدمات در
سيستم اطلاع رساني مجازي به اندازه کافي بالا نيست . پرسشي که مطرح ميشود اين است
که چگونه مي توانيم كيفيت به عنوان نمونه ، کيفيت نتايج جستجو را بالا ببريم.
در اين مقاله ابتدا نگاهي به مسائلي كه در پروژه ONE هنگام جستجوي پايگاههاي مختلف از
طريق شبكه با آنها مواجه شديم، خواهيم داشت وسپس شرح خواهم داد كه چگونه اين
مسائل را حل كرديم و چگونه مي توان مسائل ديگر را حل كرد.
2- مسائل جستجو در شبكهها ـ تجربياتي از ONE
در پروژه ONE ،ما جستجو و بازيابي در سيستمها راهم از طريق Z39.50 وهم ازطريق
ديگر شيوههاي ارتباطي نظير ارتباط dial_up و وب آزمايش كرديم. ما ميخواستيم بدانيم
که آيا جستجو و بازيابي مستقيم و يا از طريق Z39.50 نتيجه يكسان دارد. يك سلسله
موارد آزمايش مشخص كرديم و بيش از نيمي از آنها را در پروژه و خدمات آزمايشي
استفاده كرديم. نتايج جستجو متفاوت بود و آزمونها نشان داد که هم دقت و هم بازيابي در
دوره اول آزمايش پايين است. اين نتايج نشان داد كه ما نياز به يك پروفايل داريم .
پس از موافقت درمورد تنظيم يك پروفايل مشترك و اجراي آن ، بازيابي افزايش يافت.
زمانيكه از پروتكل Z39.50 استفاده كرديم هم دقت و هم بازيابي درمقايسه با ديگر انواع
ارتباط بهتر شدند ،ام ابا اين وجودهنوز هم كافي نبودند. چندين علت وجود داشت. برخي از
عوامل كه سبب كاهش شدند،عبارت بودند از:
• شكل نام
• فرمت نام
• زبان
• نوع اصطلاحات
• شكل عنوان
• قوانين آوانويسي/آوانگاري
• خصوصيات ديگرbib_1
2 -1- شكل نام
يك نام ممكن است با توجه به به قواعد محلي جهت استفاده ازنامها، شكلهاي مختلفي داشته
باشد. و اين در مورد همه نامهاصادق است.
نامهاي شخصي ممكن است به اندازه نام تنالگانها متفاوت نباشد. اما براي نمونه
اشخاص سلطنتي و پاپها در كشورهاي مختلف تحت اسامي متفاوت شهرت دارند. براي نمونه،
هنري پادشاه انگليس (English King Henry) ،در نروژ Kong Henric ناميده مي شود. و
لوئي پادشاه فرانسه(French King Louis) لودويگ Ludrig)) ناميده مي شود. پاپ جان پل
) Poul (pope John يوهانس پولا((Johannes pulla ناميده مي شود و غيره. افزون براين،
مامشکل استفاده از نامهاي متفاوت يك شخص در دورههاي مختلف درانواع مختلف مدارك
مکتوب راداريم.
برخي از سيستمها همه مدارك نوشته شده بوسيله يك نويسنده را بدون توجه به اين که تحت
کدام نام است بازيابي مي كنند ، در حاليكه سيستمهاي ديگر با توجه به شكل نام جستجو
و بازيابي مي كنند.زماني كه كاربر از يك سيستم محلي استفاده ميكند ممكن است كه با آن
آشنا باشد وبتواند كار كند. اما در يك شبكه كاربرنمي داند که سيستم چگونه کار مي
کند.
نامهاي تنالگاني و نامهاي كنفرانسها مشكلات بيشتري به عنوان ضوابط جستجو درمقايسه
با نامهاي اشخاص دارند. بسياري از تنالگانها و كنفرانسها يك نام ملي و يک يا بيشتر
از يك نام بين المللي دارند. سرنام ها نيز متفاوت هستند. تعداد كمي از كاربران
نروژي از OTAN به عنوان معيار جستجو براي NATO استفاده خواهند كرد. آنها حتي ممكن
است كه درمورد ركوردهاي با اين سرنامها به عنوان يك خشه در نتيجه جستجوتلقي كنند.
تقريبا ممکن نيست که يك كاربر بتوانداشكال مختلف نامهاي بکاررفته در پايگاههاي
اطلاعاتي مختلف را بداند يا حدس بزند.
درزمان وسيعتر کردن جستجو،مشكلات بيشتر مي شود. پايگاههاي اطلاعاتي مختلف ازنظر
انتشاروپخش ممكن است ازشكلهاي مختلف نامها استفاده كنند ،بدين معنا كه تقريبا
واردکردن شكل صحيح نام توسط کاربرمحال است.
2-2- فرمت نام
مشكل ديگر در فهرستهاي مجازي چگونگي ورود نامهاست. کدام ساختار نام در سيستمهاي
مختلف پشتيباني مي شود. در آزمونهاي ONE ما با ساختارهاي زير براي اسامي شخاص مواجه
شديم:
الف) نام خانوادگي ، نام (همراه باويرگول)
ب) نام خانوادگي نام (بدون ويرگول)
ج) نام خانوادگي ونام (بادو نمايه جداگانه)
د) نام خانوادگي (فقط نام خانوادگي)
ه)نام نام خانوادگي
اگريكي از اين شكلها در درخواست جستجو بکاررفته باشد، نتيجه جستجودر سيستهما
بااستفاده ازهريک ازشکلهاي ديگر معمولا صفر خواهد بود.
اگرچه همه شرکاگفتند که ازنام شخصي طبق گزينه الف حمايت كردهاند و انجام اين امردر
آغاز پروژه کاردرستي نبود.
حيرت آورترين نتيجه اي كه ما درزمان جستجودر يك سيستم گرفتيم به عنوان مثال
،ا.استريندبرگ؟(Strindberg , A? )(كوتاه شده)بود،و ما يك پيغام خطا دريافت کرديم:
"کاراکترهاي بسيارکم درمعيارجستجو"
Too few characters in search criterion" " توضيح اين بود كه سيستم مي تواند فرمت
الف را دريافت كند. اما نمايهها بر طبق فرمت ج ساخته ميشود. ويك حرف براي اولين
نام " Too few characters" بود.
3-2- زبان
در ادامه آزمايش ONE ما مسائل خاص مربوط به زبانهاي مختلف را نداشتيم ، اما بازيابي
يک عنوان و همان عنوان رابااستفاده از زبانهاي مختلف موردآزمون قرارداديم. تعدادي از
سيستمها براساس عنوان اصلي نمايه سازي كردند. بنا براين، ما يک عنوان رادرجستجوي
زباني تنها نه براي يک مورد، بلکه براي همه ويرايشهاي عنوان بدون توجه به زبان
،بازيابي كرديم .
4-2- نوع اصطلاحات
استفاده ازسرعنوانهاي موضوعي،شمارههاي رده بندي، به عنوان معيارهاي جستجو مستلزم
آن است كه بدانيم اصطلاحات وکدها مربوط به کدام واژگان كنترل شده اند كه تااين حد در
يک سيستم محلي کفايت مي کند، امادرسيستم شبكه اي کافي نيست. يک اصطلاح يا کد واحدممكن
است در سيستمهاي مختلف بطور متفاوت به کا رفته باشد. و اغلب اين اصطلاحات در
پايگاههاي اطلاع رساني مختلف ممكن است براي مدارك در سطوح مختلف فکري استفاده شوند
.
پروژه ONE نشان داد كه تعداد کمي از سيستمها از واژگان كنترل شده يکسان استفاده
كردند. اصطلاح "سرعنوان موضوعي" در پروتكل براي واژگانهاي متفاوت در سيستمهاي مختلف
طراحي شد. بنابراين ميزان دقت پايين بود
5-2- فرم عنوان
در فهرستبرگههاي قديمي قواعدي درمورد چگونگي مرتب سازي عناوين وجود داشت .اين
قوانين بيشتر براي مبادله دادهها ايجاد شده بود(استفاده از نمايشگرهاي مرتب سازي
در فرمتهاي مارك). اما همه دراغلب موارد اجرانمي شدند و حالا سيستمهايي رامي بينيم که
ازاين قوانين تبعيت نمي كنند. دليل آن اين است كه كاربران نهائي استفاده ازآنها را
مشكل مي يابند. علاوه بر جستجوي عنوان،اغلب سيستمها "كلمات در عنوان" رانيز به
عنوان معيار جستجوعرضه مي کنند. در برخي سيستمها شخص بايد عنوان را "آنگونه كه هست"
با حروف تعريف و غيره تايپ كند. درسيستمهاي ديگر ،كاربر بايد طبق قوانين مرتب سازي
تايپ كند. خدمات آزمايشي نشان داد كه كاربران نهائي هم از عناوين " آنگونه كه
هست"وهم از عناوين به "شكل مرتب سازي" و "كلمات درون عنوان" استفاده كرده اند.
ومورد دوم بيشترين ميزان بازيابي را نشان داد.
درسيستم محلي كاربران مي دانند چگونه دادهها را وارد كنند. يا مي توانند از
كتابداران سؤال كنند. اما در يك شبكه ،دانستن اين موضوع که كدام فرمت مورد نياز
است،امکان پذيرنيست ودر انتشار يک برگه درخواست جستجو ،واردکردن شكل "صحيح" براي
همه پايگاهها غير ممكن خواهد بود.
6-2- قوانين آوانويسي/آوانگاري
دليل ديگر ميزان پايين بازيابي در برخي جستجوها در اولين آزمايش ONE استفاده از
قوانين مختلف آوانويسي بود. حتي دريافتيم که در يك پايگاه ودرپايگاه مشابه آن
،قوانين متفاوتي اعمال شده است .درآزمونهايمان،ما صورتهاي مختلف نام چايکوفسکي
موسيقيدان مشهور رابه قرارذيل پيداكرديم:
Cajkovskij
Chaikovskii
Tchaikovsky
Tjaikovsky
Tschaikowsky
Tsaikovskij
Tsjaikovsky
ماباهيچ
شكل سيريلي (Cyrillic) مواجه نشديم .
هر چند يك استاندارد ايزو براي آوانويسي وياآوانگاري وجوددارد، بااين حال
استانداردهاي ملي مشخصي نيز مورداستفاده قرارمي گيرند. در نروژ ما حتي دو استاندارد
در اين زمينه داشتيم. ومحال است که كاربربتواند شكل صحيح را حدس بزند.
7-2- ويژگيهاي ديگر bib_1
پروتکل Z39.50 مجوعه مشخصه هاي bib_1 راكه تعريف ساختاردرخواست جستجو راارائه مي
دهد، تعيين مي کند.به عبارت ديگر، ويژگيهاي احتمالي ئي که يك اصطلاح جستجوممكن است
بوسيله آن توصيف شود، تعيين مي کند.مجموع شش نوع ويژگي که در Ib_1 تعيين شده است
،عبارتنداز:استفاده ، رابطه ، موقعيت ، ساختار ، كوتاه سازي ، تكميل . برخي از
سيستمها تنهابه مقاديرصحيح براي آن دسته ازويژگيهايي كه درهربرگه درخواست گنجانده
مي شود نياز دارند. برخي ديگربه حضور همه انواع ويژگيها نيازدارند. البته اين داده
اي نيست كه كاربر نهائي وارد مي کند،بلکه مشتري است که اينهارااضافه مي كند.
اگرچنين دادههايي مفقود باشند، جستجو شکست مي خوردو كاربر نيزممکن است دليل آن
رانداند.در اولين آزمايش در پروژه ONE مابه دليل مفقود بودن اين نوع ويژگيهادربرگه
درخواست،يامقاديرغلط براي برخي ازانواع،نتايج ضعيفي بدست آورديم.
3- راه حل برخي مشكلات
درسطورفوق دلايل اصلي نتايج ضعيف جستجو در يك شبكه رافهرست وار نشان دادم:
• شكل نام
• فرمت نام
• زبان
• نوع اصطلاحات
• شكل عنوان
● قوانين آوانويسي / آوانگاري
• ويژگيهاي ديگرbib_1
برخي ازاين نوع مشكلات با استفاده از Z39.50 بطور صحيح حل شدند. برخي از مشكلات
ديگررانيز با تعريف يك پروفايل براي Z39.50يابطورصحيح تر براي bib_1 مشخص كرديم.
برخي از مشكلات bib_1 نيز حل نشده اند.
1-3= فرمت نام
پروتكل نام را بطور معمول به شكل زير مشخص مي سازد:
نام خانوادگي ، نام (همراه باويرگول)
در پروفايل اين شكل رابه عنوان الزامي تعريف كرديم.بدين معني كه سرور (server) بايد
قادر به دريافت اين فرمت باشد و اگر نامها بدين طريق نمايه شده باشند جستجو را
انجام دهند.
برخي سيستمها تصميم گرفتند كه پايگاههايشان را به منظور سازگاري با پروفايل دوباره
نمايه سازي كنند. برخي ديگر نيز تغييرات را بر مبناي پذيرش درخواستها ي جستجو
انجام دادند.
كاربران نهائي نامها را همانطور كه استفاده مي كنند وارد مي كنند. .بنابراين
كاربران نيز بايد قادر باشند قبل از درخواست جستجو نامها را به سيستمهاي مورد نظر
تبديل كنند. اما تعداد كمي از اين كاربران درحال حاضر اين كارراانجام مي دهند.
2-3- نوع اصطلاحات
منظورمن از «نوع اصطلاحات» آن است كه اصطلاح به كدام واژگان كنترل شده ، يا به كدام
سيستم رده بندي تعلق دارد.z39.500 امكان مشخص بودندراين موضوع را مي دهد. متاسفانه
بسياري از سيستمها از سرعنوان موضوعي عمومي به جاي تخصصي جهت جستجوي معياراستفاده
مي كنند. يك پروفايل ميتواند حاوي اطلاعات خاصي دراين حوزه باشد اما پوتكل هيچگونه
امكان اطلاع رساني درمورد چگونگي استفاده از كلمات و سيستم هاي رده بندي وهيچ چيز
درباره سطح فكري سندي كه اصطلاح براي آن بكارمي رود نشان نمي دهد ودرنتيجه نمي توان
آن را به پروفايل ضميمه كرد.
3-3- ديگر ويژگيهاي bib_1
مسئله تركيب غلط پيامهارا در اين پروفايل حل كرديم.ما حتي الامكان ويژگيهايي را
براي الزامي ساختن انتخاب كرديم: استفاده ، رابطه ، ساختار و كوتاه سازي.
مقدار الزامي به منظور حمايت ازرابطه «مساوي» بود و مقادير اجباري براي پشتيباني از
كوتاه سازي «كوتاه سازي درست» و”كوتاه كنيد“ بود.
زماني كه ما پروفايل را اجرا كرديم، بازيابي نيز به علت اين عوامل بهبود يافت.
حداقل الزامات دراين حوزه ديگر كاربران راقادر مي سازد تاجستجوي پايگاهها ي اطلاع
رساني رابه آساني انجام دهند.
4-3- قوانين آوانويسي/آوانگاري
اين حوزه اي است كه همچنانكه سيستم ارتباطات متقابل پيشرفت مي كندازاهميت بيشتري
برخوردار مي شود. و همچنين حوزهاي است كه درآن از پروتكل مي توان كمك گرفت. زماني
كه جلسه اي ميان سيستمها شروع مي شودآنهامجوعه مشخصه هايي راكه درآن ارتباط
برقرارمي شود مي پذيرند.
زماني همه سيستمها بتوانند از Iso10646 ياازاUnicode استفاده كنند بيشتر مشكلات از
بين خواهد رفت . پروفايل بايد دربرگيرنده چگونگي استفاده از Iso10646 ( ياUnicode)
باشد. اما اين كار مشخص پروفايل است.
زماني كه همه سيستمها بتوانند Iso10646 ياUnicode ارسال و دريافت نمايند ما مي
توانيم همه جستجوها ربااستفاده ازهمه انواع نشانه ها بپذيريم و مطمئن باشيم كه
server ميتواند همه اين نشانه ها و يا آوانويسي رامستقيماجهت جستجو بكار
ببرديامطابق باقواعد پايگاههاي اطلاع رساني آوانويسي وياآوانگاري كند ودرنتيجه
بازيابي نيز بهبود خواهد يافت.
تا زماني كه همه سيستمها بتوانند همه نامها را به زبان اصلي ذخيره كند، پيشينههاي
بازيابي شده ممكن است آوانويسي ياآوانگاري مناسبي نداشته باشد.ولي پيشينهها
بازيابي خواهند شد.
4- مسائلي كه در پروفايل بوسيله Z39.50 وهرپروتكل ديگري حل نشده است.
اكثر مسائلي را كه ما در بازيابي ودقت در ONE با آن مواجة ايم مي توان از طريق
Z39.50 يا پروفايل اين پروتكل حل نمود. اما مشكلات عمده باقي خواهد ماند.
تسهيلات كنوني EXPLAINدر Z39.50 را نميتوان براي حل اين مشكلات بكار برد.. درواقع .
استفاده ازپروتكلهاي شبكه مشكلات را بزرگ كرده است. زيرا كاربران نهائي دسترسي به
پايگاههاي اطلاع رساني پيشرفته را ندارند.وكاربران نمي توانند باالزامات معيارهاي
جستجو در پايگاهها آشنا شوند. و زماني كه ما اجازه انتشار گسترده آنها رامي دهيم
مسائل حادتر مي شوند.
1-4- فرم نام
در پروژه ONE ما مسئله شكلهاي متفاوت نامها را حل نكرديم . استفاده از ISADN (شماره
استاندارد بين المللي كنترل دادههاي مستند)مورد بحث قرارنگرفت. اما اگر كسي بتواند
يك use_value رابراي چنين شماره اي تعريف كند وآن رادر درخواست جستجو را
بگنجاندبازيابي به ميزان زيادي بهبود خواهد يافت . و اين نيز مستلزم آن است كه همه
سيستمها شماره را تشخيص دهند وبتوانند ازآن در درون خود استفاده كنند. اين همچنين
مشكل شكلهاي مختلف نامها را كه در پايگاههاي مختلف بصورت پراكنده گنجانده شده است
حل خواهد كرد.
2-4- زبان
تفاوتهاي زباني را مي توان با يك ISDN حل نمود بجز براي سرعنوانهاي موضوعي زيرااين
مشكل حادتر است. زبان زمينه هاي فرهنگي را منعكس مي سازدومجددا مفاهيم رامورد
استفاده قرارمي دهد. براي نمونه درگرينلند( Greenland) آنها بيش از 20 كلمه براي
SNOW دارندوهريک ازاين کلمات مفاهيم متعددي دارند .اين مفاهيم در بسياري از فرهنگها
شناخته شده نيست.تنهاواژگان كنترل شده جهاني مي تواند اين مشكل راحل كند.اما من نمي
دانم كه چگونه مي توان چنين واژگاني ساخت که موردتوافق همه باشد.
زماني كه ما براي يك عنوان ياكلمه درعنوان جستجو مي كنيم زبان مهم است.کاربرچه
بسابخواهدمدارك را در زبانهاي مختلف بازيابي كند اما نمي داند عنوان چگونه ترجمه
شده است.
3-4- فرم عنوان
نه پروتكل ونه پروفايلهاهيچکدام نمي توانندشكل عنوان را مشخص سازند.هر پايگاه براي
خود قوانيني دارد كه مشخص مي سازد عنوان چگونه وارد و نمايه شود. برخي از سيستمها
هم عنوان اصلي و هم عنوان ترجمه شده راوارد مي كنند. بنابراين كاربران درجستجوي
پايگاههاي اطلاع رساني دوردست ،به صورتهاي مختلف تلاش مي كنند. براي عنوان
پيايندي،اين را ميتوان ، به عنوان مثال بهISDN منضم نمود. اما براي بيشتر عناوين
درحال حاضرابزاري براي بهبود ميزان بازيابي وجود ندارد.
5-نتيجه گيري
Z39.50 .همراه با پروفايلهاي اين پروتکل جستجو درپايگاههاي اطلاع رساني دوردست
راچه دريک پايگاه در يك زمان وچه در چندين پايگاه درزمانهاي يكسان آسان ساخته است.
استفاده آزمايشي ازآزمون مناسب در پروژه ONE به مانشان داد كه نتيجه دقت درجستجو
درهنگام استفاده ازپروتكل ارتباطي Z39.50 براي سيستم راه دور درمقايسه بازماني كه
از وب يا شماره گيري مستقيم استفاده ميكنيم بالاتر است. پروتكل ويافايل درمقايسه
با هر نوع ارتباط مشابه در پايگاههاي اطلاع رساني دوردست بازيابي بالاتري به ما
ميدهد. اما بازيابي بنا به ضوابط جستجو درمقايسه با پايگاههاي اطلاع رساني محلي با
توجه به تفاوت درجستجو،خط مشي هاوروشهاپايينتر خواهد بود. براي افزايش ميزان
بازيابي درجستجوي شبكه اي داشتن كنترل مستنددرهرشکلي که باشد حتي الامکان ضروري به
نظر ميرسد. ISADN ميتواند راه حل خوبي براي اشخاص و نامهاي تنالگاني وبراي عناوين
باشد. اميد است كه بتوان آن را تحقق بخشيد.
[1]International Seminar "The Function of Bibliographic Control in the Global Information Infrastructure" .Authority Control in an International Context in the New Environment.
Liv Aasa Holm