دورهمی علمی کتابداران
معیارهای ارزیابی نرم افزارهای کتابخانه دیجیتال + فیلم

  به گزارش لیزنا، سید مهدی طاهری، عضو هیات علمی دانشگاه علامه طباطبایی، در این جلسه به بررسی معیارهای ارزیابی و انتخاب نرم افزارهای کتابخانه دیجیتال بر اساس مقاله ارائه شده در چهاردهمین شماره نشریه کنسرسیوم محتوای ملی پرداخت.  وی در ابتدای سخنان خود توضیح داد که در این جلسه هیچ نرم افزاری بررسی نمی شود و فقط معیارهای ارزیابی مورد بررسی قرار می گیرد.  به گفته او در این مقاله ارائه شده در چهاردهمین شماره نشریه کنسرسیوم محتوای ملی نرم افزارهای کتابخانه ها از جنبه های مختلف مورد بررسی قرار گرفته است.

او گفت برای ارزیابی نرم افزار ها باید با برخی مفاهیم آشنایی پیدا کرد و پیشنهاد داد کتاب فهرست نویسی رایانه ای مورد مطالعه علاقه‌مندان قرار گیرد. وی ادامه داد: این بحث زمانی که بخواهید  نرم‌افزاری را انتخاب کنید و همچنین برای ارزیابی ویژگی های نرم افزار می تواند مورد استفاده قرار گیرد و همچنین می تواند نرم‌افزارهای مختلف را مورد مقایسه قرار دهد

طبق توضیحات وی در این بحث ویژگی های فنی، ورودی ها و خروجی های استاندارد، پشتیبانی از قالب های قراردادها و مدیریت اشیاء محتوایی به صورت فیزیکی و دیجیتالی، قابلیت های نمایه سازی سیستم، مدیریت خدمات کاربری و شخصی سازی، مدیریت سطوح دسترسی و قابلیت های امنیتی سیستم، میانکنش پذیری با سیستم های اطلاعاتی دیگر، قابلیت های جستجو و بازیابی سیستم، مدیریت گردش و امانت اشیاء محتوایی، پشتیبانی از کتابخانه های دو وجهی و پشتیبانی از استانداردهای کتابخانه های دیجیتالی، مدیریت فرایندها و گردش کار در کتابخانه ها، مدیریت پایگاه های مستند، مدیریت اشتراک دانش چه از طریق پرتال ها و چه در حوزه اطلاعاتی بررسی می شود.

 طاهری گفت: اولین نکته ویژگی های فنی نرم‌افزارها و پلتفرم و اینکه چه سیستم های عاملی مورد پشتیبانی قرار می گیرد (برای استفاده در محیط های مختلف)  است و نکته بعدی سیستم مدیریت پایگاه داده (DBMS) است  که بسیار اهمیت دارد. زیرا بسیاری از قابلیت های نرم افزار وابسته به این مورد است و اینکه از کدام DBMS  در کدام نسخه از آن استفاده می شود.  برای مثال اوراکل از نسخه ۱۱ به بالا ساپورت می کند که دارای مدیریت فیلم و فایل های صوتی نیز است. در مورد اس کیو ال سرور نیز به همه شکل.  باید قابلیت های هر ورژن مورد بررسی قرار گیرد و مشخص شود. گاهی اوقات نرم افزارها به دلیل تجاری بودن رویکرد اغلب شرکت ها ویژگی هایی را مطرح می کنند که هرچند موجود است اما عملاً در داخل DBMS نیست.  و این نشان می‌دهد که نمی‌توان چندان بر روی دیتا اعمال مدیریت کرد.

 او در این زمینه چند نکته را مطرح کرد:  اول اینکه اگر شرکت گسترش دهنده اعلام کند که نرم افزار دارای قابلیت هایی است، اما نسخه DBMS  آن نشان می دهد که چنین  قابلیت های امکان پذیر نیست، باید دقت شود آیا واقعا دیتا و اشیای محتوایی داخل دیتابیس است یا خارج از آن.  برای مثال برخی نرم‌افزارها ادعا می‌کنند که قابلیت کتابخانه الکترونیکی را دارد. اگر این متریال صرفاً در پیشینه قراردادها اتچ شده باشند نشان می دهد که مدیریت بر روی فایل وجود نخواهد داشت؛ زیرا خارج از محیط  قرار دارد و پیوست شده اند. امکان جستجوی همزمان آن در متادیتا و دیتا نیز وجود ندارد.  یکی از ویژگی‌های مهم در نرم‌افزارهای کتابخانه‌ای این است که بر روی فایل های مولتی مدیا نمایه سازی انجام دهیم یعنی تگِ موضوعی وارد کنیم. برای مثال در یک فایل سخنرانی امکان اضافه کردن موضوع وجود داشته باشد. برای اینکه بدانیم کجا در رابطه با موضوع «مدیریت داده» صحبت می‌شود باید به کل سخنرانی گوش داد اما در نرم‌افزارهای کتابخانه های دیجیتالی این قابلیت وجود دارد که می توانید یک فایل را  تقطیع کنید (برای مثال از دقیقه 1 تا 7 در مورد یک موضوع، و از دقیقه ۷ تا 23 دقیقه و ۴۰ ثانیه در مورد یک موضوع دیگر صحبت می‌شود و غیره) و تگ ها به هر مقطع داده می شود. 

 وی افزود: هر DBMS از یک ساختار داده ای خاصی تبعیت می کند و هر کدام دارای قابلیت های خاصی هستند.  همچنین اهمیت دارد که آیا لایسنس دارند یا نه.  یعنی آیا نسخه های اوریجینال را خریده اند یا هک شده هستند.  اگر دارای لایسنس باشند یعنی از سوی شرکت اصلی ساپورت می شوند. شرکت ها شرایطی را ایجاد می کنند که در صورت هک شدن نرم‌افزارها برخی  قابلیت های آنها از بین می رود.  همچنین ممکن است باگ هایی در سیستم ایجاد شود.

طاهری در ادامه توضیحات خود در مورد اپلیکیشن سرور گفت: باید مشخص شود که نرم افزار بر روی چه سروری قابلیت run شدن دارد.  این اهمیت دارد زیرا  مربوط به بحث های فنی شبکه می شود. اینکه آیا بهتر است آپاچی باشند یا  ویندوزی و غیره که هر کدام بخش مربوط به خود را دارند.  این موضوع به مدل معماری نرم‌افزار نیز وابسته است. برای مثال نرم افزاری را در نظر بگیرید که بر اساس کارکردهای مختلف آن سرور های مختلفی دارد.  سرور دیتا اگر جداگانه باشد می توان کارهای امنیتی بسیاری برای آن انجام داد و دیتا همیشه امن میماند و پشتیبان گیری بر روی همان سرور انجام می شود.  می‌توان آن را بر روی لینوکس قرار داد که از نظر امنیتی بسیار امن است.  اگر سرور ها مشترک باشند برخی از اقدام های امنیتی بر روی اپلیکیشن تاثیر منفی میگذارد. برای مثال گوگل نمی تواند مطالب شما را ایندکس کند در حالیکه این موضوع بسیار اهمیت دارد.  نود درصد از زمانی که کاربران صرف جستجو می کنند در محیط موتورهای کاوش انجام می گیرد یعنی از هر 10 دقیقه 9 دقیقه آن بر روی موتورهای کاوش انجام می گیرد و بسیار اهمیت دارد که دیتای ما بر روی موتورهای کاوش قابل دسترسی باشند.  به خصوص بر روی منابع منحصر به فرد ما مانند نسخه‌های خطی پایان نامه‌ها و غیره.  اگر اپلیکیشن سرور و دیتا یکی باشد در صورت انجام اقدامات امنیتی ربات موتورهای کاوش نمی توانند به دیتای شما دسترسی یابند و مجبور هستید بسیاری از پورت‌ها را ببندید.

 وی توضیح داد: برخی هک های مستقیم وجود دارد که در واقع ربات هایی هستند که به صورت دائم و آنلاین به سرور ها حمله می برند. اما با بستن برخی پورت‌ها و اقدامات امنیتی جلوی حملات گرفته می شود. مهمترین موضوع ما دیتایی است که وجود دارد و باید در سلول جداگانه ذخیره شوند. فقط باید اپلیکیشن بر روی وب قرار گیرد نه دیتا. ارتباط باید بین اپلیکیشن و دیتا صورت گیرد که به صورت خارج از محیط شبکه وب و آفلاین انجام می گیرد. اپلیکیشن ارتباط با DBMS  را ایجاد می کند ولی جدا از آن محسوب می شود. معمولاً دیتاها را بر روی لینوکس قرار می‌دهند که از نظر امنیتی قوی است و اپلیکیشن را بر روی ویندوز قرار می دهند که قابلیت های تعاملی بیشتری دارد.

سید مهدی طاهری ادامه داد: استریمینگ این را نیز جدا می‌کند زیرا حجم فایل های صوتی و تصویری همیشه بسیار بالا است.  در استریمینگ مانند یوتیوب و آپارات  فایل را دانلود نمی کنید بلکه به تدریج دیتا دریافت  و نمایش داده می شود. معمولاً افراد برای دانلود نکردن این فیلم ها از سیستم استریمینگ استفاده می کنند به شکلی که همه می توانند فیلم‌ها را ببینند بدون اینکه آن را دانلود کنند. اگر استریمینگ با دیتا یکی باشد مشکل سرعت به وجود می آید زیرا حجم فایل ها بالاست و لود شدن آن سیستم را کند می کند.  برخی کاربران  نیز فقط متن pdf و غیره را نیاز دارند مطالب شان از دیتا خوانده می‌شود و ربطی به استریمینگ ندارد.

او تاکید کرد باید دقت شود که نرم افزار VM (سرور مجازی) نباشد  و توضیح داد:  ما در یک سرور فیزیکی می توانیم چندین سرور VM تعریف کنیم در واقع ما  از همان یک سرور فیزیکی استفاده می کنیم و فقط سرورهای مجازی درست شده است که کنترل قبلی بر روی آن وجود ندارد.  همه آنها در یک هارد و در یک cpu پردازش می‌شوند و از فضای رم استفاده می‌کنند که باز مشکل سرعت ایجاد خواهد شد. اما زمانیکه این دو مورد جدا از هم باشند کمترین مشکل را خواهیم داشت. vm به دلیل کم بودن فضای فیزیکی سرور تعریف می شود. 

او گفت: ما نیز زمانی که کتابخانه دیجیتال خود را مستقر کردیم دچار مشکلات بسیاری بودیم. گاهی دسترسی قطع می‌شد.  بعد متوجه شدیم که بر روی یک سرور ضعیف شش سیستم نصب شده است که همه با هم تداخل داشتند. با ایجاد ترافیک در یک سیستم بقیه سیستم ها  از کار می‌افتادند. در حال حاضر یک سرور فیزیکی جدا برای کتابخانه تهیه کرده ایم که دو vm بر روی آن تعریف شده است.

 او ادامه داد: بحث بعدی search engine است. search engine یک موتور کاوش است که با موتورهای کاوش وب تفاوت دارد.  توجه به نرم‌افزار اهمیت بسیاری برای کتابداران دارد. DBMS   خود  قابلیت جستجو دارد اما به دلیل بالا بردن سرعت search engine و استفاده  بیشتر از قابلیت های آن (که خود نرم افزار جداگانه است و ممکن است در داخل نرم افزار کتابخانه باشد و یا جداگانه باشد) نیز وجود دارد. search engine به DBMS  لینک می شود و می تواند به شکل های مختلف ایندکس کند. کار اصلی آن در واقع همین ایندکس کردن و قابل جستجو کردن است.  اما جدا از خود نرم افزار DBMS است. باید گفت  اولاً قابلیت‌های جستجو DBMS  محدود است و ثانیا سرعت آن پایین است.

وی گفت: search engine چند ویژگی خاص دارد. برای مثال  در Lucene حدود 12 نوع  سرچ فقط در مورد متن وجود دارد.  با جستجوی  عبارت Digital library searchengine  انواع مختلفی از آنها را می یابید.

وی ادامه داد: در DBMS اضافه کردن سرچ برای مثال در پاورقی بسیار سخت است اما  search engineها با ورد سازگار هستند و خود تفکیک می کنند و بسیاری از بخش ها مانند منابع، و سر صفحه ها، پاورقی ها و غیره را در ورد می شناسند و ایندکس می کنند. سرعت بازیابی آن نیز بسیار بالا است چرا که فقط ایندکس را حفظ می کند و نه دیتا را. در حالیکه DBMS خودِ دیتا را هم شامل می شود.

طاهری افزود: search engine ها دارای قابلیت های بسیاری نیز هستند و می توان محدودیت ها و قابلیت های جستجوی بسیاری تعریف کرد.

 وی افزود: در زیر ساخت نرم افزاری بحث مرورگر نیز مطرح می‌شود. اینکه چه مرورگر هایی این نرم افزار را پشتیبانی می کنند.  نرم‌افزار باید این قابلیت را داشته باشد که با همه مرورگرها (حداقل با مرورگرهای متداول) سازگار باشند.  نرم افزار  باید با پلت‌فرمی که  بر روی آن قابلیت های خود را اجرا می کند ارتقا پیدا کند. و برای استفاده از این مرورگرها باید پلتفرم خود را ارتقا دهد. ارتقا در نسخه های جدید بسیاری از شرکت‌های معروف در واقع تغییر پلت‌فرم آنهاست و در واقع پلتفرم خود را به روز کرده اند. اگر پلتفرم یک نرم افزار ارتقا نیابد با سیستم عامل های جدید دچار مشکل می شود.  برای مثال با نصب ویندوز 10  باید نرم‌افزارهای جدید به روز به کار روند چون نرم افزار های قبلی را پشتیبانی نمی کند.

 او توضیح داد: نباید هزینه ارتقای نرم‌افزار را کاربران بپردازند. برای کاربر ارتقا به معنای افزایش قابلیت های نرم افزار است و آن چیزی که به عنوان ارتقا توسط شرکت ها مطرح می شود در واقع برای این است که نرم افزار قابل استفاده در محیط باشد.  نرم‌افزار که فروخته می شود باید متناسب با سیستم عامل به روز باشد.

 وی در پایان تصریح کرد: کتابخانه ها در خرید باید به سمت امضای قرارداد پیش بروند. در قرارداد مواردی مطرح می شود که خود شرکت ملزم به انجام آن است و کتابخانه ها در خرید باید به سمت امضای قرارداد پیش بروند؛ زیرا به دلیل نداشتن قرارداد فروشنده هر کار بخواهد انجام می دهد. همه نرم‌افزارهای خارجی دارای قرارداد هستند و برای آنها لایسنس تعریف شده است و دارای مشاور حقوقی فنی و غیره هستند.  برای مثال در صورتی که در قرارداد ذکر شود ارتقا نرم افزار ربطی به دانشگاه ندارد و فقط در صورت افزایش قابلیت های سیستم هزینه پرداخت خواهد شد، مبلغ اضافی پرداخت نمی کنید.