کد خبر: 43772
تاریخ انتشار: جمعه, 31 ارديبهشت 1400 - 08:40

داخلی

»

گزارش

هجدهمین کارگاه پژوهش در محیط وب برگزار شد

منبع : لیزنا
هجدهمین جلسه از کارگاه پژوهش در محیط وب، از سلسله جلسات دورهمی علمی کتابداران به همت کتابخانه آیت الله بروجردی برگزار شد.
هجدهمین کارگاه پژوهش در محیط وب برگزار شد

به گزارش لیزنا، هجدهمین جلسه از کارگاه پژوهش در محیط وب، از سلسله جلسات دورهمی علمی کتابداران که به همت کتابخانه آیت الله بروجردی و با تدریس دکتر سید مهدی طاهری به صورت مجازی برگزار می‌شود، در ادامه بحث طراحی و ایجاد موتور کاوش شخصی از طریق سامانه وبینار در پلتفرم آموزش الکترونیکی برگزار شد.

دکتر سید مهدی طاهری در جلسه قبل به معرفی موتورهای کاوش شخصی پرداخت و گفت: موتورهای کاوش شخصی با این رویکرد طراحی شده‌اند که برای هر کاربری با نیازهای اطلاعاتی، علایق و سلایق مختلف، رفتار اطلاع‌یابی متفاوت و حتی حس زیبایی شناختی خاص مناسب باشند. به عبارت دیگر، برای این که این موتورها بتوانند نیاز همه افراد را برطرف کنند و اجازه دهند کاربر از قابلیت‌های گوناگون این موتورها متناسب با نیازها و علایق خود استفاده نماید، این قابلیت‌ها را فراهم نموده‌اند، البته افزون بر گوگل، موتورهای کاوش دیگر هم مانند موتور کاوش بینگ، چنین امکاناتی را ارائه می‌دهند.

در جلسه گذشته درباره شیوه ایجاد موتورهای کاوش شخصی توضیحاتی ارائه شد، و در ادامه آن، در این جلسه در خصوص امکانات موتورهای کاوش شخصی بحث شد.

وی گفت:  موتورهای کاوش شخصی (personalized search engine) که به آن‌ها موتورهای کاوش سفارشی  (custom search engine) یا موتورهای کاوش قابل برنامه‌ریزی (programmable search engine) نیز می‌گویند، امکانات وسیع و گوناگونی دارند، و این امکانات به‌طور مرتب در حال گسترش و روزآمدسازی هستند. گوگل تمام این امکانات را ایجاد نموده تا بتواند نیاز اطلاعاتی کاربر را متناسب با نیاز، دیدگاه و رویکرد، و دیگر ویژگی‌های شخصی کاربر فراهم کند.

دکتر سید مهدی طاهری تصریح کرد: این مسئله در درجه اول نشانگر این است که موضوع شخصی‌سازی در سیستم‌های اطلاعاتی بسیار پراهمیت است، و لازم است تمامی سیستم‌ها به سمت رویکرد شخصی‌سازی حرکت کنند و هر کدام متناسب با نیازها و علایق کاربر خدمات پویا (dynamic services) ارائه نمایند. به‌طورمثال، سیستم‌های اطلاعاتی از روی تحلیل لاگ‌های ثبت شده از کاربر و رفتار اطلاع‌یابی آن‌ها (تجربه کاربری) می‌توانند خدمات خود را متناسب با نیاز و سلیقه کاربر ارائه دهند، و منابع مرتبط را بازیابی نمایند. به‌عنوان‌مثال، اگر اولویت جستجوی کاربر منابع دیداری باشد و در کتابخانه دیجیتالی جستجو نماید، ابتدا منابع دیداری برایش بازیابی شده، و در رتبه (Rank) بالاتری قرار می‌گیرند، و یا در سیستم‌های خرید، متناسب با خریدهای پیشین کاربر، به وی پیشنهادهایی ارائه می‌گردد. نیز، در شبکه‌های اجتماعی مثل اینستاگرام در قسمت جستجو، متناسب با آن چه از پیش توسط کاربر جستجو شده است، تصاویر را نمایش می‌دهند. در خدمات ارائه شده در یوتیوب نیز بحث شخصی‌سازی مورد توجه قرار گرفته است.

وی گفت: نکته قابل توجه، در موتورهای کاوش مثل گوگل این است که به‌طور مرتب به این خدمات افزوده شده، و قابلیت‌های مختلفی را ارائه می‌دهد و این‌ها شواهدی بر اهمیت بحث شخصی‌سازی هستند.

عضو هیات علمی دانشگاه علامه طباطبایی در ادامه گفت: در جلسه پیش، بخش setup موتور کاوش شخصی بیان شد.تمامی این تنظیمات را پس از اتمام، می‌توانیم در قالب فایل مبتنی بر بستر نحوی ایکس‌ام‌ال (XML) بارگذاری کنیم و یک موتورکاوش شخصی با قابلیت‌های مختلف متناسب با نیازهایمان داشته باشیم.

دکتر طاهری در خصوص پرسش یکی از کاربران درباره گزینه restrict page using knowledge graph entities  توضیح داد: به‌عنوان‌مثال، در گوگل واژه "انیشتین" را جستجو می‌کنیم، زیر هر کدام از نتایج بازیابی شده یک یا چندین فراپیوند موجود است و در سمت راست صفحه، جعبه دانش (knowledge box) گوگل ارائه می‌گردد، که به عنوان جدیدترین پروژه بازنمون دانش در دنیا، و یک هستی‌شناسی از داده‌های وب مطرح است. همه موتورهای کاوش در حال حرکت به سمت این فناوری‌ها و خدمات هستند. در آینده تمام نتایج به این شکل ارائه خواهند شد، چرا که این روش هوشمند است و تشخیص می‌دهد که آلبرت انیشتین یک نظریه‌پرداز حوزه فیزیک بوده، و تمام داده‌های مربوط به انیشتین همانند نقل‌قول‌ها، توصیفات و کتاب‌هایش را نشان می‌دهد. جعبه دانش گوگل برگرفته از پروژه نگاره (گراف) دانش (knowledge graph) است که جستجوهای معنایی (semantic search) انجام داده، و بر اساس معیار ربط (relevance)، مرتبط‌ترین نتایج را به صورت معنادار نمایش می دهند.

وی گفت: این گونه خدمات، آینده موتورهای کاوش را تشکیل می‌دهند که مبتنی بر هوش مصنوعی است و هدف آن بازنمون دانش (knowledge representation) به جای بازنمون اطلاعات ( information representation) است. هنگامی که در گوگل واژه "انیشتین" را جستجو می‌کنیم، در سمت چپ تنها اطلاعات را بازنمون می‌کند و صفحات را براساس وجود واژه مورد نظر بازیابی کرده است. در این بخش گوگل نتایج جستجوی نحوی (Syntactic search) را ارائه می‌دهد. در سمت راست با تشخیص اینکه انیشتین یک نظریه‌پرداز است، از وب‌سایت‌های مختلف، داده‌های مربوط به انیشتین، نقل قول‌های مرتبط، کتاب‌هایش، دانشمندان هم رشته و ... را جستجوی معنایی (semantic search) انجام داده و بازیابی نموده است.

وی افزود: افراد حقیقی و حقوقی که داده‌های خود را تهیه و در وب منتشر می‌کنند، اگر صفحات خود را بر اساس معیارهای knowledge graph آماده نمایند، صفحات در knowledge box به نمایش در آمده، و بازیابی معنایی می‌شوند، و گوگل ساختار این صفحات را به‌خوبی تحلیل و شناسایی می‌کند. یعنی در اصل گوگل ساختاری را طراحی نموده است که اگر مدیران وب‌سایت‌ها، پایگاه‌های اطلاعاتی و دیگر خدمات پیوسته، داده‌های خود را متناسب با این ساختار طراحی کنند، موتور کاوش، موجودیت توصیف شده در صفحه وب را به صورت معنادار تشخیص می‌دهد.

دکتر طاهری در ادامه گفت: صفحات بازیابی شده در knowledge box ساختاری را برای بازنمون دانش استخراج می‌کنند که برای موتور کاوش کاملاً قابل درک است. در واقع موتور کاوش نتایج  را به صورت knowledge graph نشان می‌دهد. مهم‌ترین ابزاری که نگاره دانش و خرده‌های غنی (دیگر نمایش معنادار) را ایجاد می‌کند، استاندارد فراداده‌ای schema.org است. این استاندارد باعث می‌شود داده‌ها به‌صورت ساختارمند تولید شوند و موتور کاوش داده‌ها را به صورت معنادار نمایه‌سازی نموده، و معنادار نیز نمایش دهد. این استاندارد ساختاری طراحی نموده است که به تولیدکنندگان داده‌های وب نشان می‌دهد چگونه داده‌ها را به شکل ساختارمند تولید نمایند تا موتور کاوش این داده‌ها را به‌صورت معنادار نمایه‌سازی و بازنمون (semantically indexing and visibility) کند.

عضو هیأت علمی دانشگاه علامه طباطبائی در ادامه افزود: زمانی که در تنظیمات موتور کاوش شخصی خود گزینه using schema.org type را فعال کنیم، می‌توانیم نتایج جستجوی خود را به صفحاتی که دارای ساختار مبتنی بر استاندارد Schema.org هستند، محدود نماییم تا موتور کاوش نتایج را به‌صورت کاملاً معنادار نمایه و بازیابی کند. در این زمینه باید توجه داشت، همه صفحات دارای این ساختار نیستند و شمار زیادی از صفحات وب براساس این ساختار تنظیم نشده‌اند. به همین دلیل وقتی این گزینه را فعال کنید نتایج چندانی بازیابی نخواهد شد. در واقع اگر نتایج را  محدود کنیم تا فقط صفحاتی را بازیابی نماید که معنادار و بر اساس استاندارد schema.org و یا بر اساس  knowledge graph entitiesایجاد شده‌اند، ممکن است صفحه‌ای بازیابی نشود یا تعداد آنها معدود باشد. مسئله دیگر این است که وقتی از موجودیت‌های نگاره دانش و schema.org صحبت می‌شود باید نوع موجودیت جستجوی خود را از full list of entity types انتخاب نماییم.

وی گفت: برای یافتن این فهرست لازم است در قسمت جستجوی گوگل عبارت schema.org را جستجو نماییم، در نتایج بازیابی شده، گزینه full hierarchy را انتخاب می‌کنیم که انواع موجودیت‌ها را ارائه می‌دهد و از میان آن‌ها می‌توانیم کلیدواژه‌های خود را انتخاب نماییم. نیز می‌توانیم برای یافتن کلیدواژه‌های خود در گوگل عبارت google knowledge graph entities را جستجو نماییم.

دکتر طاهری در ادامه‌، به توضیح گزینه دوم موتور کاوش شخصی‌ یعنی look and feel پرداخت، و همه سربرگ‌های (تب) آن را کاملاً تشریح کرد و گفت: این گزینه دارای چهار سربرگ هست که اعمال تغییرات در هر کدام از این سربرگ‌ها، شکل و ظاهر نمایش نتایج را تغییر می‌دهند.

سربرگ اول(layout) که چگونگی نمایش نتایج بازیابی شده را تنظیم می‌کند، و نمایش می‌دهد؛

سربرگ دوم (themes) که پس زمینه صفحه موتور کاوش شخصی را تغییر می‌دهد؛

سربرگ سوم (customize)، در این سربرگ گزینه (general) مربوط به فونت، رنگ و اندازه واژه‌ها است و همچنین رنگ جعبه جستجو را تغییر می‌دهد. در قسمت (logo) می‌توانیم عکس یا لوگو برای موتور کاوش خود انتخاب کنیم. گزینه (refinement) رنگ متنی را که انتخاب (select) می‌کنیم، تغییر می‌دهد؛ گزینه بعدی google branding است که اگر غیرفعال نماییم در قسمت جعبه جستجو عبارت (enhanced by google) حذف می‌شود، و مشخص نمی‌گردد که این موتور کاوش شخصی بر اساس گوگل ساخته شده است. توصیه می‌شود این گزینه فعال باشد تا عبارت (enhanced by google) نمایش داده شود؛

قسمت‌های بعدی مربوط به رنگ و فونت نتایج بازیابی شده، عناوین و آدرس URL صفحات بازیابی شده است؛

آخرین سربرگ look and feel، سربرگ thumbnails است که اگر فعال باشد، تصاویر کوچک در گوشه نتایج بازیابی شده نمایش داده می‌شوند.

قسمت بعدی تنظیمات موتور کاوش شخصی، ویژگی‌های جستجو (search features) است که بسیار مهم است و قابلیت‌های فنی زیادی دارد.

سربرگ نخست این گزینه (promotions) است که اگر این گزینه فعال باشد، می‌توانیم در نحوه نمایش نتایج بازیابی شده تغییرات اعمال نموده، که به‌طور دقیق عنوان و یا پیوند مربوط به صفحه را نمایش دهد.

عضو هیأت علمی دانشگاه علامه طباطبایی گفت: در قسمت (look and feel) شکل ظاهری نتایج بازیابی شده را می‌توانیم به سلیقه خود تغییر دهیم، ولی در قسمت (search features) می‌توانیم محتوای بازیابی شده را تغییر داده، و تعیین کنیم کدام موارد و به چه ترتیبی بازیابی شود. به‌طورمثال، ابتدا نشانی وب‌سایت و سپس توصیف‌های آن نمایش گردد. بنابراین، گزینه (promotions) از لحاظ زیبایی‌شناختی نیست بلکه از لحاظ نوع اطلاعاتی است که می‌خواهیم جستجو و نشان داده شود. حتی می‌توانیم تنظیمات زمان برای آن درنظر بگیریم که از چه زمانی تا چه زمانی این تغییرات اعمال شود. نیز می‌توانیم تعیین کنیم در زمان‌های معین در بازیابی نتایج، آدرس سایت‌های تبلیغاتی را که در بالای نتایج بازیابی شده، نشان دهد. به‌عنوان‌نمونه، اگر بخواهیم همایشی برگزار کنیم، می‌توانیم در موتور کاوش شخصی خود تنظیمات را به گونه ای اعمال نماییم که وقتی کاربر جستجو می‌کند، عنوان یا پیوند مربوط به همایش در بالای نتایج بازیابی شده مشاهده شود.

رئیس کتابخانه مرکزی دانشگاه علامه طباطبایی در ادامه گفت: سربرگ (تب) یا امکان دیگری که در قسمت  search features وجود دارد، گزینه پالایش (refinement) است که بر پایه آن، موتور کاوش به کاربر امکان می‌دهد، نتایج بازیابی شده را متناسب با دسته‌های خاص محدود کند. در این زمینه می‌توان چهریزه (facet) تعریف نمود. بدین منظور نخست باید گزینه enable facet search را فعال کنیم تا در این صورت بتوانیم نتایج را دسته‌بندی کنیم. سپس می‌توانیم تعیین نماییم کدام سایت‌ها در یک دسته خاص قرار دارند. به‌عنوان‌مثال، از ده نتیجه بازیابی شده، سه نمونه مربوط به یک دسته، چهارنمونه مربوط به دسته دیگر و به همین ترتیب هستند. این نتایج را موتور کاوش به صورت برچسبی (label) بازنمون می‌کند. قابلیت مورد نظر را نیز می‌توان با استفاده از knowledge graph entities تعریف کرد. امکان دیگر auto complete مربوط به جستجو است. در صورت فعال بودن این گزینه، در هنگام جستجو، اصطلاحات پیشنهادی (suggested terms) به جستجوی کاربر نیز نمایش داده می‌شود تا کاربر از میان اصطلاحات انتخاب نماید. می‌توانیم این امکان را نیز شخصی‌سازی کنیم.

وی گفت:‌قابلیت کاربردی دیگر، سربرگ synonyms است که یک امکان کاملاً تخصصی است. به عنوان مثال می‌توانیم تعریف کنیم که اگر در یک موتور کاوش شخصی عبارت data  جستجو شود، با عبارت fact مترادف در نظر گرفته شود و عبارت مترادف نیز بازیابی گردد. به این معنی که اگر fact  را جستجو کنیم، data نیز بازیابی شود. خود گوگل از شبکه معنایی Wordnet استفاده می‌کند و مترادف‌ها را نیز بر اساس واژگان این شبکه معنایی بازیابی می‌نماید. این تنظیمات در موتورکاوش شخصی با استفاده از سربرگ synonyms قابل اعمال است.

وی در ادامه تصریح کرد: بالاخره در سربرگ پایانی (advanced)، چند گزینه به چشم می‌خورد، اولین گزینه results sorting است که اگر این گزینه فعال باشد، نتایج بر اساس ربط (relevance) یا بر اساس تاریخ (date) به‌صورت صعودی و یا نزولی مرتب می‌گردد. در همین قسمت امکان دیگری وجود دارد با عنوان web search setting که می‌توانیم تنظیم کنیم نتایج بازیابی شده را به صورت سربرگ (تب) و یا پیوند نمایش دهد.

دکتر سید مهدی طاهری در پایان این جلسه گفت: تمامی بخش‌ها و امکانات قسمت تنظیمات search features به‌طور کامل ارائه شد. به این ترتیب جلسه هجدهم کارگاه پژوهش در محیط وب به پایان رسید و ادامه تنظیمات موتورهای کاوش شخصی به جلسه آینده موکول شد.

گزارش: بنت الهدا موحدی محب