News Code: 39679
Publication Date: Sunday, 19 May 2019 - 09:47

main

»

مطالب کتابداری

»

کتابخانه و کتابداری

گزارش بازدید از مرکز مرکز تحقیقات کامپیوتری علوم اسلامی (نور)

Source : لیزنا
یکشنبه 15 اردیبهشت 1398 گروه علم اطلاعات و دانش­ شناسی دانشگاه قم از مرکز تحقیقات کامپیوتری علوم اسلامی برای درس مقدمات پردازش زبان طبیعی بازدید کرد.
گزارش بازدید از مرکز مرکز تحقیقات کامپیوتری علوم اسلامی (نور)

به گزارش لیزنا، در این بازدید که در محل کنفرانس­های مرکز نور برگزار شد پس از پخش قرآن در قالب کلیپ که کاری از گروه تحقیقات کامپیوتری علوم اسلامی بود؛ مهندس محمد حسن بشری موحد به توضیح کلی کاربرد هوش مصنوعی در پردازش زبان طبیعی در این سازمان پرداخت و در ادامه نیز توضیحاتی در مورد روند کار در سامانه https://ai.inoor.ir/ داده شد.

وی ابتدا  تصریح کرد: مرکز تحقیقات کامپیوتری علوم اسلامی در بیش از بیست سال فعالیت خود، تاکنون توانسته است با دیجیتالی کردن منابع مکتوب، حجم عظیمی از دادگان متنی را فراهم آورد. در مرحله بعد نیز این سازمان به فرآوری و غنی سازی متون پرداخت و سپس با به کارگيری فناوری­هاي رايانه‌ای از قبيل؛ واسط کاربری مطلوب، جستجوی سريع و ديگر قابليت­های لازم، محيط پژوهشی مناسبی را در ارائه محتوای ايجاد کرد. در توضیح بخش­های مختلف در وب سایت گروه پردازش هوشمند نور در ابتدا گفته شده که 2 سرویس "تشخیص موجودیت­های اسمی فارسی و عربی" در بازیابی اطلاعات کمک زیادی کرده است به این صورت که پس از وارد کردن یک متن اسامی مختلف را از نظر اینکه نام شخص است یا سازمان یا مکان با رنگ­های مختلف مشخص می­ کند و حسن آن نیز، این است که اسم­های جدید و ناشناخته را با توجه به سیاق کلمه می­تواند تشخیص دهد.

در این وب سایت سرویس "آیات مرتبط" به گونه ­ای طراحی شده است که با وارد کردن یک عبارت، آیات مرتبط با آن آیه را از بخش­های مختلف قرآن کریم بازیابی می­ کند.

سرویس دیگر "سیستم خلاصه ­ساز" است که جملات و پاراگراف­هایی که نماینده کل متن است را استخراج می ­کند نه اینکه آن را استنتاج کند مثلاً با دادن یک متن طولانی به این بخش می­تواند پاراگرافی را که نماینده کل متن است و در واقع عمده اطلاعات در آن است بازیابی کند.

سرویس دیگر، سرویس "تبدیل تصویر به متن" یا OCR است. این سرویس هم به طور مستقیم و هم، زمانی که کلمه­ ای را در نورمگز جستجو می­ کنیم علاوه بر بازیابی سند، مکان کلمه را هم در آن سند با رنگ زرد نشان می­دهد. به طور معمول تیم­ هایی که در بخش پردازش زبان طبیعی فعالیت می­ کنند از OCR در جهت کاهش هزینه­ ها استفاده می­ کنند.

 در سرویس "تحلیح صرفی کلمات عربی" هنگامی که یک کلمه عربی با اعراب یا حتی بدون اعراب یا با اعراب ناقص به این بخش داده می­شود؛ تمام حالت­هایی که کلمه می ­تواند خوانده و صرف شود را بازیابی می­ کند.

سرویس "برچسب­ گذاری صرفی زبان فارسی" به این صورت است که وقتی متنی را به ماشین دادیم؛ این کلمه را بدون درنظر گرفتن جایگاه آن در جمله صرف می­ کند و اسم و فعل یا حرف بودن آن­را مشخص می ­کند.

در سرویس "ریشه ­یاب کلمات فارسی" با دادن یک کلمه به سیستم،  برنامه قادر است تا ریشه کلمه را مشخص ­کند به عبارتی پیشوند و پسوند کلمه را حذف می­ کند.

سرویس "دسته ­بندی موضوعی متن" به این صورت است که با وارد کردن یک مقاله یا پارگراف موضوع آن را برای فرد مشخص می­کند. در این نسخه سه رده بندی اصلی در زمینه "فقه اسلامی" با 9 کلاس، "متون خبری فارسی" با 7 کلاس و "متون خبری فارسی" با 10 کلاس وجود دارد.

سرویس دیگر سرویس "تصحیص فاصله" است که می­تواند برای غلط­یاب املایی هم کاربرد داشته باشد و در واقع چسبندگی کلمات و نیم فاصله ­ها را اصلاح می­ کند.

سرویس بعد "سرویس آیه یاب در متن" است که با استفاده از آن می توان آیات موجود در یک متن را همراه با ذکر نام سوره و آیه پیدا کرد؛ البته این سرویس بیشتر برای متون عربی کاربرد دارد.

در سرویس "مدل­سازی موضوعی" به کشف ارتباط بین واژه‌ها بر اساس با هم‌آیی در مقالات با هدف ایجاد دسته‌بندی کلمات پرداخته می شود.

در سرویس "مشابه یاب احادیث" می توانید با وارد کردن حدیث مورد نظر، احادیث مشابه آن را دریافت کنید.

"شبکه کلیدواژه ­ها" نیز خروجی آماری از اسناد نورمگز فراهم می‌آورد که کلیدواژه­های دستی و ماشینی را شامل می­شود که اگر شبکه کلیدواژه­ ها کامل باشد منجر به تشکیل دانش جدید می­شود و اگر ناقص باشد نیز در واقع دانشی درباره پیکره حاصل می­ کند.

سرویس دیگر "ابر کلیدواژه ­ها" است که این امکان را فراهم می‌آورد که بر روی دسته‌ای از مقالات که در یک موضوع خاص نوشته شده‌اند؛ تمامی کلیدواژه‌ها را بر اساس تعداد رخداد آن‌ها نمایش داد. همچنین می توان این امکان را به کلیدواژه‌های یک مقاله محدود نمود. این شکل بصری سازی، در یک نگاه سمت و سوی پژوهش در موضوع و یا مجله‌ای خاص را نشان می دهد.

در ادامه بازدید نیز گفت­ وگوهایی در مورد نقش و کاربرد پردازش زبان طبیعی در رشته علم اطلاعات و دانش­ شناسی مطرح شد.

 

گزارش: زهرا نحوی

 

Please in order to facilitate your connection with Lisna pay attention to the following points while sending messages:
1- Avoid any insult to people, ethnics and races; avoid making fun and accusing others.
2- Since the messages will be published by your name, it is suggested to send them using your real name and your authentic E-mail address to help Lisna form a better discussion.
3- Please avoid using the name of persons (natural and legal), organizations, public and private institutions.
4- Pleas avoid sending repeated messages which were previously sent by other users.
5- Please avoid sending messages in other languages than English.
name:
Email:
* Comment:
Latest News