سید مصطفی فخر احمد

سید مصطفی فخر احمد

مطالب

فیلتر های جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۵ مورد از کل ۵ مورد.
۱.

تأثیر کمبود و پراکندگی داده بر اثربخشی نتایج سامانه ژورنال یاب رایسست: مطالعه موردی حوزه فنی و مهندسی(مقاله علمی وزارت علوم)

کلید واژه ها: اثربخشی سامانه پیشنهاددهنده نشریه کمبود داده پراکندگی داده سامانه ژورنال یاب رایسست

حوزه های تخصصی:
تعداد بازدید : 136 تعداد دانلود : 723
عوامل متعددی از مجموعه عناصر تشکیل دهنده سامانه های پیشنهاددهنده در تولید و ارائه پیشنهاد دخیل هستند. مطالعه حاضر، با هدف شناخت تاثیر دو چالش کمبود و پراکندگی داده بر اثربخشی نتایج پیشنهادی سامانه ژورنال یاب رایسست انجام شده است. بدین منظور بیش از ۱۵۰۰۰ مقاله از نشریه های فنی و مهندسی در بازه زمانی ۱۳۹۲ تا ۱۳۹۶ از وب سایت نشریه ها گرداوری شد. در مرحله بعد عناصر متنی این مقاله ها شامل عنوان، چکیده و واژه های کلیدی استخراج، نرمال سازی و پردازش شد و پایگاه داده پیکره پژوهش ایجاد گردید. بر اساس تعداد مقاله های گردآوری شده، با استفاده از فرمول کوکران تعداد ۴۰۰ مقاله پایه که پیش از این در نشریه های مرتبط با موضوع منتشر شده بودند، به روش تصادفی- تناسبی، انتخاب شد. عنوان و چکیده این مقاله ها، به منظور دریافت نشریه های پیشنهادی سامانه، جهت چاپ مقاله در دو مرحله پیش و پس از بهبود دو چالش کمبود و پراکندگی داده به عنوان پرسمان وارد سامانه شد. سپس نتایج پیشنهادی در هر مرحله در قالب فایل اکسل ذخیره گردید. در نهایت میزان اثربخشی نتایج سامانه در هر مرحله، به روش اعتبارسنجی یک طرفه و بر اساس معیار دقت در k تعیین شد. فراوانی نسبی رده ها نشان داد در وضعیت موجود، نشریه هدف تنها در ۲۶ درصد از پرسمان ها در ۳ رتبه نخست پیشنهاد شده است. در راستای بهبود چالش کمبود داده با غنی سازی، نرمال سازی و پردازش داده ها اثربخشی نتایج در ۳ رتبه نخست به میزان ۱۵ درصد افزایش یافت. اما همچنان در بیش از ۳۰ درصد پرسمان ها، نشریه هدف در رتبه ۱۰ و بالاتر پیشنهاد شده بود. بنابراین در مرحله بعد به منظور بهبود چالش پراکندگی، دسته بندی موضوعی داده ها انجام و افزایش ۳۰ درصدی اثربخشی نتایج نسبت به مرحله پیشین در ۳ رتبه نخست حاصل گردید. بر این اساس یکی از عواملی که منجر به کاهش اثربخشی نتایج پیشنهادی سامانه ژورنال یاب رایسست می گردد، کمبود و پراکندگی داده ها است؛ که با غنی سازی پایگاه داده، بهبود فرآیند پردازش و دسته بندی موضوعی داده ها می توان به میزان قابل توجهی با این دو چالش مقابله و اثربخشی نتایج پیشنهادی سامانه را بهبود بخشید.
۲.

ارائه روشی نوین برای استخراج خودکار چهریزه ها در جستجوهای چهریزه ای (مورد مطالعه: حوزه زنان و زایمان)(مقاله علمی وزارت علوم)

کلید واژه ها: بازیابی اطلاعات چهریزه جستجوی چهریزه ای استخراج خودکار چهریزه.

حوزه های تخصصی:
تعداد بازدید : 449 تعداد دانلود : 768
هدف این پژوهش ابداع و معرفی الگوریتمی نو برای استخراج چهریزه هاست که امکان شناسایی تجربی چهریزه ها را با کمک پشتوانه انتشاراتی فراهم می کند. الگوریتم پیشنهادی بر مبنای دو ایده شکل گرفته است: ایده اول اینکه چهریزه در بافت بروز پیدا می کند. بنابراین، برای تشخیص چهریزه در یک بدنه متنی بایستی بافت یا بستر آن مورد بررسی قرار گیرد و ایده دوم این است که چهریزه نقطه تمرکز در یک درخت واژگانی است که نه بسیار عام و نه بسیار خاص است. در حوزه پزشکی، دامنه زنان و زایمان به عنوان بستر آزمون انتخاب گردید. سه پیکره متنی از درون پشتوانه انتشاراتی انتخاب شد. پیکره بستر، از چکیده و عنوان مجموعه مقالات موجود در ۲۰ مجله برتر حوزه انتخاب شد که در برگیرنده ۱۶۷۰۷۱ سند بود. پیکره دوم، پیکره منشأ بود که ۲۰۰۰ مقاله به صورت تصادفی از پیکره بستر انتخاب شد. پیکره سوم، پیکره واژگانی است که با استفاده از یک سرویس تحت وب و معیار رتبه بندی واژگان LIDF-value استخراج گردید. خروجی حاصل دربرگیرنده ۵۱۴ واژه بود. واژگان تکراری حذف شدند و سرانجام، ۴۸۰ واژه مهم شناسایی شد. سپس، واژگان در پیکره بستر با کمک مجموعه راهنما یعنی «مش» بسط داده شد و پس از آن، بر اساس دو شرط انتقال مبتنی بر تکرار یعنی بیشتر بودن اسناد مرتبط با واژه در بستر نسبت به منشأ و انتقال مبتنی بر رتبه یعنی رشد رتبه موجود واژه در پیکره بستر نسبت به منشأ که نشان دهنده عام شدن واژه است، چهریزه های کاندید استخراج شدند. سرانجام، با استفاده از سه قاعده اخص بودن، جایگزنی و اعم بودن، چهریزه های شناسایی شده اصلاح و نام گذاری شدند. در نهایت، ۲۶ چهریزه به عنوان چهریزه های حوزه زنان و زایمان شناسایی شدند. با مقایسه الگوریتم پیشنهادی با دیگر الگوریتم ها مشخص شد که ایجاد سه افراز (افراز منشأ و بدنه متنی و افراز برای شناسایی واژگان مهم) و مقایسه رفتار واژه در آن ها و سپس، ایجاد درخت بر اساس چهریزه های کاندید، یعنی ترکیب رویکرد آماری و هرس درخت می تواند نتایج مناسب تری نسبت به رویکرد صرفاً آماری یا هرس درخت داشته است. همچنین، مقایسه چهریزه های خروجی از الگوریتم و چهریزه های سنتی در این زمینه نشان داد که چهریزه های خروجی الگوریتم، خرد تر و برای مرور در ابزارهای بازیابی اطلاعات مفید تر هستند. همچنین، در این پژوهش مشخص شد که چهریزه های دامنه تخصصی از چهریزه های عمومی در حوزه پزشکی متفاوت است و مستقل از آن ها قابل شناسایی و تعریف است، اما نمی توان نتایج را به تمامی دامنه های پزشکی تعمیم داد و نیاز است که پژوهش هایی در دیگر حوزه ها صورت گیرد.
۳.

تحلیل سنجه های استنادمحور برای تعیین میزان ربط مقاله ها(مقاله علمی وزارت علوم)

کلید واژه ها: ربط مقاله ها هم استنادی زوج کتاب شناختی امسلر پیج رنک هیتس سنجه های استنادمحور

حوزه های تخصصی:
تعداد بازدید : 688 تعداد دانلود : 664
هدف: شناخت توانایی سنجه های استنادمحور (هم استنادی، زوج کتاب شناختی، امسلر، پیج رنک و هیتس(اعتبار و کانون)) برای تعیین میزان ربط مقاله ها با یکدیگر. روش: پژوهش حاضر از نظر هدف، کاربردی و از لحاظ شیوه گردآوری داده ها، پژوهشی توصیفی از نوع همبستگی است. جامعه آماری، مجموعه مقالات موجود در زیرمجموعه دسترسی آزاد پاب مد سنترال مجموعه آزمون سایترک بود  که بر اساس سه سنجه هم استنادی، زوج کتاب شناختی و امسلر با سایر مقالات رابطه استنادی داشتند. از میان 26262  مقاله، 30 مقاله به عنوان مقالات پایه انتخاب شد و مقالات مرتبط با هر یک از آن ها بر اساس سنجه ربط مش بازیابی گردید؛ هر یک از سنجه های استنادمحور متغیر مستقل و سنجه ربط مش متغیر وابسته بود. با استفاده از نرم افزار شبیه ساز ومپ سرور و پی.اچ.پی.مای ادمین یک پایگاه مای. اس. کیو.ال ایجاد شد؛ سپس، با مطالعه کلیه کدهای مورد نیاز از بسته کد منبع سایترک، کدهای لازم با اعمال تغییرات ضروری، اجرا و نتایج حاصل در پایگاه مای. اس. کیو.ال وارد شد. با نوشتن پرس وجو به زبان اس. کیو.ال، شبکه استنادی مجموعه به صورت کامل استخراج شد سپس با کدنویسی به زبان پایتون اعداد مربوط به پیج رنک و هیتس (اعتبار و کانون) به صورت جداگانه محاسبه گردید. یافته ها: نتایج نشان داد تمامی شش سنجه در سطح یک صدم همبستگی معنادار و مثبت با میزان ربط مقاله ها داشت؛ به عبارت دیگر، با افزایش مقادیر هریک از سنجه ها، درجه ربط مقاله ها نیز افزایش یافت. بیشترین میزان همبستگی مربوط به سنجه امسلر و پس از آن، زوج کتاب شناختی بود. پس از سنجه ها ی امسلر و زوج کتاب شناختی، بیشترین همبستگی میان متغیر هیتس(اعتبار) با ربط مقاله ها بود. متغیر پیج رنک در مرتبه چهارم قرار داشت؛ در نهایت، کم ترین میزان همبستگی با ربط مقاله ها، مربوط به سنجه های هم استنادی و هیتس( کانون) بود؛ بنابراین، از میان سنجه های استنادی  بررسی شده در این پژوهش، سنجه های امسلر، زوج کتاب شناختی، هیتس(اعتبار) و پیج رنک بیش از سایر سنجه ها از پتانسیل لازم برای تعیین میزان ربط مقاله ها برخوردار بودند.   نتیجه گیری: بر اساس یافته های پژوهش می توان گفت سنجه های استنادمحور مطالعه شده قادرند درجه ربط مقاله ها را برآورد کنند و در بافتارهای مختلف بازیابی اطلاعات شامل موتورهای جست وجو، پایگاه های اطلاعاتی و استنادی، سامانه های پیشنهاددهنده و حتی کتابخانه های دیجیتالی برای دسترسی به مقالات مرتبط، پیشنهاد مقالات مشابه و رتبه بندی نتایج بازیابی کاربرد داشته باشند؛ همچنین، لازم است به سنجه امسلر که نسبت به دو سنجه سنتی هم استنادی و زوج کتاب شناختی، در سامانه های اطلاعاتی کمتر استفاده شده است، بیش از پیش  توجه شود؛ از طرفی، علیرغم اینکه سنجه هم استنادی در برخی از پایگاه ها و سامانه های بازیابی اطلاعات بین المللی( مانند ساینس دایرکت و سایت سیر) برای بازیابی مدارک مرتبط و پیشنهاد مدارک مشابه استفاده می شود در مقایسه با سایر سنجه ها از کارایی کمتری برخودار است.
۴.

استخراج کلمات و عبارات کلیدی از متون فارسی(مروری بر پژوهش های صورت گرفته)(مقاله علمی وزارت علوم)

کلید واژه ها: استخراج کلمات کلیدی استخراج عبارات کلیدی پردازش زبان طبیعی زبان فارسی بررسی مروری

حوزه های تخصصی:
تعداد بازدید : 439 تعداد دانلود : 791
استخراج کلمات/ عبارات کلیدی متن، پیش نیاز بسیاری دیگر از وظایف حوزه پردازش زبان طبیعی است. اما بررسی متون فارسی و انگلیسی این حوزه نشان می دهد، تلاش های انگشت شماری برای استخراج کلمات/ عبارات کلیدی از متون فارسی صورت گرفته است. لذا، این مقاله، با هدف تعیین موقعیت کنونی پردازش زبان طبیعی فارسی و به طور خاص استخراج کلمات/ عبارات کلیدی از متون فارسی، به مرور خلاصه ای از مقالات فارسی و انگلیسی منتشر شده در این حوزه که از متون فارسی برای آزمودن ایده هایشان استفاده کرده اند ، می پردازد؛ سپس هر مقاله را از نظر روش شناسی، نحوه اجرا و پیاده سا زی، روش ارزیابی و معیارهای آن مورد تعمق قرار داده و به چالش می کشد . در مجموع 14 مقاله فارسی و 6 مقاله انگلیسی به استخراج کلمات و عبارات کلیدی از متون فارسی پرداخته اند . روش بیشتر این مقالات، استفاده از اطلاعات آماری و زبان شناختی بوده است. اکثر این مقالات یا در روش شناسی انتخاب شده ایراد دارند و یا نویسندگان نتوانسته اند ایده پیشنهادی شان را به وضوح برای خواننده تبیین نمایند. در بسیاری از مقالات، از مجموعه داده استانداردی برای ارزیابی سیستم استفاده نشده و نحوه محاسبه معیارهای ارزیابی مبهم یا دارای اشکال است . در مجموع، به جز 3 مقاله که روش اجرا شده را به نحو نسبتاً قابل قبولی گزارش کرده اند ، سایر مقالات قابلیت تکرار پذیری و تعمیم ندارند. لذا نمی توان از آن ها به عنوان معیار پایه ای برای ارزیابی سیستم های آینده استفاده کرد یا از ایده مطرح شده در آن ها با اطمینان در ساخت و توسعه نرم افزارهای کاربردی و عملی در حوزه استخراج کلمات کلیدی استفاده نمود .
۵.

روند رشد رویکرد تحلیل چهریزه ای در سازماندهی دانش: مروری صد ساله(مقاله علمی وزارت علوم)

کلید واژه ها: سازماندهی دانش بازیابی اطلاعات چهریزه تحلیل چهریزه ای مرور سیستماتیک

حوزه های تخصصی:
تعداد بازدید : 795 تعداد دانلود : 585
رویکرد تحلیل چهریزه ای از اوایل قرن بیستم تاکنون روند رشد مستمری داشته است. هدف این مقاله مرور سیستماتیک پژوهش ها و مستندات طرح های سازماندهی چهریزه ای و نیز تقسیم بندی موضوعی و زمانی این مطالعات است. با مرور صورت گرفته، روند رشد و توسعه کاربردهای این رویکرد در ابزارهای سازماندهی و بازیابی اطلاعات شناسایی و پیشنهاداتی برای پژوهشگران آینده ارائه گردید. برای این منظور در گام اول، جست وجوی جامع در منابع و بررسی اولیه اسناد؛ در گام دوم، طبقه بندی و پالایش اسناد؛ و در گام سوم، طبقه بندی زمانی و موضوعی اسناد و تحلیل متون و شناسایی شکاف های موجود و در نهایت، پیشنهاداتی برای پوشش این شکاف ها صورت گرفت. حاصل تلاش های انجام شده قبلی، توسعه رده بندی های چهریزه ای، اصطلاحنامه ها و سرعنوان های چهریزه ای و نظام های بازیابی اطلاعات چهریزه ای بود که به طوری گسترده تا دهه 1990 میلادی ادامه داشت؛ اما بعد از آن با توسعه سیستم های کامپیوتری و وب، چهریزه ها نقش دیگری در بازیابی اطلاعات در پایگاه داده بر عهده گرفتند. در این دوره مجموعه ای از مدل ها، فراداده های چهریزه ای، رابط های کاربری چهریزه ای و آنتولوژی های چهریزه ای شکل گرفت و نرم افزارهای متعددی در این زمینه توسعه یافت. رویکرد تحلیل چهریزه ای از حدود اوایل قرن بیستم تا سال 1990 میلادی بر مبنای نظام منطقی (پیشینی) طبقه بندی علوم پیش رفته است. اما از آن سال به بعد، به دلیل گسترش توانایی های کامپیوتری و رشد نیازهای کاربران، دیدگاه منطقی جای خود را به دیدگاه محاسباتی و کاربرمدار (پسینی) سپرد. ایجاد ساختار چهریزه ها در محیط وب معنایی و ایجاد استانداردهای جدید، بهره برداری از روش های مؤثرتر درک رفتار کاربران و توجه به توسعه و تحول تاریخی علم، شکاف هایی است که هنوز نیاز به مطالعه و بررسی بیشتر دارد. پوشش این شکاف ها، تأثیر پایدار فرایند تحلیل چهریزه در آینده را نوید می دهد.

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان