فاطمه زرمهر

فاطمه زرمهر

مدرک تحصیلی: دانشجوی دکتری علم اطلاعات و دانش شناسی، دانشکده علوم تربیتی و روان شناسی، دانشگاه اصفهان، اصفهان، ایران

مطالب

فیلتر های جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۳ مورد از کل ۳ مورد.
۱.

مقایسه عملکرد رویکردهای کشف و استخراج موضوعات کتاب های الکترونیکی(مقاله علمی وزارت علوم)

کلید واژه ها: استخراج کلیدواژه های موضوعی متن کاوی مدلسازی موضوعی تجزیه ماتریس نامنفی ماشین بردار پشتیبان کتاب الکترونیکی

حوزه های تخصصی:
تعداد بازدید : 78 تعداد دانلود : 167
استخراج کلمات کلیدی از مسائل مهم در زمینه پردازش و تحلیل متن بوده و خلاصه ای سطح بالا و دقیق از متن ارائه می دهد. بنابراین انتخاب روش مناسب برای استخراج کلمات کلیدی متن حائز اهمیت است. هدف پژوهش حاضر، مقایسه عملکرد سه رویکرد درکشف و استخراج کلیدواژه های موضوعی کتاب های الکترونیکی با استفاده از تکنیک های متن کاوی و یادگیری ماشین است. در این راستا سه رویکرد آزمایشی شامل: 1.اجرای متوالی فرآیند خوشه بندی، ارتقا کیفیت خوشه ها از نظر معنایی و غنی سازی کلمات توقف حوزه خاص؛ 2. استفاده از الگوی کلیدواژه های تخصصی؛ 3. استفاده از بخش های مهم متن در کشف و استخراج واژگان کلیدی و موضوعات مهم متن، معرفی و مورد مقایسه قرار گرفته است. جامعه آماری، شامل 1000 عنوان کتاب الکترونیکی از زیرشاخه های موضوعی حوزه علم اطلاعات و دانش شناسی بر اساس نظام رده بندی کنگره است که بعد از کسب اطلاعات کتابشناختی آن از پایگاه کتابخانه کنگره، اقدام به تهیه متن اصلی گردید. استخراج کلیدواژهای موضوعی و خوشه بندی داده های آموزش به کمک الگوریتم تجزیه نامنفی ماتریس و با سه رویکرد آزمایشی انجام شد و کیفیت و عملکرد خوشه های موضوعی حاصل از اجرای سه رویکرد در بخش دسته بندی خودکار داده های آزمایشی به کمک ماشین بردار پشتیبان مورد مقایسه قرار گرفت. یافته ها نشان داد افت همینگ (0.020) یا میزان خطا در دسته بندی صحیح متون آزمایشی در رویکرد سوم یعنی بهره گیری از بخش های مهم متن در استخراج کلیدواژه های موضوعی، از دو رویکرد دیگر کمتر است. همچنین امتیاز F1 (0.82) که میانگین دو معیار دقت (0.87) و بازخوانی (0.78) و بازتابی از عملکرد درست فرآیند دسته بندی در برچسب گذاری موضوعی متون است، در رویکرد سوم بهتر از نتایج دو رویکرد دیگر است. نتایج تحلیل ها نشان داد که کیفیت و انسجام معنایی خوشه های موضوعی حاصل از رویکرد سوم یعنی استفاده از بخش های مهم متن در کشف و استخراج موضوع، در مقایسه با دو رویکرد دیگر بهتر بود. بعلاوه کلیدواژه های به دست آمده از خوشه های موضوعی رویکرد سوم را می توان در مجموعه های توصیف نشده و ناشناخته به منظور استخراج محتوای موضوعی ناآشکار کل مجموعه به کار برد.
۲.

مدل سازی موضوعی و کاربرد آن در پژوهش ها: مروری بر ادبیات تخصصی(مقاله علمی وزارت علوم)

کلید واژه ها: متن کاوی مدل سازی موضوعی کشف موضوع سازماندهی اطلاعات تشخیص موضوع

حوزه های تخصصی:
تعداد بازدید : 136 تعداد دانلود : 147
مقدمه : مدل سازی موضوعی یکی از تکنیک های متن کاوی است که امکان کشف موضوعات نامعلوم در مجموعه اسناد، تفسیر اسناد بر اساس این موضوعات و استفاده از این تفاسیر برای سازماندهی، خلاصه کردن و جستجوی متن ها را به طور اتوماتیک میسر می کند. آشنایی با مفهوم و تکنیک مدل سازی موضوعی، و کاربرد آن در کشف موضوعات و سازمان دهی منابع اطلاعاتی از اهداف اصلی این پژوهش است. روش شناسی : پژوهش حاضر از نوع کتابخانه ای است که در آن، ضمن معرفی مدل سازی موضوعی، به دسته بندی و مرور کاربردهای این تکنیک بر اساس ماهیت عملکردی آن و ارائه نمونه تحقیقاتی که از این تکنیک استفاده نموده اند پرداخته است. یافته ها : الگوریتم های مدل سازی موضوعی علاوه بر سه هدف اصلی مبنی بر کشف موضوعات پنهان، تفسیر اسناد بر اساس موضوعات و نهایتاً سازمان دهی و طبقه بندی متون، در کشف موضوعات و روابط پنهان در حوزه های علوم، بازیابی اطلاعات، دسته بندی مدارک بر اساس موضوعات، کشف الگوهای برجسته و رویدادهای در حال ظهور، خوشه بندی مفاهیم حوزه های علمی، تحلیل سیر تحول مفهومی در طول دوره های تاریخی، تعیین روابط سلسه مراتبی مفاهیم یک حوزه یا زمینه خاص علمی و غنی سازی فهرست واژگان کاربرد دارد. نتیجه : مدل سازی موضوعی با تکیه بر یادگیری ماشین و بهره گیری از دانش هوش مصنوعی به عنوان یکی از رویکردهای نوین سازماندهی منابع اطلاعاتی مطرح شده و مطالعات جدی در این زمینه در حال انجام است. لذا با کاربرد الگوریتم های مدل سازی موضوعی در راستای خودکارسازی استخراج موضوع و کشف موضوعات نهان موجود در منبع می توان بر تقویت و روزآمدسازی نظام های نوین سازمان دهی منابع اطلاعاتی عمل کرد.
۳.

ضرورت توجه به «بین رشته ای ها» در نظام های رده بندی علم و منابع کتابخانه ای: گذر از منطق کلاسیک به سوی منطق فازی(مقاله علمی وزارت علوم)

تعداد بازدید : 419 تعداد دانلود : 244
طبقه بندی کلاسیک با منطق دو ارزشی بنیان غالب طرح های طبقه بندی موجود است، اما با تحولات اخیر و ظهور علوم میان رشته ای، تعیین درست جایگاه آن ها در طبقه بندی علم با چالش مواجه شده است. در این مقاله از روش های تحلیل اسنادی و تحلیل محتوا استفاده شد. در بخش تحلیل اسنادی، با استفاده از روش نمونه گیری هدفمند و با کمک فیش برگه، اسناد مربوط به موضوع بررسی شد. در بخش تحلیل محتوا، 125 طرح (شامل 75طرح طبقه بندی علم و 50 طرح رده بندی کتابخانه ای کتاب شناختی) شناسایی و اطلاعات مربوط به شاخه ها، زیرشاخه ها، واضعان و غیره این طرح ها در چک لیست های تهیه شده، ثبت شد. بنابراین، از روش سرشماری استفاده شد. نتایج به دست آمده حاکی از شناسایی 75 نظام طبقه بندی علم است که قدیمی ترین آن رده بندی ودایی (حدود 600 ق.م) است. در رابطه با نظام های رده بندی کتابخانه ای کتاب شناختی، 50 نظام رده بندی در چهار دسته بندی نظام های رده بندی عهد باستان، قرون وسطی، قرون جدید و قرون معاصر شناسایی شدند. بررسی شاخه های اصلی و زیرشاخه های نظام های «طبقه بندی علم» و همین طور «نظام های رده بندی کتابخانه ای کتابشناسی» نشان داد که مبنای «تقسیم بندی علوم» یا «تقسیم بندی منابع مکتوب» در این نظام ها، موضوع یا رشته بوده است و به طور مستقل به میان رشته ها توجه نشده است. بنابراین، ما با سرشاخه های موضوعی دوتایی، سه تایی، چهارتایی، پنج تایی و غیره هم در اکثر نظام های رده بندی کتابخانه ای کتاب شناختی و هم در نظام های طبقه بندی علوم مواجه هستیم که درواقع برگرفته از منطق کلاسیک است. همچنین، نتایج نشان داد که میان رشته ها فاقد جایگاه به طور مستقل در 125 نظام رده بندی هستند. درمجموع، منطق فازی به عنوان روش و منطق جایگزین در طبقه بندی های علوم و رده بندی های منابع کتابخانه ای پیشنهاد می شود.

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان