کلید واژه ها: داده کاوی متن کاوی تحلیل هم رخدادی واژگان پایگاه اطلاعاتی رایسست

حوزه های تخصصی:
شماره صفحات: ۵۴ - ۷۳
دریافت مقاله   تعداد دانلود  :  ۵۰

آرشیو

آرشیو شماره ها:
۵۹

چکیده

هدف: هدف اصلی پژوهش حاضر بررسی روابط موضوعی در عناوین منابع مورد استفاده توسط کاربران رایسست با استفاده از تکنیک متن کاوی بود. بنابراین، به بازتاب چگونگی روابط موضوعی در منابع اطلاعاتی کاربران در مرکز رایسست مبادرت شده، تا از طریق شناخت به رفتار و احساس استفاده کنندگان دست یابند. روش پژوهش: روش پژوهش مبتنی بر متن کاوی بود، که به داده کاوی بر روی متن، تحلیل متن و به منظور فرایند استخراج اطلاعات با کیفیت از متن اشاره دارد. دسترسی اطلاعات به متن کامل مقالات مجلات علمی – پژوهشی، علمی – ترویجی، مجموعه مقالات کنفرانس ها و همایش های علمی، کتاب های لاتین و فارسی جامعه آماری پژوهش را تشکیل داده، که با استفاده از روش سرشماری، کلیه داده های حاصل از گزارش گیری توسط رایسست بررسی گردید. به منظور تجزیه و تحلیل داده ها و تحلیل متن از نرم افزار ویانت، و برای پاکسازی و نرمال سازی داده ها از نرم افزار پایتون بهره جویی گردید. یافته ها: براساس یافته ها از داده های حاصل شده، 21 کلمه و 160 کلمه موضوعی پرتکرار از منبع مورد استفاده در پایگاه اطلاعاتی رایسست مشخص گردید. دور نمای لوم از چگونگی توزیع کلمات موضوعی با تکرار بالا تهیه شده و ضریب همبستگی تکرار موضوعات پر استفاده در عنوان های منابع اطلاعاتی تدوین شد. به منظور تدوین نمایه درهم کرد کلمات موضوعی پر تکرار ترند (Trend) استفاده شد. نتیجه گیری: نتایج نشان داد که تدوین پژوهش در مجموعه سازی منابع الکترونیکی پایگاه های اطلاعاتی و پیش نگری در آینده این دسته از منابع به مدیران مراکز اطلاع رسانی و کاربران آنها مفید است.

Identifying the Thematic Relationships between the Resources Used By the Users of the Regional Science and Technology Information Center Using the Text Mining Technique

Objective: The main purpose of the present research was to investigate thematic relationships in the topics of resources used by RICeST users, using text mining techniques. Therefore, it has been attempted to reflect how the thematic relationships are in the information resources of users in the RICeST Center, in order to gain access to the required materials through understanding the behavior and feelings of users and clients. Methodology : The research method was based on text mining, which refers to data mining on the text, and text analysis in order to extract quality information from the text. Information access to the full text of articles in scientific-research, scientific-promotional journals, collections of scientific conference and conference articles, English and Persian books formed the statistical population of the research, and all the data obtained from the reporting by RICeST were checked using the census method. Data analysis and text analysis was done by Vianet software, and Python software was used to clean and normalize the data. Results : In order to determine the main view of the most used topics by RICeST users, based on the findings from the obtained data, 21 frequent words (used more than 2000 times in the RICeST database in a two-year interval 2018/02/08 – 2020/02/08). Conclusion: the conclusion was based on the fact that the compilation of the research in the collection of electronic resources of information databases and foresight in the future of this category of resources is useful to the managers of information centers and their users.

تبلیغات