آرشیو

آرشیو شماره ها:
۱۱۷

چکیده

رده بندی متون پژوهشی به منظور شناسایی و تحلیل عرضه و تقاضای پژوهشی در حوزه های مختلف علوم اهمیت ویژه ای دارد. در این میان رده بندی پژوهش های حوزه محیط زیست به دلیل اهمیت فراوان آن در کشور و نیز میان رشته ای بودن آن ضروری است. این پژوهش روش رده بندی تک رده ای متون پژوهشی این حوزه را با استفاده از ماشین بردار پشتیبان ارائه می دهد و به ارزیابی پارامترهای مهم تأثیرگذار در کیفیت این رده بندی می پردازد. نتایج نشان می دهد که استفاده از مجموعه داده هسته توصیفی در یادگیری مدل، کارایی بهتری نسبت به هسته محتوایی دارد. همچنین، استفاده از هسته چندجمله ای و وزن دهی دودویی واژه ها در ماتریس بردار ویژگی ها نتایج بهتری نسبت به حالت های معمول دیگر ارائه می کند. در این مطالعه، روش جدید وزن دهی با نام NG-TF معرفی و ارائه شده است که نتایج ارزیابی آن نسبت به روش های دیگر، به ویژه در معیار دقت، برتری قابل توجهی دارد. از این رو، می توان از این روش وزن دهی برای تعیین واژگان نماینده یک حوزه پژوهشی استفاده کرد.

تبلیغات