پیش بینی طرح تقلب در گزارشگری مالی با استفاده از رویکرد یادگیری ماشین در فضای چند کلاسه (مقاله علمی وزارت علوم)

درجه علمی: نشریه علمی (وزارت علوم)

نویسندگان: توحید کاظمی پرویز پیری

منبع: پژوهش های تجربی حسابداری سال یازدهم زمستان 1401 شماره 46

کلید واژه ها: طرح تقلب گزارشگری مالی متقلبانه یادگیری ماشین دسته بندی چند کلاسه

حوزه های تخصصی:

doi: 10.22051/jera.2022.41290.3040

شماره صفحات: ۲۵۵ - ۲۸۰

دریافت مقاله تعداد دانلود : ۹۳۸

آرشیو

چکیده

هدف از انجام پژوهش حاضر بررسی عملکرد الگوهای یادگیری ماشین در پیش بینی طرح های تقلب مورد استفاده در گزارشگری مالی در فضای چند کلاسه با استفاده از مجموعه داده نامتوازن است. از این رو صورت های مالی 134 شرکت پذیرفته شده در بورس اوراق بهادار تهران در قلمرو زمانی سال 1387 الی 1399 با استفاده از روش های رگرسیون لجستیک، درخت تصمیم، الگوریتم گرادیان تقویت شده و ماشین بردار پشتیبان مورد تحلیل و بررسی قرار گرفته اند. الگوهای مزبور در محیط پایتون با رویکرد چندکلاسه پیاده سازی و اجرا شدند. معیار ارزیابی عملکرد محاسبه و مقایسه شد. افزون بر این عملکرد الگوهای یادگیری ماشین در تشخیص نوع تقلب در صورت های مالی با رویکرد دوکلاسه و بر اساس مجموعه داده متوازن نیز بررسی گردید. نتایج پژوهش نشان می دهد تفاوت معنادار در عملکرد الگوهای یادگیری ماشین در فضای چند کلاسه وجود دارد و روش ماشین بردار پشتیبان نسبت به سایر روش ها عملکرد بهتری دارد. با تقلیل فضای مسئله به دسته بندی دو کلاسه تفاوت معنادار در عملکرد الگوهای یادگیری ماشین در تشخیص گزارش های مالی مشکوک به "بیش نمایی دارایی، کم نمایی بدهی و هزینه"، "بیش نمایی دارایی و کم نمایی هزینه" و "کم نمایی هزینه و بدهی" تایید نشد. با این حال، عملکرد ماشین بردار پشتیبان بر عملکرد روش رگرسیون لجستیک و درخت تصمیم در پیش بینی گزارش های مالی مشکوک به "بیش نمایی دارایی و درآمد" ارجح است. پژوهش حاضر با توسعه فضای مسئله با هدف دسته بندی چندکلاسه سعی دارد شکاف تحقیقاتی موجود در قلمرو موضوعی پژوهش را رفع نماید.

Financial Reporting Fraud Scheme Prediction via Machine Learning Approach – Multiclass Classification

This paper attempts to evaluate the performance of machine learning models in fraudulent financial Reporting schemes prediction via a multi-classification approach and using an unbalanced dataset. Therefore, the financial statements of 134 companies listed on the Tehran Stock Exchange from 2009 to 2021 were investigated by Logistic Regression, Decision Tree, Boosting Algorithms, and Support Vector Machine. Models were programmed with Python and Performance indicators were calculated and compared. Furthermore, the machine learning model’s performance was investigated in binary classification with the balanced dataset to predict each fraud scheme exclusively. According to the results via a multi-classification approach, then the significant difference between machine learning models’ performance was approved. Support Vector Machin was preferred in multiclass problem space with the unbalanced data set. To predict fraud schemes via binary classification, a significant difference between machine learning models’ performance was not approved except to predict the “Overstatement assets and income” scheme. Support Vector Machin was preferred to Logistic Regression and Decision Tree model. The present research attempts to fill the research gap in the research area by developing machine learning models with a multi-classification approach.

پیش بینی طرح تقلب در گزارشگری مالی با استفاده از رویکرد یادگیری ماشین در فضای چند کلاسه (مقاله علمی وزارت علوم)

درجه علمی: نشریه علمی (وزارت علوم)

آرشیو

آرشیو شماره ها:
۴۹

سال ۱۴۰۲ (۳)

سال ۱۴۰۱ (۴)

سال ۱۴۰۰ (۴)

سال ۱۳۹۹ (۴)

سال ۱۳۹۸ (۴)

سال ۱۳۹۷ (۴)

سال ۱۳۹۶ (۴)

سال ۱۳۹۵ (۴)

سال ۱۳۹۴ (۴)

سال ۱۳۹۳ (۴)

سال ۱۳۹۲ (۴)

سال ۱۳۹۱ (۴)

سال ۱۳۹۰ (۲)

چکیده

Financial Reporting Fraud Scheme Prediction via Machine Learning Approach – Multiclass Classification

تبلیغات

پیش بینی طرح تقلب در گزارشگری مالی با استفاده از رویکرد یادگیری ماشین در فضای چند کلاسه (مقاله علمی وزارت علوم)

درجه علمی: نشریه علمی (وزارت علوم)

آرشیو

آرشیو شماره ها: ۴۹

چکیده

Financial Reporting Fraud Scheme Prediction via Machine Learning Approach – Multiclass Classification

تبلیغات

آرشیو شماره ها:
۴۹