آرشیو

آرشیو شماره ها:
۴۶

چکیده

کمتر کسی در مورد تفاوت های موجود بین زبان های مختلف تردید دارد، اما می توان این تفاوت ها را مدل سازی نموده و الگویی را استخراج کرد که به کمک آن بتوان یک زبان مورد نظر را از میان سایر زبان ها و بصورتی اتوماتیک شناسایی کرد؟ منظور از مدل سازی، بررسی ساختاری زبان های مختلف در یک چارچوب یکسان و در ارتباط با فیزیک و کالبد کلمات است.در این مقاله، طول کلمه و توزیع آماری آن را تحلیل کرده و نشان خواهیم داد که شناسایی پنج زبان زنده دنیا با مطالعه طول کلمات آن ها کاملا امکان پذیر است. این مدل سازی امکانات و تسهیلات جدیدی را در فضای فناوری اطلاعات و بهینه سازی فرآیندهای داده کاوی فراهم خواهد آورد.

تبلیغات