دانلود پایان نامه پیش بینی کدهای SNI از توصیفات شرکت

عنوان فارسی

پیش بینی کدهای SNI از توصیفات شرکت: یک راهکار یادگیری ماشینی

عنوان انگلیسی

Predicting SNI Codes from Company Descriptions - A Machine Learning Solution

کلمات کلیدی :

  یادگیری ماشینی؛ دسته بندی متن؛ SNI؛ بیز ساده؛ SVM؛ بیش نمونه گیری؛ کم نمونه گیری

رشته های مرتبط مهندسی کامپیوتر
تعداد صفحات پایان نامه انگلیسی : 43 دانشگاه : Linnaeus University
سال انتشار : 2023 تعداد رفرنس : 17
فرمت فایل ترجمه شده : PDF و WORD قابل ویرایش کیفیت ترجمه : تخصصی ویژه با کیفیت طلایی
پاورپوینت : ندارد

سفارش پاورپوینت این پایان نامه

وضعیت ترجمه : انجام شده و با خرید بسته می توانید فایل ترجمه را دانلود کنید
computer thesis
قیمت دانلود ترجمه پایان نامه
439,000 تومان
پایان نامه حاضر با عنوان "پیش بینی کدهای SNI از توصیفات شرکت: یک راهکار یادگیری ماشینی" بصورت کاملا تخصصی توسط تیم "مهندسی کامپیوتر" فرداپیپر ترجمه شده است. اگر موضوع پایان نامه ارشد یا دکتری شما مشابه این موضوع باشد، مطالعه ی این تز کمک شایانی به شما خواهد کرد تا بتوانید به نحو احسن پروژه خود را تکمیل نمایید.
فهرست مطالب

1. مقدمه 2. روش 3. پیشینه نظری 4. پروژه تحقیقاتی – پیاده سازی 5. نتایج 6. آنالیز و بحث و بررسی 7. نتیجه گیری و کارهای آتی

ترجمه چکیده

چکیده – هدف این مطالعه، توسعه یک راهکار خودکار برای اختصاص دادن کدهای منطقه صنعت به کسب و کارها براساس محتوای توصیفات کسب و کارشان است. «دسته بندی صنعتی استاندارد» (SNI) سوئد، سیستم مورد استفاده توسط اداره آمار سوئد (SCB) برای طبقه بندی کسب و کارها برای گزارش آمارهای آنها می باشد. اختصاص دادن کدهای SNI تاکنون به صورت دستی توسط فرد ثبت کننده یک شرکت جدید انجام شده است، اما این کار اصلاً یک راهکار بهینه نیست. تفکیک تعدادی از 88 گروه اصلی مناطق صنعتی از همدیگر دشوار است و اغلب باعث اختصاص های غیرصحیح می شود. رویکرد ما برای این مسئله، آموزش دادن یک مدل یادگیری ماشینی با استفاده از الگوریتم های دسته بندی «بیز ساده» و SVM و انجام یک آزمایش تجربی بود. در سال 2019، داهلقویست و استرندلوند این رویکرد را آزمایش کردند و با استفاده از دسته بندی کننده «تقویت گرادیانی»، به نمره دقت 52 درصد رسیدند، اما این نمره برای پیاده سازی واقعی، بسیار کم تلقی می شد. هدف اصلی ما رسیدن به دقت بالاتر از دقت آنها بود که ما در نهایت در بهترین مدل SVM خود به نمره 60.11 درصد رسیدیم. مشابه با داهلکویست و استراندلوند، نتیجه گیری کردیم که کیفیت کم مجموعه داده ها، مانع اصلی برای دستیابی به نمره های بالاتر بود. این مجموعه داده مورد استفاده ما شدیداً نامتوازن بود و زمان زیادی صرف بررسی و بکارگیری «بیش نمونه گیری» و «کم نمونه گیری» به عنوان استراتژی هایی برای رفع این مسئله، شد. با این حال، در مرحله آزمون دریافتیم که هیچکدام از این استراتژی ها هیچگونه تاثیر مثبتی بر نمره های دقت نداشت.

چکیده انگلیسی

This study aims to develop an automated solution for assigning area of industry codes to businesses based on the contents of their business descriptions. The Swedish standard industrial classification (SNI) is a system used by Statistics Sweden (SCB) for categorizing businesses for their statistics reports. Assignment of SNI codes has so far been done manually by the person registering a new company, but this is a far from optimal solution. Some of the 88 main group areas of industry are hard to tell apart from one another, and this often leads to incorrect assignments. Our approach to this problem was to train a machine learning model using the Naive Bayes and SVM classifier algorithms and conduct an experiment. In 2019, Dahlqvist and Strandlund had attempted this and reached an accuracy score of 52 percent by use of the gradient boosting classifier, but this was considered too low for real-world implementation. Our main goal was to achieve a higher accuracy than that of Dahlqvist and Strandlund, which we eventually succeeded in - our best-performing SVM model reached a score of 60.11 percent. Similarly to Dahlqvist and Strandlund, we concluded that the low quality of the dataset was the main obstacle for achieving higher scores. The dataset we used was severely imbalanced, and much time was spent on investigating and applying oversampling and undersampling as strategies for mitigating this problem. However, we found during the testing phase that none of these strategies had any positive effect on the accuracy scores.

توضیحات

محتوی بسته دانلودی:

فایل PDF پایان نامه انگلیسی فایل ورد قابل ویرایش (WORD) و PDF ترجمه پایان نامه به صورت کاملا مرتب ترجمه شکل ها و جداول انجام شده است
قیمت : 439,000 تومان

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “دانلود پایان نامه پیش بینی کدهای SNI از توصیفات شرکت”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

چهار × 3 =

مقالات ترجمه شده

نماد اعتماد الکترونیکی

پشتیبانی

logo-samandehi