دانلود ترجمه مقاله مقایسه روش های طبقه بندی خودکار متن
عنوان فارسی |
مقایسه روش های طبقه بندی خودکار متن |
عنوان انگلیسی |
Comparing automated text classification methods |
کلمات کلیدی : |
  طبقه بندی متن؛ رسانه های اجتماعی؛ یادگیری ماشین؛ محتوای تولید شده توسط کاربر؛ تحلیل تمایلات؛ پردازش زبان طبیعی |
درسهای مرتبط | مهندسی کامپیوتر |
تعداد صفحات مقاله انگلیسی : 19 | نشریه : ELSEVIER |
سال انتشار : 2019 | تعداد رفرنس مقاله : 74 |
فرمت مقاله انگلیسی : PDF | نوع مقاله : ISI |
پاورپوینت :
دانلود پاورپوینت مقاله تکنیک های دسته بندی خودکار متن |
وضعیت ترجمه مقاله : انجام شده و با خرید بسته می توانید فایل ترجمه را دانلود کنید |
1. مقدمه 2. تحقیقات مرتبط 3. روش های طبقه بندی خودکار متن 4. طراحی و روش تحقیق 5. نتایج 6. پیش بینی های مبتنی بر رفتار واقعی مصرف کننده و پیامدهای اقتصادی انتخاب روش های زیر بهینه 7. بحث و بررسی
چکیده – رسانه های اجتماعی آنلاین رشد داده های متنی ساختار نیافته را هدایت می کنند. بسیاری از برنامه های بازاریابی نیازمند ساختن این داده ها در مقیاس های غیر قابل دستیابی برای برنامه نویسی انسانی نظیر شناسایی تغییر ارتباطات در احساسات یا سایر مقوله های تعریف شده توسط محقق هستند. روشهای مختلفی برای طبقه بندی خودکار متن ساختار نیافته ارائه شده است. در این مقاله عملکرد ده روش (پنج الگوریتم یادگیری ماشین ، پنج الگوریتم مبتنی بر واژگان) در 41 مجموعه داده که پلتفرم های مهم رسانه های اجتماعی ، اندازه های مختلف نمونه و زبان ها را پوشش می دهد ، مقایسه می شود. تاکنون تحقیقات بازاریابی به طور عمده متکی بر ماشینهای بردار پشتیبانی (SVM) و پرس و جو زبانی و تعداد کلمات (LIWC) است. در تمام کارهایی که مطالعه می کنیم ، چه جنگلی تصادفی (RF) یا نایوبیز (NB) از لحاظ کشف صحیح شهود انسانی بهترین عملکرد را دارا هستند. به طور خاص ،RF همواره از عملکرد بسیار خوبی برای تمایلات سه گروه، NB برای اندازه نمونه های کوچک برخوردار است. SVM هرگز از روش های باقیمانده پیشی نمی گیرد. تمام رویکردهای مبتنی بر واژگان، به ویژه LIWC ، در مقایسه با یادگیری ماشین دارای عملکرد ضعیفی هستند. در برخی از برنامه ها ، موارد صحیح فقط تا حدودی از محدوده شانس فراتر می روند. از آنجا که ملاحظات بیشتر در مورد انتخاب طبقه بندی متن به نفع NB و RF است ، نتایج ما نشان می دهد که تحقیقات بازاریابی می تواند از درنظر گرفتن این گزینه ها سود ببرد.
Online social media drive the growth of unstructured text data. Many marketing applications require structuring this data at scales non-accessible to human coding, e.g., to detect communication shifts in sentiment or other researcher-defined content categories. Several methods have been proposed to automatically classify unstructured text. This paper compares the performance of ten such approaches (five lexicon-based, five machine learning algorithms) across 41 social media datasets covering major social media platforms, various sample sizes, and languages. So far, marketing research relies predominantly on support vector machines (SVM) and Linguistic Inquiry and Word Count (LIWC). Across all tasks we study, either random forest (RF) or naive Bayes (NB) performs best in terms of correctly uncovering human intuition. In particular, RF exhibits consistently high performance for three-class sentiment, NB for small samples sizes. SVM never outperform the remaining methods. All lexicon-based approaches, LIWC in particular, perform poorly compared with machine learning. In some applications, accuracies only slightly exceed chance. Since additional considerations of text classification choice are also in favor of NB and RF, our results suggest that marketing research can benefit from considering these alternatives.
ترجمه این مقاله در 33 صفحه آماده شده و در ادامه نیز صفحه 32 آن به عنوان نمونه قرار داده شده است که با خرید این محصول می توانید، فایل WORD و PDF آن را دریافت نمایید.
محتوی بسته دانلودی:
PDF مقاله انگلیسی ورد (WORD) ترجمه مقاله به صورت کاملا مرتب (ترجمه شکل ها و جداول به صورت کاملا مرتب)
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.