تشخیص ارائه‌دهندگان خدمات در پیام‌های فارسی تلگرام مبتنی بر روش‌های انتخاب ویژگی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی ارشد مهندسی کامپیوتر، دانشکده مهندسی کامپیوتر، دانشگاه یزد

2 دانشکده مهندسی کامپیوتر - بخش مهندسی نرم‌افزار، دانشگاه یزد

3 دانشکده مهندسی کامپیوتر،بخش مهندسی نرم افزار، دانشگاه یزد

چکیده

پیام‌رسان تلگرام بستری مناسب برای کاربرانی است که به دنبال خرید محصول یا دریافت خدمات به صورت آنلاین هستند. در این پیام‌رسان، برای درخواست محصول،امکان دسترسی مستقیم به ارائه‌دهندگان کالا و خدمات وجود ندارد و باید ابتدا در گروه‌های تلگرامی مرتبط عضو شد و درخواست خود را در تک تک گروه‌ها ثبت کرد و منتظر پاسخ ماند. این امر ضمن زمان‌بر بودن، با مشکلاتی همراه است. هدف از این پژوهش تشخیص کاربران ارائه‌دهنده خدمات به منظور ارتباط مستقیم و موثر با مشتریان است. بدین منظور از ایده دسته‌بندی پیام‌های فارسی منتشر شده در تلگرام استفاده شد. یکی از مشکلات دسته‌بندی این پیام‌ها، ابعاد بزرگ فضای ویژگی است که سبب کاهش دقت و افزایش زمان دسته‌بندی می‌شود. برای حل این مسئله از روش‌های انتخاب ویژگی استفاده شد. روش پیشنهادی این پژوهش، بر مبنای ترکیب روش‌های انتخاب ویژگی مبتنی بر فیلتر محلی و سراسری است. نوآوری این پژوهش در استفاده از روش‌های ترکیبی انتخاب ویژگی جهت دسته‌بندی خودکار پیام‌های فارسی تلگرام، به منظور شناسایی کاربران ارائه‌دهنده خدمات است. روش‌ پیشنهادی، ضمن کاهش تعداد ویژگی‌ها و انتخاب ویژگی‌های مرتبط، سبب بهبود عملکرد دسته‌بندی و تشخیص کاربران ارائه‌دهنده خدمات می‌شود.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

service providers Identification in Telegram Persian messages based on feature selection methods

چکیده [English]

Telegram Messenger is a suitable platform for users who are looking to buy a product or receive services online. In these messengers, it is not possible to have direct access to the providers of goods and services, and in order to request the product, one must first become a member of the related groups and channels telegram. The purpose of this study is to directly identify users of service providers using the classification of Persian messages published in Telegram. One of the problems with categorizing these messages is the large size of the feature space, which reduces accuracy and increases classification time. Feature selection methods were used to solve this problem. The proposed method of this research is based on a combination of feature selection methods based on local and global filters. In this regard, in the first step, using the most widely used methods for selecting local and global filter feature, related features are selected. In the second step, a combination of local and global filtering methods is used to identify better features and increase classification accuracy. The innovation of this research is in using the combined methods of feature selection for automatic classification of Telegram Persian messages, in order to identify the users of the service provider. The proposed method, while reducing the number of features and selecting related features, improves the performance of classification and Identification of service providers.

کلیدواژه‌ها [English]

  • : classification
  • Service Provider Users
  • Feature Selection
  • Feature Reduction
  • Machine Learning
  • Deng, Y. Li, J. Weng, and J. Zhang, (2019), Feature selection for text classification: A review, Multimedia Tools & Applications, vol. 78, no. 3, pp..113-115
  • Nekkaa and D. Boughaci, (2016), Hybrid harmony search combined with stochastic local search for feature selection, Neural Processing Letters, vol.44, no. 1, pp. 199-220.
  • BİRİCİK, B. Dri, and A. C. SÖNMEZ, (2012), Abstract feature extraction for text classification, Turkish Journal of Electrical Engineering & Computer Sciences, vol. 20,no. Sup. 1, pp. 1137-1159.
  • M. Abualigah, A. T. Khader, M. A. Al-Betar, and O. A. Alomari, (2017), Text feature selection with a robust weight scheme and dynamic dimension reduction to text document clustering, Expert Systems with Applications, vol.84, pp. 24-36.
  • Ö. Şahin and E. Kılıç, (2019), "Two new feature selection metrics for text classification", Automatika: časopis za automatiku, mjerenje, elektroniku, računarstvo i komunikacije, vol. 60, no. 2, pp. 162-171.
  • Chandrashekar and F. Sahin, (2014), "A survey on feature selection methods, Computers & Electrical Engineering, vol. 40, no. 1, pp. 16-28.
  • K. Uysal, (2016), An improved global feature selection scheme for text classification, Expert systems with Applications, vol. 43, pp. 82-92.
  • Agnihotri, K. Verma, and P. Tripathi, (2017), Variable global feature selection scheme for automatic classification of text documents, Expert Systems with Applications, vol. 81, pp. 268-281.
  • Melo and H. Paulheim, (2019), Local and global feature selection for multilabel classification with binary relevance, Artificial intelligence review, vol. 51, no.1, pp. 33-60.
  • Kursat. Uysal, (2018), "On two-stage feature selection methods for text classification", IEEE Accebss, vol. 6, pp.43233-43251.
  • Wei, J. Zhao, Y. Feng, A. He, and J. Yu, (2020), A novel hybrid feature selection method based on dynamic feature importance, Applied Soft Computing, vol.93, p. 106337.
  • N. H. Nam and H. B. Quoc, (2017), The hybrid filter feature selection methods for improving high-dimensional text categorization, International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, vol. 25, no. 02, pp.235.
  • Asif, M., Nagra, A. A., Ahmad, M. B., & Masood, K, (2022),. Feature selection empowered by self-inertia weight adaptive particle swarm optimization for text classification. Applied Artificial Intelligence, vol. 36, no. 01, p.2004345.‌
  • Effrosynidis, D., & Arampatzis, A. (2021). An evaluation of feature selection methods for environmental data. Ecological Informatics, vol. 61, p.101224.‌