استفاده از الگوریتم یادگیری عمیق کیو جهت طراحی عاملی خودمختار برای معامله در بازار رمزارزها با تمرکز بر رفتار معامله‌گران

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشکده کامپیوتر، دانشگاه یزد، یزد، ایران

2 هیأت علمی، دانشکده مهندسی کامپیوتر، دانشگاه یزد

3 دانشکده مهندسی کامپیوتر ، دانشگاه یزد، یزد، ایران

چکیده

بازار رمرزارزها، محیطی پیچیده، غیرقطعی و همراه با نوسانهای زیادی است. ایجاد استراتژی معاملاتی در این بازار بسیار چالش برانگیز است. در این مقاله تاثیر رفتار معامله‌گران (معاملاتی که انجام می‌دهند) بر تغییر شرایط بازار بررسی شده است. عوامل بسیاری در تغییر شریط بازار تأثیر دارند، اما در نهایت این تأثیرات، از طریق رفتار معامله‌گران به فعلیت می‌رسد. در این مقاله عاملی خودمختار جهت انجام معامله در بازار رمزارز طراحی شده است. عاملی که تنها با بررسی معاملات انجام شده تصمیم می‌گیرد. طراحی عامل مبتنی بر الگوریتم DDQN از یادگیری تقویتی است. برای آموزش عامل تمام معامله‌های انجام شده در صرافی رمزارز HitBTC در طول نزدیک به۳ ماه برای ۳ جفت رمزارز، گردآوری شده است. نتایج پیاده‌سازی نشان می‌دهد مدل همگرا شده و در شرایط محیطی با ریسک بالا پایداری خوبی از خود نشان داده است. در نتیجه معامله‌های انجام شده منبع مهمی برای تصمیم‌گیری است. ترکیب این روش با روش‌های پیش‌بینی قیمت می‌تواند رویکردی جدید در طراحی عامل‌های معامله‌گر باشد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Using Deep Q Network to develop an autonomous agent for trading in the cryptocurrency market, focusing on traders' behavior

نویسندگان [English]

  • Seyed Mehrdad Eslami 1
  • Mehdi Agha Sarram 2
  • Mohammad Ali Zare Chahooki 3
1 Computer Faculty, Yazd university, Yazd, IRAN
2 Computer Faculty, Yazd University, Yazd, IRAN
3 Computer Faculty, Yazd university, Yazd, IRAN
چکیده [English]

Crypto currency market is a complex, uncertain and dynamic environment with significant volatility. Developing a trading strategy in this market is highly challenging and a key area of academic research. In this article, An autonomous trading agent has been designed to analyze the effects of traders' behavior (transactions they do) on changing market conditions. Although many factors influence the market, these effects impact ultimately through traders behaviors. In this article, The agent makes decisions only by reviewing and analyzing the transactions which has been done by traders. The agent is built using DDQN reinforcement learning algorithm. To train the agent, all HitBTC`s transactions during nearly 3 months for 3 cryptocurrency pairs have been gathered. The results show that the model converges and is stable. As a result, The transactions data are important source for decision making. Combining this method with price prediction methods can be a new approach in designing trader agents.

کلیدواژه‌ها [English]

  • autonomous Trading Agent
  • Trader`s Behaviors
  • Deep Reinforcement Learning
  • Deep Q Network