تقدم هذه الورقة مقاربة جديدة لاختبار الاختراق الآلي باستخدام التعلم المعزز العميق. يستخدم النهج المقترح شبكة Q-Learning العميقة لمعرفة كيفية إنشاء تسلسلات هجوم تستغل بنجاح الثغرات الأمنية في النظام المستهدف. يتم تقييم النهج باستخدام بيئة محاكاة ، وتظهر النتائج أنه قادر على العثور على نقاط الضعف التي لم يتم العثور عليها عن طريق اختبار الاختراق اليدوي. يعتمد العمل على مجموعة من الأدوات مثل Deep Q-learning network و MulVAL و Nmap و Virtualization - VirtualBox و Containerization - Docker وقاعدة بيانات الثغرات الأمنية الوطنية (NVD) ونظام تسجيل الثغرات المشتركة (CVSS). النهج المقترح هو تحسين كبير على أدوات اختبار الاختراق الآلي التقليدية. إنه قادر على العثور على نقاط الضعف التي لم يتم العثور عليها عن طريق اختبار الاختراق اليدوي ، وهو قادر على التكيف مع التغييرات في النظام المستهدف. علاوة على ذلك ، لديه القدرة على تحسين كفاءة وفعالية اختبار الاختراق بشكل كبير ، ويمكن أن يساعد في جعل أنظمة الكمبيوتر أكثر أمانًا.