في هذا البحث، نقترح منهجية ثورية تعتمد على التعلم المعزز العميق لاختبار الاختراق الآلي. تستخدم الطريقة المقترحة شبكة عميقة للتعلم Q لتطوير تسلسلات الهجوم التي تستغل نقاط الضعف في النظام المستهدف بشكل فعال. يتم اختبار الطريقة في بيئة افتراضية، وتشير النتائج إلى أنها تستطيع تحديد نقاط الضعف التي لا يستطيع اختبار الاختراق اليدوي اكتشافها. يتم استخدام مجموعة متنوعة من الأدوات، بما في ذلك شبكة Deep Q-learning وMulVAL وNmap وVirtualBox وDocker وقاعدة بيانات الثغرات الوطنية (NVD) ونظام تسجيل الثغرات الأمنية الشائعة (CVSS) في هذا العمل. تتفوق الطريقة المقترحة بشكل كبير على طرق اختبار الاختراق الآلي الحالية. يمكن لمنهجيتنا المقترحة اكتشاف العيوب التي يخطئ فيها اختبار الاختراق اليدوي ويمكن تعديلها (من حيث قيم العقوبات) للتكيف مع تحديثات تغييرات النظام (الشبكة) المستهدف. بالإضافة إلى ذلك، لديه القدرة على تعزيز فعالية وكفاءة اختبار الاختراق بشكل كبير ويمكن أن يساهم في زيادة أمن أنظمة الكمبيوتر. تكشف الاختبارات التجريبية التي تم إجراؤها في هذا العمل عن فعالية اختبار الاختراق الآلي DQN من خلال استخدام ناقلات الهجوم الأكثر فعالية في عملية أتمتة الهجوم.