|
Abstract
Lung diseases (including cancer) are according to the “World Health Organization” the main cause of death worldwide. Conversely, survival rates for many types of lung diseases are improving thanks to improvements in cancer detection, treatment, and prevention. Chest radiographs (X-rays) are used as a tool to detect early lung tumors, and the analysis and testing of these images is a common medical procedure, due to its low cost and widespread use, but errors in the diagnosis will have significant negative effects, or even lead to the death of the patient. So having automated, AI-based ways of analyzing these images can improve efficiency and reduce the possibility of misdiagnosis.
This paper deals with a method based on convolutional neural network and image preprocessing to classify chest x-ray images into two categories (either containing lung masses or not). Where we will build a CNN for this work. Eight methodologies have been proposed and tested that include JPEG compression standard and the following image enhancement techniques: Histogram equalization (HE), Gamma Correction, Contrast Limited Adaptive Histogram Adjustment (CLAHE), Median Filter.
The results showed that the methodology that included applying the CLAHE filter and the JPEG standard achieved a higher accuracy compared to the rest of the proposed methodologies, where the validation accuracy of the model was 92.41% and the F1-Score was 0.556. On the other hand, the use of JPEG standard to compress the enhanced images reduced the size of the data set, which reduced the training time of the model, thus improving the validation accuracy of the model.
|
|
طرائق البحث ومواده
3-1 مجموعة البيانات:
تعد مجموعة البيانات ChestX-ray14)) من أكبر مجموعات البيانات لصور الصدر بالأشعة السينية المتاحة على الإنترنت، والتي تحتوي على 112,120 صورة بالأشعة السينية لـ 30,805 مريض، حيث تكون جميع الصور بحجم 1024 × 1024 بكسل.
تحتوي ChestX-ray14 على 15 صنفاً (14 مرضاً وصنف واحد باسم لا توجد نتائج "No-Finding"). يمكن تصنيف الصور على أنها "لا توجد نتائج" أو إلى تصنيف واحد أو أكثر من فئات الأمراض (انخماص، دمج، تسرب، استرواح الصدر، الوذمة، انتفاخ الرئة، تليف رئوي، الانصباب، التهاب رئوي، سماكة الجنب، تضخم القلب، كتل، عقيدات، فتق).
فيما يخص هذا البحث قمنا باختيار الصور من الصنف "كتلة" الموجودة في مجموعة البيانات ChestX-ray14، بالتالي وجدنا 814 صورة تنتمي إلى الصنف الذي يحتوي على كتل في الرئة (سنشير له بـ"Mass")، بالمقابل اخترنا 814 صورة بشكل عشوائي تنتمي إلى الصنف (لا توجد نتائج) (سنشير له بـ "No Mass ")، حيث تكون جميع الصور بالاتجاه الأمامي الخلفي (PA)، وبصيغة png. قمنا بتقسيم مجموعة البيانات بنسبة 70% للتدريب (1140 صورة) و15% للتثبيت (244 صورة) و15% للاختبار (244 صورة).
3-2 المعالجة المسبقة للصور:
يعد تحسين الصورة أسلوباً مهماً لمعالجة الصور، حيث يسلط الضوء على المعلومات الأساسية في الصورة ويقلل أو يزيل معلومات ثانوية معينة لتحسين جودة النتائج. تحتوي الصور الطبية على ضجيج وضبابية بسبب قلة التباين وهذا قد يؤدي إلى تشخيص خاطئ. يتم استخدام تقنيات التحسين من أجل زيادة تباين الصورة منخفضة التباين والداكنة وتحسين جودتها، بالتالي زيادة كفاءة تصنيف الصور وتفسيرها [6]. تعتبر التقنيات مثل تسوية الهيستوغرام (HE)، وتسوية الهيستوغرام التكيفي محدود التباين (CLAHE)، وتصحيح غاما، والمرشح الوسيط هي الأبرز.
تهدف تقنية تسوية الهيستوغرام إلى توزيع المستويات الرمادية داخل الصورة، حيث يغير HE سطوع وتباين الصور المظلمة وذات التباين المنخفض لتحسين جودة الصورة. لتنفيذ HE نقوم أولاً بتشكيل الرسم البياني (الهيستوغرام)، ثم حساب قيم كثافة جديدة لكل مستويات كثافة باستخدام المعادلة الآتية:
O_i=[∑_(j=0)^i▒N_j ]×(Max .intensity Level)/(No.of Pixels)
ثم استبدال قيم الكثافة السابقة بقيم الكثافة الجديدة [7].
على غرار تسوية الهيستوغرام HE، يمكن أيضاً استخدام تسوية الهيستوغرام التكيفي (AHE) في تعزيز تباين صور الإدخال، لكن من المحتمل أن تزيد AHE من تضخيم ميزة التباين في أجزاء الجوار الثابت، حيث ينتج عن هذا أيضاً تضخيم الضجيج في الأجزاء المجاورة الثابتة، والتي يمكن تجنبها باستخدام CLAHE .[8]تتم تسوية الهيستوغرام التكيفية محدود التباين من خلال تقسيم الصورة المدخلة إلى عدة صور فرعية، ثم يحسب الهيستوغرام لكل صورة فرعية تم تقسيمها، ويتم توزيع قيم البيكسل في الصورة الفرعية بالتساوي على كل درجة من الرمادي في الصورة [9].
تشير غاما إلى سطوع الصورة، والغرض من تصحيح غاما هو تحسين الصورة من ناحية الإضاءة عن طريق تطبيق عمليات غير خطية على كل بيكسلات الصورة المدخلة، وبالتالي إعادة تشكيل تشبع الصورة. يمكن تعريف معادلة غاما على النحو الآتي:
〖f(x,y)〗^'=f〖(x,y)〗^(1/γ)
حيث ′𝑓 (𝑥 𝑦) هي الصورة بعد عملية تصحيح غاما، و𝑓 (𝑥 𝑦) هي الصورة الأصلية، والرمز هو عامل تصحيح غاما، وقيمته ضمن المجال 1 < < 0 [9]. المرشح الوسيط هو طريقة لتحسين الصورة عن طريق تقليل الضجيج فيها، وهو من المرشحات المكانية اللاخطية، يتم فيه استبدال بكسل الإدخال بوسط وحدات البيكسل الموجودة في الجوار، ويمكن تمثيل هذا بالعلاقة الآتية:
v(m,n)=median{y(m-k,n-1),(k-1)∈W}
حيث M هو الجوار المختار بشكل مناسب [10].
يعد ضغط الصور من بين العديد من التقنيات المستخدمة في معالجة الصور، ويهدف إلى تقليل عدد البتات المطلوبة لتمثيل المعلومات في صورة ما عن طريق إزالة التكرار الموجود فيها. يعدJPEG أول معيار دولي لضغط الصور للصور الثابتة المستمرة (الملونة وذات التدرج الرمادي)، وهو نظام ضغط مع خسارة تم تصميمه خصيصاً لتجاهل المعلومات التي لا تستطيع العين البشرية رؤيتها بسهولة. لضغط الصورة باستخدام JPEG نقوم أولاً تحويل المساحة اللونية من RGB إلى YCbCr، ثم تقسيم الصورة الأصلية إلى كتل (Blocks) كل منها بحجم 8 × 8، ثم تعديل قيم البيكسل لنطاق الصورة لكل كتلة إلى المجال [-128,127]، وتطبيق DCT على كل كتلة، بعدئذ يتم ضغط كل كتلة من خلال التكميم (Quantization)، ويتم ترميز الانتروبيا من خلال مصفوفة التكميم. يتم إعادة بناء الصورة المضغوطة من خلال عملية عكسية والتي تستخدم DCTالعكسي لفك الضغط [11].
3-3 طريقة العمل المقترحة:
اقترحنا في هذا البحث طريقة لتصنيف صور الأشعة السينية للصدر، حيث سنقوم بتدريب واختبار شبكة CNN المقترحة وفق ثماني منهجيات تتعلق بالمعالجة المسبقة للصور كما هو موضح بالشكل (1).
3-4 بناء وتدريب الشبكة العصبونية الالتفافية:
تتكون الشبكة العصبونية الالتفافية من 4 طبقات أساسية وهي: طبقة الدخل، طبقة التسطيح، الطبقة كاملة الاتصال وطبقة الخرج. سنقوم بتصميم شبكة CNN تحتوي على الطبقات الآتىة (طبقة الإدخال، 5 طبقات التفافية، 5 طبقات تجميع، طبقة التسطيح Flatten، طبقة التكثيف Dense، طبقة الإخراج).
الشكل (1) مخطط صندوقي يبين المنهجيات المقترحة
دخل الشبكة هو صور ذات تدرج رمادي بأبعاد 512 × 512 × 3، واعتمدنا في طبقات الالتفاف مرشح بحجم 3×3، كما استخدمنا طريقة "Same Padding" للحشو والخطوة (stride) هي (2,2). أيضاً استخدمنا دالة تنشيط "RELU" فهي أقل تكلفة من الناحية الحسابية وتتعلم بشكل أسرع من دوال التنشيط الأخرى. كما اعتمدنا التجميع الأقصى (Max Pooling) في طبقات التجميع وذلك لإرجاع القيمة القصوى لجزء الصورة الذي تغطيه النواة (Kernel)، وهذا يقلل من الضجيج في الصورة. ثم نقوم بتسطيح الميزات من خلال طبقة التسطيح Flatten، وإدخالها إلى طبقة التكثيف، حيث قمنا باستخدام طبقة تكثيف (Dense) بـ 64 عقدة، ثم طبقة الخرج وهي Dense بعقدتين، وكون التصنيف هنا هو تصنيف ثنائي بالتالي نستخدم دالة "Sigmoid" والتي لها المعادلة الآتية: F (┤)=1/(1+e^(-x) ). يوضح الشكل (2) بنية CNN المقترحة.
الشكل (2) بنية شبكة CNN المقترحة
قمنا بتطبيق خوارزمية آدم (Adam) كخوارزمية تحسين وبالتالي تتم ترجمة النموذج مع الإنتروبيا المتقاطعة الثنائية. تم تدريب شبكة CNN لـ
الشكل (3) مصفوفة التشتت لكل منهجية من المنهجيات المقترحة
100 تكرار مع حجم دفعة يساوي 32، ومن خلال تقسيم عدد عينات التدريب على حجم الدفعة نحصل على عدد خطوات التدريب في كل تكرار وهو 35 خطوة.
|
|
Reference
1. السرطان. 3032022. الرابط منظمة الصحة العالمية. https://www.who.int/ar/news-room/fact-sheets/detail/cancer
2. Nasser, Ibrahim and Abu-naser, Samy. (2019). Lung Cancer Detection Using Artificial Neural Network. International Journal of Engineering and Information Systems (IJEAIS). Vol: 3. No: 3. pp:17-23. Al-Azhar University- Gaza, Palestine.
3. V, Thamilarasi and R, Roselin. (2021). Automatic Classification and Accuracy by Deep Learning Using CNN Methods in Lung Chest X-Ray Images. IOP Conf. Series: Materials Science and Engineering. India.
4. Rahmat ,Taufik. Ismail, Azlan and Aliman, Sharifah. (2019). Chest X-ray Image Classification using Faster R-CNN. Malaysian Journal of Computing. Vol: 4. No: 1. pp: 225-236. University Teknologi MARA (UiTM), Selangor, Malaysia.
5. Tataru, Christine. Yi, Darvin. Shenoyas, Archana and Ma, Anthony. (2017). Deep Learning for abnormality detection in Chest X-Ray images,” IEEE Conf. Deep Learning.
6. K H, Shashikala & Madhuri, Sindhu. (2021). image pre-processing techniques for x-ray medical images: a survey. International Journal of Creative Research Thoughts (IJCRT). Vol: 9. No: 1. pp: 1999-2002.
7. Bagade, Sapana and Shandilya, Vijaya. (2011). use of histogram equalization in image processing for image enhancement. International Journal of Software Engineering Research & Practices. Vol: 1. No: 2.
8. Tharsanee, R. M., Soundariya, R. S., Kumar, A. S., Karthiga, M., & Sountharrajan, S. (2021). Deep convolutional neural network–based image classification for COVID-19 diagnosis. Publisher: Mara Conner Elsevier .pp: 117–145.
9. Putra, R. D., Purboyo, T. W., & Prasasti, A. L. (2017). A Review of Image Enhancement Methods. International Journal of Applied Engineering Research .Vol: 12, Issue: 23. Pp: 13596-13603.
10. Acharya, T., & Ray,K, A.(2005). Image Processing: Principles and Applications. John Wiley & Sons, Inc, Hoboken, New Jersey. Pp: 110-114.
11. Gautam, Bhawna. (2010). Image compression using discrete cosine transform & discrete wavelet transform. Bachelor in Computer Science and Engineering. Department of Computer Science and Engineering,. National Institute of Technology. Deemed University. Rourkela. India. Pp: 29.
12. Dejean-Servières, Mathieu. Desnos, Karol. Abdelouahab, Kamel. Hamidouche, Wassim. Morin, Luce and Pelcat, Maxime. (2017). Study of the Impact of Standard Image Compression Techniques on Performance of Image Classification with a Convolutional Neural Network. INSA Rennes. Univ Rennes. IETR. Institut Pascal.
13. Yang, En-Hui. Hossam, Amer and Yanbing Jiang. (2021). Compression Helps Deep Learning in Image Classification. Entropy. 23, 881.
|