تصنيف صور الأشعة السينية للصدر باستخدام التعلم العميق
د. م محمد ملحم  
م. مضر حماد
 

 الملخص


تعد أمراض الرئة بما فيها السرطان (وفقاً لمنظمة الصحة العالمية WHO) أكثر أسباب الوفاة شيوعاً في جميع أنحاء العالم. بالمقابل، تتحسن معدلات البقاء على قيد الحياة لأنواع كثيرة من أمراض الرئة بفضل التحسينات التي تشهدها طرق الكشف عن هذه الأمراض وعلاجها والوقاية منها. تستخدم صور الصدر الشعاعية (بالأشعة السينية) في تقييم الأمراض المختلفة، ويُعد تحليل واختبار هذه الصور من الإجراءات الطبية الشائعة، نظراً لتكلفتها المنخفضة وانتشارها الواسع. يمكن أن يساهم وجود طرق آلية تعتمد على الذكاء الاصطناعي لتحليل هذه الصور في تحسين الكفاءة وتقليل احتمالية حدوث أخطاء في التشخيص.
 يتناول هذا البحث طريقة معتمدة على الشبكة العصبونية الالتفافية والمعالجة المسبقة للصورة لتصنيف صور الأشعة السينية للصدر إلى فئتين (تحتوي أو لا تحتوي على كتل في الرئة). حيث سنقوم ببناء شبكة CNN لهذا العمل. كما تم اقتراح واختبار ثماني منهجيات تتضمن معيار الضغط JPEG وتقنيات تحسين الصورة الآتية: مرشح تسوية الهيستوغرام، تصحيح غاما، مرشح تسوية الهيستوغرام التكيفي المحدود التباين، المرشح الوسيط.
 أظهرت النتائج أن المنهجية المتضمنة تطبيق مرشح CLAHE ثم معيار JPEG حققت دقة أعلى مقارنة بباقي المنهجيات المقترحة، حيث بلغت دقة التثبيت للنموذج 92.41% و F1-Score بلغت 0.556. من جهة أخرى، ساهم استخدام معيار JPEG لضغط الصور المحسنة بتقليل حجم مجموعة البيانات، مما خفض من مدة تدريب النموذج، بالتالي تحسين دقة التثبيت.


   up
 

 Abstract



Lung diseases (including cancer) are according to the “World Health Organization” the main cause of death worldwide. Conversely, survival rates for many types of lung diseases are improving thanks to improvements in cancer detection, treatment, and prevention. Chest radiographs (X-rays) are used as a tool to detect early lung tumors, and the analysis and testing of these images is a common medical procedure, due to its low cost and widespread use, but errors in the diagnosis will have significant negative effects, or even lead to the death of the patient. So having automated, AI-based ways of analyzing these images can improve efficiency and reduce the possibility of misdiagnosis.
This paper deals with a method based on convolutional neural network and image preprocessing to classify chest x-ray images into two categories (either containing lung masses or not). Where we will build a CNN for this work. Eight methodologies have been proposed and tested that include JPEG compression standard and the following image enhancement techniques: Histogram equalization (HE), Gamma Correction, Contrast Limited Adaptive Histogram Adjustment (CLAHE), Median Filter.
The results showed that the methodology that included applying the CLAHE filter and the JPEG standard achieved a higher accuracy compared to the rest of the proposed methodologies, where the validation accuracy of the model was 92.41% and the F1-Score was 0.556. On the other hand, the use of JPEG standard to compress the enhanced images reduced the size of the data set, which reduced the training time of the model, thus improving the validation accuracy of the model
.

   
   up
 

 المقدمة:


ينشأ السرطان من تحول خلايا عادية إلى أخرى ورمية، فعندما يكون الشخص مصاباً بسرطان الرئة، تتجمع لديه خلايا غير طبيعية معاً لتشكل ورماً (كتلة). تؤدي التفسيرات الخاطئة للمرض من قبل أطباء الأشعة إلى قرارات تضر المرضى حيث إنه عند تشخيص الحالة على أنها ورم، فعادة ما يتم وصف الخزعات مما يؤدي إلى إجراءات علاجية غير ضرورية، بالإضافة إلى القلق والألم للمرضى، ومن ناحية أخرى، يمكن عدم ملاحظة وجود الورم تماماً مما يؤدي إلى عدم تقديم العلاج وهذا يشكل خطراً على حياة المريض ويسبب الوفاة، لذلك بدأ الباحثون بالاتجاه إلى الاستعانة بتقنيات الذكاء الصنعي في المجال الطبي من أجل بناء أنظمة تشخيص فعالة بمساعدة الحاسب [1].


 

 الدراسة المرجعية:


يحظى تحليل الصور الطبية باستخدام التعلم العميق باهتمام كبير لدى الباحثين. وقد أثبتت الشبكات العصبونية الالتفافية (CNN) قدرتها على التقاط التفاصيل التي قد يواجه الخبراء البشريون صعوبة في تمييزها بالتالي يمكن أن تقدم نتائج واعدة في تحليل الصور الطبية. بناءً على ذلك، تم اقتراح العديد من الشبكات العصبونية وشبكات CNN لتشخيص الأمراض في صور الأشعة السينية للصدر.
قام الباحثون في [2] بتطوير شبكة عصبونية اصطناعية ANN)) لاكتشاف سرطان الرئة في جسم الإنسان. تم استخدام الأعراض للتشخيص. وتبين أن نموذج ANN المقترح قادر على التنبؤ بوجود سرطان الرئة بدقة 96.67 ٪، لكن أعراض سرطان الرئة لا تظهر حتى يصل المرض لمراحل متقدمة كما يمكن أن تتداخل مع أعراض أمراض أخرى لذلك يفضل استخدام تقنيات التصوير الطبي. قدم الباحثون في [3] شبكة عصبونية عميقة (DNN) لتصنيف صور الرئة بالأشعة السينية على أنها طبيعية أم لا، حيث تم استخدام مجموعة بيانات JSRT، وقد بلغت دقة تصنيف DNN المقترحة 87%. كما استخدمت آلية بسيطة في تصنيف الصور، بالإضافة إلى أن استخدام مجموعة بيانات صغيرة يؤدي إلى حدوث مشكلة التلاؤم المفرط (overfitting). اقترح الباحثون في [4] نهجاً لتصنيف صور الأشعة السينية للصدر إلى مرضية أو عادية بناءً على نموذج Faster Regional-CNN. وبالرغم من أن النهج المقترح يقلل من وقت الحساب إلا أنه حقق دقة منخفضة نسبياً 62%، ولم يستخدم معيار JPEG لضغط الصور. قام الباحثون في [5] بتطبيق التعلم العميق معتمدين على مجموعة البيانات (NeRDD)، وذلك من خلال تطوير منهج بسيط للمعالجة المسبقة باستخدام تقنيات معالجة الصور الرقمية ونصيحة اختصاصي الأشعة، وأيضاً تطوير نهج آخر يمكنه تطبيق ثلاث بنى للشبكات العصبونية، وقد حققت شبكة GoogLeNet دقة تصنيف عشوائية 80%، إلا أنهم استخدموا تقنيات بسيطة للمعالجة المسبقة للصور مثل معادلة الهيستوغرام (HE) فقط، كما لم تتطرق الدراسة إلى تقليل وقت تدريب الشبكة العصبونية.
سنقوم في هذا البحث باقتراح طريقة معتمدة على الشبكة العصبونية الالتفافية (CNN) لتصنيف صور الاشعة السينية للصدر إلى فئتين (إما تحتوي على كتل في الرئة أو لا تحتوي على كتل في الرئة). حيث سنقوم ببناء شبكة CNN لهذا العمل. كما قمنا باقتراح ثماني منهجيات للمعالجة المسبقة للصور لتحسين التباين وتقليل الضجيج من خلال تقنيات تحسين الصورة الآتية: مرشح تسوية الهيستوغرام، تصحيح غاما، مرشح تسوية الهيستوغرام التكيفي المحدود التباين، المرشح الوسيط. اعتمدنا في بعض المنهجيات المقترحة على ضغط الصور باستخدام معيار (JPEG) لتقليل حجم الصور، وبالتالي تسريع انجاز الحسابات وتخفيض زمن تدريب الشبكة العصبونية. ومن ثم سنقوم بمقارنة أداء CNN في المنهجيات الثمان. تم استخدام لغة البرمجة "Python" ومنصة "Google Colaboratory" في التصميم والاختبار، حيث اعتمدنا على مكتبات متخصصة في الذكاء الصنعي مثل "Keras" و"Tensorflow"، وإنشاء واجهة تفاعلية لاختبار النتائج.


   up
 

 طرائق البحث ومواده

3-1 مجموعة البيانات:


تعد مجموعة البيانات ChestX-ray14)) من أكبر مجموعات البيانات لصور الصدر بالأشعة السينية المتاحة على الإنترنت، والتي تحتوي على 112,120 صورة بالأشعة السينية لـ 30,805 مريض، حيث تكون جميع الصور بحجم 1024 × 1024 بكسل.
تحتوي ChestX-ray14 على 15 صنفاً (14 مرضاً وصنف واحد باسم لا توجد نتائج "No-Finding"). يمكن تصنيف الصور على أنها "لا توجد نتائج" أو إلى تصنيف واحد أو أكثر من فئات الأمراض (انخماص، دمج، تسرب، استرواح الصدر، الوذمة، انتفاخ الرئة، تليف رئوي، الانصباب، التهاب رئوي، سماكة الجنب، تضخم القلب، كتل، عقيدات، فتق).
فيما يخص هذا البحث قمنا باختيار الصور من الصنف "كتلة" الموجودة في مجموعة البيانات ChestX-ray14، بالتالي وجدنا 814 صورة تنتمي إلى الصنف الذي يحتوي على كتل في الرئة (سنشير له بـ"Mass")، بالمقابل اخترنا 814 صورة بشكل عشوائي تنتمي إلى الصنف (لا توجد نتائج) (سنشير له بـ "No Mass ")، حيث تكون جميع الصور بالاتجاه الأمامي الخلفي (PA)، وبصيغة png. قمنا بتقسيم مجموعة البيانات بنسبة 70% للتدريب (1140 صورة) و15% للتثبيت (244 صورة) و15% للاختبار (244 صورة).
3-2 المعالجة المسبقة للصور:
يعد تحسين الصورة أسلوباً مهماً لمعالجة الصور، حيث يسلط الضوء على المعلومات الأساسية في الصورة ويقلل أو يزيل معلومات ثانوية معينة لتحسين جودة النتائج. تحتوي الصور الطبية على ضجيج وضبابية بسبب قلة التباين وهذا قد يؤدي إلى تشخيص خاطئ. يتم استخدام تقنيات التحسين من أجل زيادة تباين الصورة منخفضة التباين والداكنة وتحسين جودتها، بالتالي زيادة كفاءة تصنيف الصور وتفسيرها [6]. تعتبر التقنيات مثل تسوية الهيستوغرام (HE)، وتسوية الهيستوغرام التكيفي محدود التباين (CLAHE)، وتصحيح غاما، والمرشح الوسيط هي الأبرز.
تهدف تقنية تسوية الهيستوغرام إلى توزيع المستويات الرمادية داخل الصورة، حيث يغير HE سطوع وتباين الصور المظلمة وذات التباين المنخفض لتحسين جودة الصورة. لتنفيذ HE نقوم أولاً بتشكيل الرسم البياني (الهيستوغرام)، ثم حساب قيم كثافة جديدة لكل مستويات كثافة باستخدام المعادلة الآتية:
O_i=[∑_(j=0)^i▒N_j ]×(Max .intensity Level)/(No.of Pixels)     
ثم استبدال قيم الكثافة السابقة بقيم الكثافة الجديدة [7].
على غرار تسوية الهيستوغرام HE، يمكن أيضاً استخدام تسوية الهيستوغرام التكيفي (AHE) في تعزيز تباين صور الإدخال، لكن من المحتمل أن تزيد AHE من تضخيم ميزة التباين في أجزاء الجوار الثابت، حيث ينتج عن هذا أيضاً تضخيم الضجيج في الأجزاء المجاورة الثابتة، والتي يمكن تجنبها باستخدام CLAHE  .[8]تتم تسوية الهيستوغرام التكيفية محدود التباين من خلال تقسيم الصورة المدخلة إلى عدة صور فرعية، ثم يحسب الهيستوغرام لكل صورة فرعية تم تقسيمها، ويتم توزيع قيم البيكسل في الصورة الفرعية بالتساوي على كل درجة من الرمادي في الصورة [9].
تشير غاما إلى سطوع الصورة، والغرض من تصحيح غاما هو تحسين الصورة من ناحية الإضاءة عن طريق تطبيق عمليات غير خطية على كل بيكسلات الصورة المدخلة، وبالتالي إعادة تشكيل تشبع الصورة. يمكن تعريف معادلة غاما على النحو الآتي:
〖f(x,y)〗^'=f〖(x,y)〗^(1/γ)
حيث ′𝑓 (𝑥 𝑦) هي الصورة بعد عملية تصحيح غاما، و𝑓 (𝑥 𝑦) هي الصورة الأصلية، والرمز  هو عامل تصحيح غاما، وقيمته ضمن المجال 1 <  < 0 [9]. المرشح الوسيط هو طريقة لتحسين الصورة عن طريق تقليل الضجيج فيها، وهو من المرشحات المكانية اللاخطية، يتم فيه استبدال بكسل الإدخال بوسط وحدات البيكسل الموجودة في الجوار، ويمكن تمثيل هذا بالعلاقة الآتية:
v(m,n)=median{y(m-k,n-1),(k-1)∈W}  
حيث M هو الجوار المختار بشكل مناسب [10].
يعد ضغط الصور من بين العديد من التقنيات المستخدمة في معالجة الصور، ويهدف إلى تقليل عدد البتات المطلوبة لتمثيل المعلومات في صورة ما عن طريق إزالة التكرار الموجود فيها. يعدJPEG  أول معيار دولي لضغط الصور للصور الثابتة المستمرة (الملونة وذات التدرج الرمادي)، وهو نظام ضغط مع خسارة تم تصميمه خصيصاً لتجاهل المعلومات التي لا تستطيع العين البشرية رؤيتها بسهولة. لضغط الصورة باستخدام JPEG   نقوم أولاً تحويل المساحة اللونية من RGB إلى YCbCr، ثم تقسيم الصورة الأصلية إلى كتل (Blocks) كل منها بحجم 8 × 8، ثم تعديل قيم البيكسل لنطاق الصورة لكل كتلة إلى المجال [-128,127]، وتطبيق DCT على كل كتلة، بعدئذ يتم ضغط كل كتلة من خلال التكميم (Quantization)، ويتم ترميز الانتروبيا من خلال مصفوفة التكميم. يتم إعادة بناء الصورة المضغوطة من خلال عملية عكسية والتي تستخدم  DCTالعكسي لفك الضغط [11].

3-3 طريقة العمل المقترحة:
اقترحنا في هذا البحث طريقة لتصنيف صور الأشعة السينية للصدر، حيث سنقوم بتدريب واختبار شبكة CNN المقترحة وفق ثماني منهجيات تتعلق بالمعالجة المسبقة للصور كما هو موضح بالشكل (1).



 3-4 بناء وتدريب الشبكة العصبونية الالتفافية:
تتكون الشبكة العصبونية الالتفافية من 4 طبقات أساسية وهي: طبقة الدخل، طبقة التسطيح، الطبقة كاملة الاتصال وطبقة الخرج. سنقوم بتصميم شبكة CNN تحتوي على الطبقات الآتىة (طبقة الإدخال، 5 طبقات التفافية، 5 طبقات تجميع، طبقة التسطيح Flatten، طبقة التكثيف Dense، طبقة الإخراج).

الشكل (1)  مخطط صندوقي يبين المنهجيات المقترحة

دخل الشبكة هو صور ذات تدرج رمادي بأبعاد       512  × 512 × 3، واعتمدنا في طبقات الالتفاف مرشح بحجم 3×3، كما استخدمنا طريقة "Same Padding" للحشو والخطوة (stride) هي (2,2). أيضاً استخدمنا دالة تنشيط "RELU" فهي أقل تكلفة من الناحية الحسابية وتتعلم بشكل أسرع من دوال التنشيط الأخرى. كما اعتمدنا التجميع الأقصى                    (Max Pooling) في طبقات التجميع وذلك لإرجاع القيمة القصوى لجزء الصورة الذي تغطيه النواة (Kernel)، وهذا يقلل من الضجيج في الصورة. ثم نقوم بتسطيح الميزات من خلال طبقة التسطيح Flatten، وإدخالها إلى طبقة التكثيف، حيث قمنا باستخدام طبقة تكثيف (Dense) بـ 64 عقدة، ثم طبقة الخرج وهي Dense بعقدتين، وكون التصنيف هنا هو تصنيف ثنائي بالتالي نستخدم دالة "Sigmoid" والتي لها المعادلة الآتية:    F (┤)=1/(1+e^(-x) ). يوضح الشكل (2) بنية CNN المقترحة.

الشكل (2)  بنية شبكة CNN المقترحة

قمنا بتطبيق خوارزمية آدم (Adam) كخوارزمية تحسين وبالتالي تتم ترجمة النموذج مع الإنتروبيا المتقاطعة الثنائية. تم تدريب شبكة CNN لـ

الشكل (3) مصفوفة التشتت لكل منهجية من المنهجيات المقترحة

100 تكرار مع حجم دفعة يساوي 32، ومن خلال تقسيم عدد عينات التدريب على حجم الدفعة نحصل على عدد خطوات التدريب في كل تكرار وهو 35 خطوة.


  up
 

الاستنتاجات والتوصيات:

قمنا في هذا البحث باقتراح منهج عمل معتمد على شبكة عصبونية التفافية CNN للكشف عن وجود الكتل في صور الأشعة السينية للصدر، حيث اقترحنا 8 منهجيات تتضمن معالجة مسبقة للصورة. بمقارنة نتائج التدريب والاختبار تم ملاحظة أن المنهجية الثامنة وهي استخدام CNN مع معالجة مسبقة للصور            ( CLAHEثم JPEG) أعطت أفضل النتائج حيث بلغت دقة التثبيت 92.41% و F1-Score بلغت 0.556 . من جهة أخرى، ساهم استخدام معيار JPEG لضغط الصور المحسنة باستخدام CLAHE بتقليل حجم مجموعة التدريب من 2313 ميغابايت إلى 595 ميغابايت، مما خفض من مدة تدريب النموذج من 4804 ثانية إلى 2330 ثانية. بشكل عام تمت ملاحظة تحسن دقة التثبيت وانخفاض حجم الصور وزمن تدريب النموذج عند استخدام الضغط (JPEG). من الممكن تحقيق دقة عالية في المستقبل من خلال استخدام المزيد من الصور في مجموعة البيانات، وتجزئة الرئتين باستخدام شبكة U-Net مع تطبيق المزيد من تقنيات تحسين الصورة.


 

كلمات مفتاحية

الشبكات العصبونية الالتفافية، صور الأشعة السينية للصدر، التعلم العميق، المعالجة المسبقة للصور، تسوية الهيستوغرام، تصحيح غاما.

convolutional neural networks, chest x-rays, deep learning, image pre-processing, histogram equalization, gamma correction


  up
 

Reference


1.    السرطان. 3032022. الرابط     منظمة الصحة العالمية. https://www.who.int/ar/news-room/fact-sheets/detail/cancer
2.    Nasser, Ibrahim and Abu-naser, Samy. (2019). Lung Cancer Detection Using Artificial Neural Network. International Journal of Engineering and Information Systems (IJEAIS). Vol: 3. No: 3. pp:17-23. Al-Azhar University- Gaza, Palestine.
3.    V, Thamilarasi and R, Roselin. (2021). Automatic Classification and Accuracy by Deep Learning Using CNN Methods in Lung Chest X-Ray Images. IOP Conf. Series: Materials Science and Engineering. India.
4.    Rahmat ,Taufik. Ismail, Azlan and Aliman, Sharifah. (2019). Chest X-ray Image Classification using Faster R-CNN. Malaysian Journal of Computing. Vol: 4. No: 1. pp: 225-236. University Teknologi MARA (UiTM), Selangor, Malaysia.
5.    Tataru, Christine. Yi, Darvin. Shenoyas, Archana and Ma, Anthony. (2017). Deep Learning for abnormality detection in Chest X-Ray images,” IEEE Conf. Deep Learning.
6.    K H, Shashikala & Madhuri, Sindhu. (2021). image pre-processing techniques for x-ray medical images: a survey. International Journal of Creative Research Thoughts (IJCRT). Vol: 9. No: 1. pp: 1999-2002. 
7.    Bagade, Sapana and Shandilya, Vijaya. (2011). use of histogram equalization in image processing for image enhancement. International Journal of Software Engineering Research & Practices. Vol: 1. No: 2.
8.    Tharsanee, R. M., Soundariya, R. S., Kumar, A. S., Karthiga, M., & Sountharrajan, S. (2021). Deep convolutional neural network–based image classification for COVID-19 diagnosis. Publisher: Mara Conner Elsevier .pp: 117–145.
9.    Putra, R. D., Purboyo, T. W., & Prasasti, A. L. (2017). A Review of Image Enhancement Methods. International Journal of Applied Engineering Research .Vol: 12, Issue: 23. Pp: 13596-13603.
10.    Acharya, T., & Ray,K, A.(2005). Image Processing: Principles and Applications. John Wiley & Sons, Inc, Hoboken, New Jersey. Pp: 110-114.
11.    Gautam, Bhawna. (2010). Image compression using discrete cosine transform & discrete wavelet transform. Bachelor in Computer Science and Engineering. Department of Computer Science and Engineering,. National Institute of Technology. Deemed University. Rourkela. India. Pp: 29.
12.    Dejean-Servières, Mathieu. Desnos, Karol. Abdelouahab, Kamel. Hamidouche, Wassim. Morin, Luce and Pelcat, Maxime. (2017). Study of the Impact of Standard Image Compression Techniques on Performance of Image Classification with a Convolutional Neural Network. INSA Rennes. Univ Rennes. IETR. Institut Pascal.
13.    Yang, En-Hui. Hossam, Amer and Yanbing Jiang. (2021). Compression Helps Deep Learning in Image Classification. Entropy. 23, 881.


  up