مقال علمي
اداة جديدة باستعمال الذكاء الاصطناعي تكشف "الجانب المظلم" من الجينوم البشري
اطلق باحثو معهد سالك في كاليفورنيا- الولايات المتحدة خلال الشهر الجاري (تموز -2025) أداة ShortStop، وهي إطار عمل قائم على الذكاء الاصطناعي، لاستكشاف مناطق مهملة في الحمض النووي بحثًا عن بروتينات صغيرة قد تلعب دورًا في الأمراض. حيث تلعب البروتينات دورًا حيويًا في الحفاظ على الحياة كما نعرفها، إذ تؤدي العديد من الوظائف الهيكلية والوظيفية في أنحاء الجسم. لكن هذه الجزيئات الكبيرة ألقت بظلالها على فئة فرعية أصغر تُعرف بالبروتينات الدقيقة (Microproteins) فقد ضاعت هذه البروتينات الدقيقة داخل 99% من الحمض النووي الذي كان يُعتبر "غير مشفر" — مخفيةً في مساحات شاسعة ومظلمة من الشيفرة الوراثية غير المستكشفة. ومع ذلك، ورغم صغر حجمها وصعوبة رصدها، فإن تأثيرها قد يكون كبيرًا مثل البروتينات الأكبر.
يستكشف علماء معهد سالك الآن الجانب المظلم والغامض من الجينوم بحثًا عن البروتينات الدقيقة. ومع أداتهم الجديدة المسماة ShortStop، يستطيع الباحثون فحص قواعد البيانات الوراثية وتحديد مناطق الحمض النووي التي يُحتمل أن ترمز لبروتينات دقيقة. والأهم من ذلك، أن الأداة تتنبأ أيضًا بأي من هذه البروتينات الدقيقة من المرجح أن تكون ذات صلة بيولوجية، مما يوفر الوقت والمال في البحث عن بروتينات دقيقة لها صلة بالصحة والمرض.
تسلط أداة ShortStop ضوءًا جديدًا على مجموعات البيانات القائمة، وتكشف بروتينات دقيقة كانت من قبل غير قابلة للرصد. في الواقع، استخدم فريق سالك الأداة بالفعل لتحليل مجموعة بيانات لسرطان الرئة، واكتشفوا 210 بروتينات دقيقة جديدة تمامًا — مع وجود بروتين واحد تم تأكيده — قد يكون هدفًا علاجيًا واعدًا في المستقبل.
يقول المؤلف الرئيسي الدكتور آلان ساغهاتليان، أستاذ في معهد سالك :
"معظم البروتينات في أجسامنا معروفة جيدًا، لكن الاكتشافات الحديثة تشير إلى أننا قد نكون أغفلنا آلاف البروتينات الصغيرة المخفية — تسمى البروتينات الدقيقة — والتي يتم ترميزها من مناطق مهملة في جينومنا البشري. ولفترة طويلة، ركز العلماء فقط على مناطق الحمض النووي التي ترمز لبروتينات كبيرة، واعتبروا البقية مجرد ‘حمض نووي غير مفيد’. لكننا الان نعلم أن هذه المناطق الأخرى مهمة للغاية، وأن البروتينات الدقيقة التي تنتجها قد تلعب أدوارًا حاسمة في تنظيم الصحة والمرض."
البروتينات الدقيقة
يصعب اكتشاف وتوثيق البروتينات الدقيقة، ويرجع ذلك غالبًا إلى صغر حجمها. فبينما تتراوح البروتينات التقليدية من مئات إلى آلاف الأحماض الأمينية، فإن البروتينات الدقيقة غالبًا ما تحتوي على أقل من 150 حمضًا أمينيًا، مما يجعلها صعبة الاكتشاف باستخدام أدوات تحليل البروتين التقليدية. ولذلك، عوضًا عن البحث المباشر عن هذه البروتينات، يبحث العلماء في قواعد بيانات عامة ضخمة عن تسلسلات الحمض النووي التي تُنتجها.
أدرك العلماء مؤخرًا أن بعض مناطق الحمض النووي الصغيرة، المعروفة باسم إطارات القراءة المفتوحة الصغيرة (smORFs)، قد تحتوي على تعليمات لصنع بروتينات دقيقة. وقد تم توثيق آلاف من هذه المناطق باستخدام تقنيات تجريبية، لكنها لا تزال مكلفة وتستهلك وقتًا طويلًا. كما أن عدم قدرتها على التمييز بين البروتينات الدقيقة الفعالة وغير الفعالة بيولوجيًا قد أعاق اكتشافها وتحليلها.
كيف تعمل أداة ShortStop؟
ليست كل smORFs تنتج بروتينات دقيقة ذات أهمية بيولوجية. ولا تستطيع الطرق الحالية التمييز بين المناطق الفعالة وغير الفعالة في إنتاج هذه البروتينات. هذا يعني أن العلماء يضطرون إلى اختبار كل بروتين محتمل على حدة لتحديد ما إذا كان وظيفيًا أم لا.
تُحدث أداة ShortStop تحولًا في هذا المسار، إذ تقوم بتصنيف smORFs إلى فئتين: وظيفية وغير وظيفية. وتعتمد هذه الآلية على تدريب الأداة كـنظام الي للذكاء الاصطناعي باستخدام مجموعة بيانات تحكمية سلبية تتضمن smORFs عشوائية تم إنشاؤها بالحاسوب, تقوم الأداة بمقارنة smORFs الحقيقية مع هذه العينات المزيفة لتقدير ما إذا كانت فعالة أو لا. ورغم أن ShortStop لا تقدم حكمًا نهائيًا بشأن مدى أهمية smORF بيولوجيًا، إلا أن تصنيفها الثنائي يقلص عدد البروتينات المرشحة والمطلوب اختبارها تجريبيًا، ويوفر الكثير من الوقت والجهد.
وعندما طبق الباحثون الأداة على مجموعة بيانات منشورة سابقًا، اكتشفوا أن 8% من smORFs يُحتمل أن تكون بروتينات دقيقة وظيفية، مما ساعد في تسريع أبحاثهم. بل وتمكنت الأداة من رصد بروتينات دقيقة لم تكتشفها الطرق الأخرى، بما في ذلك بروتين تم التحقق منه من خلال رصده في خلايا وأنسجة بشرية.
يقول ريندان ميلر، من فريق البحث :
"ما يجعل ShortStop قوية بشكل خاص هو أنها تعمل مع أنواع بيانات شائعة مثل بيانات تسلسل RNA، التي تستخدمها العديد من المختبرات بالفعل. هذا يعني أننا يمكننا الآن البحث عن بروتينات دقيقة على نطاق واسع عبر الأنسجة السليمة والمريضة، مما يكشف عن رؤى جديدة حول بيولوجيا الإنسان ويفتح أبوابًا جديدة لتشخيص الأمراض وعلاجها، مثل السرطان ومرض الزهايمر."
ShortStop تكشف بروتينًا دقيقًا مرتبطًا بسرطان الرئة
استخدم الباحثون ShortStop لتحديد بروتين دقيق كان معبرًا عنه بشكل زائد في أورام سرطان الرئة. فلقد قاموا بتحليل بيانات وراثية من أورام رئة بشرية وأنسجة مجاورة غير مصابة، وأنشأوا قائمة بالمناطق المرشحة التي قد تنتج بروتينات دقيقة فعالة. من بين ما اكتشفته الأداة، برز أحد البروتينات — إذ كان تعبيره أعلى في الورم منه في النسيج الطبيعي، مما يشير إلى أنه قد يكون مؤشرًا حيويًا أو بروتينًا دقيقًا وظيفيًا مرتبطًا بسرطان الرئة. ويُظهر هذا الاكتشاف أهمية ShortStop والذكاء الاصطناعي في تسريع تحديد البروتينات الدقيقة التي تستحق المزيد من الدراسة أو تطوير علاجات تستهدفها.
يقول ساغهاتليان:
"هناك كمية هائلة من البيانات الموجودة أصلًا التي يمكننا الآن تحليلها باستخدام ShortStop لاكتشاف بروتينات دقيقة جديدة مرتبطة بالصحة والمرض — من الزهايمر إلى السمنة وما بعدها. فريقي بارع في تطوير الأساليب، وبفضل بيانات زملائنا في معهد سالك، يمكننا دمج هذه الأساليب وتسريع وتيرة التقدم العلمي."