نموذج GPT-5.5: الأذكى للبرمجة والعمل

Darius Z. بقلم Darius Z. 7 دقائق للقراءة
رسم تجريدي مستقبلي لشبكة عصبية مع تدفقات بيانات متوهجة تمثل نموذج OpenAI GPT-5.5

النقاط الرئيسية

  • حقق GPT-5.5 نتيجة 82.7% في Terminal-Bench 2.0، متقدمًا على Claude Opus 4.7 بفارق 13.3 نقطة في مهام البرمجة الوكيلية
  • سجّل النموذج 78.7% في OSWorld-Verified للتحكم التلقائي بالحاسوب و84.9% في GDPval عبر 44 مهنة معرفية
  • أسعار API هي $5 لكل مليون رمز إدخال و$30 لكل مليون رمز إخراج، مطابقة لسعر إدخال Claude Opus 4.7
  • لا يزال Claude Opus 4.7 يتصدر في SWE-Bench Pro (64.3% مقابل 58.6%) لهندسة البرمجيات متعددة الملفات

أطلقت OpenAI (أوبن إيه آي) نموذج GPT-5.5 في 23 أبريل 2026، واصفةً إياه بأنه “فئة جديدة من الذكاء للعمل الحقيقي”. يُعد هذا النموذج أول بنية أساسية مُعاد تدريبها بالكامل منذ GPT-4.5 (الاسم الرمزي الداخلي “Spud”) ويستهدف أربعة مجالات: البرمجة الوكيلية، واستخدام الحاسوب، والعمل المعرفي، والبحث العلمي. في Terminal-Bench 2.0، سجّل GPT-5.5 نتيجة 82.7%، وهي الأعلى بين جميع النماذج المتاحة علنيًا. وفي OSWorld-Verified، بلغ 78.7% للتحكم التلقائي بالحاسوب. تبلغ أسعار API نحو $5 لكل مليون رمز إدخال و$30 لكل مليون رمز إخراج. يُطرح النموذج تدريجيًا لمستخدمي ChatGPT (شات جي بي تي) Plus وPro وBusiness وEnterprise، مع توسيع الوصول عبر API على مراحل.

جرّب GPT-5.5 في ChatGPT

نموذج GPT-5.5 متاح الآن لمستخدمي ChatGPT Plus وPro وBusiness وEnterprise.

جرّب ChatGPT GPT-5.5 ←

ما الذي يقدمه نموذج GPT-5.5؟

صُمم GPT-5.5 لتنفيذ المهام التي تتطلب عملًا متواصلًا ومتعدد الخطوات دون إشراف بشري مستمر. وصفه رئيس OpenAI‏ Greg Brockman بأنه نموذج “يمكنه النظر في مشكلة غامضة ومعرفة ما يجب فعله تاليًا.” تتركز المكاسب الأكبر في أربع فئات.

البرمجة الوكيلية

يكتب كودًا جاهزًا للإنتاج، ويصلح الأخطاء، ويُعيد هيكلة المشاريع القديمة، ويتنقل في قواعد أكواد متعددة الملفات. حقق 82.7% في Terminal-Bench 2.0.

استخدام الحاسوب

يشغّل بيئات سطح المكتب تلقائيًا: ينقر ويكتب ويتنقل بين التطبيقات. حقق 78.7% في OSWorld-Verified.

العمل المعرفي

يحلل المستندات، وينشئ جداول البيانات، ويبحث عبر مصادر متعددة. حقق معدل فوز أو تعادل 84.9% في GDPval عبر 44 مهنة.

البحث العلمي

يتصدر في FrontierMath Tier 4 (أصعب المسائل الرياضية) ويسجل أرقامًا قياسية في GeneBench وBixBench للاستدلال العلمي.

ما يميز GPT-5.5 عن GPT-5.4 هو طريقة تعامله مع الغموض. يطلب النموذج توجيهًا بشريًا أقل، ويستخدم الأدوات بفعالية أكبر، ويراجع مخرجاته ذاتيًا، ويواصل العمل حتى إتمام المهمة. تُفيد OpenAI بأن GPT-5.5 يتفوق على GPT-5.4 في Expert-SWE (اختبارهم الداخلي للبرمجة حيث يستغرق البشر وسطيًا 20 ساعة لإنجاز المهام) مع استهلاك رموز أقل.

كيف يؤدي GPT-5.5 في اختبارات الأداء؟

يتصدر GPT-5.5 في الاختبارات الوكيلية ومتعددة الوسائط والرياضية. يحافظ Claude Opus 4.7 على تقدمه في مهام البرمجة والمعرفة. وينافس Gemini 3.1 Pro بقوة في الاستدلال. جميع النتائج أدناه مُبلّغ عنها ذاتيًا من كل مزوّد.

نتائج الاختبارات مُبلَّغ عنها ذاتيًا من كل مزوّد وقد تستخدم شروط تقييم مختلفة

الاختبار GPT-5.5 Claude Opus 4.7 Gemini 3.1 Pro القياس
Terminal-Bench 2.0 82.7% 69.4% 68.5% سير عمل الطرفية الوكيلية
SWE-Bench Pro 58.6% 64.3% 54.2% مشكلات GitHub متعددة الملفات
OSWorld-Verified 78.7% 78.0% ~60% استخدام الحاسوب التلقائي
GDPval (فوز/تعادل) 84.9% 80.3% 67.3% العمل المعرفي، 44 مهنة
GPQA Diamond 93.6% 94.2% 94.3% أسئلة علمية بمستوى الدراسات العليا
FrontierMath Tier 4 متصدر أصعب المسائل الرياضية
Tau2-bench Telecom 98.0% ~90% ~85% سير عمل خدمة العملاء

الفارق الأكبر في Terminal-Bench 2.0، حيث يتقدم GPT-5.5 على Claude Opus 4.7 بمقدار 13.3 نقطة مئوية. يختبر هذا المعيار مهام الطرفية غير المراقبة التي تتطلب تخطيطًا واستعادة من الأخطاء وتحققًا ذاتيًا. في المقابل: يتقدم Claude Opus 4.7 في SWE-Bench Pro بـ 5.7 نقاط، وهو اختبار يقيس حل طلبات السحب الحقيقية على GitHub.

GPT-5.5 مقابل Claude Opus 4.7: من يفوز؟

لا يهيمن أي نموذج على جميع المجالات. يستهدف كل منهما أعباء عمل مختلفة، والاختيار الصحيح يعتمد على احتياجاتك.

يفوز Claude Opus 4.7 (الذي صدر في 16 أبريل، قبل أسبوع من GPT-5.5) في البرمجة. نتيجته 64.3% في SWE-Bench Pro تعني أنه يحل مشكلات GitHub الحقيقية متعددة الملفات بشكل أفضل. كما يتصدر في CursorBench (70% مقابل ~65%)، مما يجعله الخيار الأقوى للتطوير داخل بيئات التطوير المتكاملة. في الاستدلال المتقدم بدون أدوات (HLE no-tools)، يتقدم Opus 4.7 بنتيجة 46.9% مقابل 41.4%.

يفوز GPT-5.5 في المهام الوكيلية. تفوقه في Terminal-Bench 2.0 (+13.3 نقطة) يعكس أداءً أقوى في سير العمل الطويلة عبر سطر الأوامر التي تحتاج تخطيطًا وتكرارًا وتنسيق أدوات. في استخدام الحاسوب (OSWorld-Verified)، يتقدم على Opus 4.7 بأقل من نقطة (78.7% مقابل 78.0%). وفي Tau2-bench Telecom لأتمتة خدمة العملاء، يبلغ GPT-5.5 نسبة 98.0%.

الأسعار متقاربة جدًا: كلاهما يتقاضى $5 لكل مليون رمز إدخال، بينما يكلف GPT-5.5 نحو $30 وOPUS 4.7 نحو $25 لكل مليون رمز إخراج.

ما أسعار GPT-5.5؟

تتماشى أسعار GPT-5.5 عبر API مع أسعار النماذج المتقدمة. تكلفة رموز الإدخال مساوية لـ Claude Opus 4.7 وGemini 3.1 Pro. رموز الإخراج تحمل علاوة سعرية.

$5/M رموز الإدخال
$30/M رموز الإخراج
1M نافذة السياق

تطرح OpenAI نموذج GPT-5.5 لمستخدمي ChatGPT Plus ($20/شهريًا) وPro ($200/شهريًا) وBusiness وEnterprise. يتوسع الوصول عبر API تدريجيًا. يوجد متغير GPT-5.5 Pro يستخدم حوسبة متوازية وقت التشغيل للمسائل الأصعب. يبقى Gemini 3.1 Pro الخيار الأرخص بسعر $1.25 إدخال / $10 إخراج لكل مليون رمز مع نافذة سياق بحجم 2 مليون رمز.

ما إجراءات الأمان في GPT-5.5؟

تصنيف القدرات الأمنية السيبرانية: مرتفع

يصنّف إطار عمل الاستعداد من OpenAI نموذج GPT-5.5 بتقييم “مرتفع” في الأمن السيبراني، بزيادة عن GPT-5.4. تُقيّد ضمانات إضافية أبحاث الثغرات الوكيلية الموسعة وتسلسل الاستغلال للمستخدمين خارج برنامج Trusted Access for Cyber.

اختبرت OpenAI نموذج GPT-5.5 وفق إطار عمل الاستعداد الكامل قبل الإطلاق، مع تقديم نحو 200 شريك من مرحلة الوصول المبكر ملاحظاتهم. يحمل النموذج ثلاثة تصنيفات أمان: مرتفع للقدرات البيولوجية والكيميائية (كما في GPT-5.4)، ومرتفع للأمن السيبراني (بزيادة عن GPT-5.4)، وأقل من مرتفع للتحسين الذاتي للذكاء الاصطناعي.

تشير بطاقة النظام إلى أن GPT-5.5 لا يستطيع تطوير “ثغرات يوم الصفر الفعّالة لجميع مستويات الخطورة في كثير من الأنظمة الحقيقية المحصّنة دون تدخل بشري”، وهو العتبة الحرجة. وسّعت OpenAI برنامج Trusted Access for Cyber (TAC) لمنح متخصصي الأمن الموثقين وصولًا أوسع للقدرات السيبرانية مزدوجة الاستخدام مع تقييدها للمستخدمين العاديين.

ماذا يعني هذا للمحترفين المبدعين؟

GPT-5.5 ليس أداة إبداعية بحد ذاته. لكن كثيرًا من الأدوات الإبداعية تعمل على API من OpenAI، وهذه المنتجات أصبح لديها الآن نموذج يتعامل مع سير العمل متعددة الخطوات بشكل أفضل وبتكلفة أقل لكل رمز مقارنة بـ GPT-5.4.

قدرة استخدام الحاسوب هي الأهم هنا. بنتيجة 78.7% في OSWorld-Verified، يستطيع GPT-5.5 التنقل في تطبيقات سطح المكتب الحقيقية بمفرده. تخيّل وكلاء ذكاء اصطناعي يشغّلون محرر الفيديو، ويضبطون إعدادات التصدير، أو يتنقلون بين التطبيقات الإبداعية دون لمس الماوس.

بالنسبة للمطورين الذين يبنون منتجات ذكاء اصطناعي إبداعية، فإن تسعير $5/$30 لكل مليون رمز ونافذة سياق بحجم مليون رمز يخفضان تكلفة سير العمل المؤتمتة الأطول. تقول OpenAI إن GPT-5.5 يستهلك رموزًا أقل من GPT-5.4 في المهام المكافئة، مما يضاعف التوفير.

أُطلق Claude Opus 4.7 قبل أسبوع بنتائج برمجة أقوى. يرد GPT-5.5 بأداء وكيلي أقوى. المطورون الذين يبنون أدوات إبداعية بالذكاء الاصطناعي لديهم الآن نموذجان متقدمان، كل منهما مُحسَّن لجزء مختلف من سلسلة العمل.

جرّب GPT-5.5 في ChatGPT

متاح الآن لمستخدمي Plus وPro وBusiness وEnterprise. يتوسع الوصول عبر API على مراحل.

جرّب ChatGPT GPT-5.5 ←

الأسئلة الشائعة

ما هو GPT-5.5؟

GPT-5.5 هو أحدث نموذج رائد من OpenAI في الذكاء الاصطناعي، صدر في 23 أبريل 2026. وهو أول نموذج أساسي مُعاد تدريبه بالكامل منذ GPT-4.5 ويستهدف البرمجة الوكيلية واستخدام الحاسوب والعمل المعرفي والبحث العلمي. حقق النموذج 82.7% في Terminal-Bench 2.0 و78.7% في OSWorld-Verified للتحكم التلقائي بالحاسوب.

كم تبلغ أسعار GPT-5.5؟

أسعار GPT-5.5 عبر API هي $5 لكل مليون رمز إدخال و$30 لكل مليون رمز إخراج. يتضمن نافذة سياق بحجم مليون رمز. يمكن لمستخدمي ChatGPT الوصول إلى GPT-5.5 عبر خطط Plus ($20/شهريًا) وPro ($200/شهريًا) وBusiness وEnterprise. يُعد Gemini 3.1 Pro البديل الأرخص بسعر $1.25/$10 لكل مليون رمز.

هل GPT-5.5 أفضل من Claude Opus 4.7؟

يعتمد ذلك على طبيعة العمل. يتصدر GPT-5.5 في المهام الوكيلية مثل Terminal-Bench 2.0 (82.7% مقابل 69.4%) واستخدام الحاسوب (78.7% مقابل 78.0%) والعمل المعرفي (84.9% مقابل 80.3%). يتصدر Claude Opus 4.7 في اختبارات البرمجة بما فيها SWE-Bench Pro (64.3% مقابل 58.6%) وCursorBench (70% مقابل ~65%). كلاهما يتقاضى $5 لكل مليون رمز إدخال.

متى صدر GPT-5.5؟

أطلقت OpenAI نموذج GPT-5.5 في 23 أبريل 2026. وأصبح متاحًا لمستخدمي ChatGPT Plus وPro وBusiness وEnterprise في نفس اليوم. يتوسع الوصول عبر API على مراحل. أُطلق Claude Opus 4.7 قبل أسبوع في 16 أبريل 2026.

هل يدعم GPT-5.5 إنشاء الصور؟

GPT-5.5 بحد ذاته نموذج ذكاء اصطناعي يركز على البرمجة والبحث واستخدام الحاسوب. أطلقت OpenAI بشكل منفصل ChatGPT Images 2.0 في 21 أبريل 2026، الذي يستخدم نموذج gpt-image-2 لإنشاء الصور وتعديلها بجودة عالية داخل ChatGPT. كلتا الميزتين متاحتان لمشتركي ChatGPT Plus وPro.

المصادر

  1. OpenAI - Introducing GPT-5.5
  2. OpenAI - GPT-5.5 System Card
  3. TechCrunch - OpenAI releases GPT-5.5
  4. CNET - ChatGPT 5.5 Is All About Math, Science and AI Research
  5. BenchLM - Claude Opus 4.7 vs GPT-5.5 Benchmark Comparison
  6. Appwrite - GPT-5.5 is here: benchmarks, pricing, and what changes for developers

هل كانت هذه المقالة مفيدة؟

0:00