نموذج Kimi K2.6 مفتوح المصدر أطلقته Kimi، وهو متاح الآن عبر Kimi.com وتطبيق Kimi والواجهة البرمجية وKimi Code. يُظهر النموذج تحسينات في مهام البرمجة والتنفيذ طويل الأفق وقدرات أسراح الوكلاء مقارنة بسابقه.
تحسينات أداء البرمجة
يُظهر نموذج Kimi K2.6 مكاسب كبيرة في مهام البرمجة طويلة الأفق مع أداء موثوق عبر لغات برمجة متعددة بما في ذلك Rust و Go و Python. يتعامل النموذج مع مهام هندسية معقدة تشمل تطوير الواجهات الأمامية وعمليات DevOps وتحسين الأداء.
في الاختبارات الداخلية، نجح نموذج Kimi K2.6 في نشر نموذج Qwen3.5-0.8B محليًا على جهاز Mac مع تنفيذ وتحسين استدلال النموذج في لغة Zig المتخصصة. على مدار 12 ساعة من التنفيذ المستمر مع أكثر من 4000 استدعاء أداة و14 تكرار، حسّن النموذج الإنتاجية من حوالي 15 إلى 193 رمز في الثانية، محققًا سرعات أسرع بحوالي 20% من LM Studio.
قام النموذج أيضًا بإعادة هيكلة exchange-core، وهو محرك مطابقة مالي مفتوح المصدر يبلغ عمره 8 سنوات. خلال فترة تنفيذ مدتها 13 ساعة، مرّ نموذج Kimi K2.6 عبر 12 استراتيجية تحسين وأجرى أكثر من 1000 استدعاء أداة لتعديل أكثر من 4000 سطر من الكود. أسفرت عملية التحسين عن زيادة بنسبة 185% في الإنتاجية المتوسطة (من 0.43 إلى 1.24 MT/s) وزيادة في الأداء بنسبة 133% (من 1.23 إلى 2.86 MT/s).
توسع معمارية أسراح الوكلاء
يُظهر نموذج Kimi K2.6 تحسينات نوعية في قدرات أسراح الوكلاء، حيث يتسع من 100 وكيل فرعي و1500 خطوة منسقة في K2.5 إلى 300 وكيل فرعي ينفذون عبر 4000 خطوة منسقة في نفس الوقت. يقلل هذا التوسع من زمن الانتظار الشامل مع تحسين جودة المخرجات وتوسيع الحدود التشغيلية.
ينسق النموذج وكلاء متغايرين لدمج المهارات المتكاملة، بما في ذلك البحث الواسع المدعوم بالبحث العميق وتحليل المستندات على نطاق واسع المدمج مع الكتابة الطويلة وإنشاء محتوى متعدد الصيغ المنفذ بالتوازي. تمكّن المعمارية من تسليم مخرجات شاملة تشمل المستندات والمواقع الإلكترونية والشرائح والجداول الإلكترونية ضمن تشغيل مستقل واحد.
أداء الوكيل المستقل
يُظهر نموذج Kimi K2.6 أداءً قويًا في الوكلاء المستقلين والاستباقيين مثل OpenClaw و Hermes، التي تعمل عبر تطبيقات متعددة مع تنفيذ مستمر 24/7. يوفر النموذج تحسينات قابلة للقياس في الموثوقية الحقيقية، بما في ذلك تفسير API أكثر دقة وأداء أكثر استقرارًا على المدى الطويل والوعي الأمني المحسّن أثناء مهام البحث الممتدة.
أظهر الاختبار الداخلي وكيلًا مدعومًا بـ K2.6 يعمل بشكل مستقل لمدة 5 أيام أثناء إدارة المراقبة والاستجابة للحوادث وعمليات النظام. أظهر الوكيل السياق المستمر ومعالجة المهام متعددة الخيوط والتنفيذ الكامل من التنبيه إلى الحل.
نتائج المعايير والمقارنات
يحقق نموذج Kimi K2.6 أداءً تنافسيًا عبر معايير التقييم المتعددة. في معيار Humanity’s Last Exam الكامل مع الأدوات، يسجل النموذج 54.0 مقابل 52.1 لـ GPT-5.4 و53.0 لـ Claude Opus 4.6. بالنسبة لـ DeepSearchQA F1-score، يحقق نموذج Kimi K2.6 92.5، متفوقًا على GPT-5.4 بـ 78.6.
في تقييمات البرمجة، يسجل نموذج Kimi K2.6 80.2 على SWE-Bench Verified و76.7 على SWE-Bench Multilingual و58.6 على SWE-Bench Pro. يحقق النموذج 89.6 على LiveCodeBench الإصدار 6 و66.7 على Terminal-Bench 2.0. بالنسبة لمهام الرؤية، يسجل نموذج Kimi K2.6 93.2 على MathVision مع Python و96.9 على V* مع Python.
التوفر والتكامل
نموذج Kimi K2.6 متاح عبر قنوات متعددة بما في ذلك موقع Kimi الرسمي وتطبيق الجوال والوصول عبر الواجهة البرمجية وتكامل Kimi Code. يعمل النموذج بطول سياق يبلغ 262144 رمز ويدعم سير العمل المعزز بالأدوات لتنفيذ المهام المحسّن.
يمكن للمطورين الوصول إلى النموذج عبر الواجهة البرمجية الرسمية لإعادة إنتاج دقيقة للمعايير. بالنسبة لمزودي الجهات الخارجية، توصي Kimi باستخدام خدمة Kimi Vendor Verifier لضمان تطبيقات عالية الدقة للنموذج.
