ذكاء فوياجر الاصطناعي من تينسنت يحول الصور إلى عوالم ثلاثية الأبعاد تفاعلية، ولكن مع عقبات كبيرة

التكنولوجيا اليومية

التكنولوجيا اليومية

·

04/09/2025

button icon

كشفت شركة تينسنت (Tencent) عن "فوييجر" (Voyager)، وهو نموذج رائد للذكاء الاصطناعي قادر على تحويل الصور الثابتة إلى بيئات ثلاثية الأبعاد قابلة للاستكشاف. بناءً على الأعمال السابقة في تحويل النص إلى ثلاثي الأبعاد وتوليف الفيديو، يعد فوييجر بفتح آفاق جديدة في الفن التوليدي والتجارب التفاعلية. ومع ذلك، تأتي هذه التقنية بمتطلبات حسابية كبيرة وقيود ترخيص قد تحد من انتشارها الواسع الفوري.

النقاط الرئيسية

كيف يعمل فوييجر

يُعد "فوييجر" تطورًا لنموذج "هونيوان وورلد 1.0" (HunyuanWorld 1.0) السابق من تينسنت. تستفيد عملية تدريبه من خط أنابيب بيانات آلي يحلل مقاطع الفيديو الموجودة لتحديد حركات الكاميرا والعمق لكل إطار. وهذا يلغي الحاجة إلى التسمية اليدوية للبيانات، مما يسمح للباحثين بمعالجة مجموعة بيانات ضخمة تضم أكثر من 100,000 مقطع فيديو، مصدرها تسجيلات من العالم الحقيقي وعروض Unreal Engine.

المتطلبات الحسابية والترخيص

تشغيل "فوييجر" ليس بالأمر الهين من الناحية الحسابية. يتطلب النموذج ما لا يقل عن 60 جيجابايت من ذاكرة وحدة معالجة الرسوميات (GPU) لدقة 540 بكسل، ويوصى بـ 80 جيجابايت للحصول على الأداء الأمثل. وقد أتاحت تينسنت أوزان النموذج على Hugging Face، بالإضافة إلى رمز متوافق مع إعدادات وحدة معالجة رسوميات واحدة ومتعددة. لمعالجة أسرع، يدعم النظام الاستدلال المتوازي عبر وحدات معالجة رسوميات متعددة، حيث أفادت التقارير أن ثماني وحدات معالجة رسوميات توفر زيادة في السرعة بمقدار 6.69 مرة مقارنة بتكوينات وحدة معالجة رسوميات واحدة.

ومع ذلك، تصاحب هذه التقنية قيود ترخيص كبيرة. على غرار نماذج Hunyuan الأخرى من تينسنت، يُحظر استخدام "فوييجر" في الاتحاد الأوروبي والمملكة المتحدة وكوريا الجنوبية. علاوة على ذلك، تتطلب أي تطبيقات تجارية تصل إلى أكثر من 100 مليون مستخدم نشط شهريًا اتفاقية ترخيص منفصلة مع تينسنت.

الأداء والإمكانات المستقبلية

على معيار WorldScore، وهو مقياس طوره باحثون من جامعة ستانفورد لتقييم توليد العوالم، تفوق "فوييجر" على المنافسين مثل WonderWorld وCogVideoX-I2V. حقق أعلى درجة إجمالية بلغت 77.62، مما يدل على قوة خاصة في التحكم في الكائنات وتناسق الأسلوب. وبينما احتل المركز الثاني في التحكم بالكاميرا، يشير أداؤه العام إلى قفزة كبيرة في توليد بيئات ثلاثية الأبعاد متماسكة ومتناسقة بصريًا.

على الرغم من نتائج المعيار الواعدة هذه، فإن المتطلبات الحسابية الكبيرة والقيود في توليد "عوالم" طويلة ومتماسكة تعني أن التجارب التفاعلية في الوقت الفعلي قد لا تزال بعيدة المنال. ومع ذلك، يمثل "فوييجر" خطوة أولى مثيرة نحو عصر جديد من الفن التوليدي والمحتوى الرقمي التفاعلي، على غرار التجارب المبكرة في الإبداع البصري المدفوع بالذكاء الاصطناعي.

قراءة مقترحة

20-05-2025
هل يمكن الوثوق بسام ألتمان في المستقبل؟
تتناول هذه المقالة الجدل حول سام ألتمان، الرئيس التنفيذي لشركة OpenAI، وتأثيره على مستقبل الذكاء الاصطناعي.
22-08-2025
هونر ماجيك في فليب 2 يصل، مبهرًا بالأناقة والقوة لمنافسة سامسونج
هونر تكشف النقاب عن هاتف ماجيك في فليب 2 في الصين، وهو هاتف قابل للطي جديد يتميز بتصميم متألق وكاميرات قوية وأكبر بطارية في فئته، بهدف التنافس مع سلسلة سامسونج جالكسي فليب.
21-07-2025
الكشف عن القيمة الحقيقية في سماعات الأذن الاقتصادية: نظرة متعمقة على الجواهر الخفية
استكشف كيفية العثور على سماعات أذن اقتصادية قيّمة، وفهم عمليات التصنيع، وخيارات التصميم، والاختلافات الدقيقة التي تجعل النماذج ذات الأسعار المعقولة متميزة.
29-08-2025
جوجل تكشف عن Pixel Care Plus: حماية معززة لأجهزة بيكسل الخاصة بك
جوجل تقدم بيكسل كير بلس، برنامج حماية أجهزة جديد يحل محل جوجل بريفيرد كير. تعرف على التغطية والأسعار وما يحتاج المشتركون الحاليون لمعرفته.
07-08-2025
مكبرات صوت سونوس روم ترتفع درجة حرارتها وتذيب منافذ USB-C وسط مخاوف تتعلق بالسلامة
مكبرات صوت Sonos Roam ترتفع حرارتها وتذيب منافذ USB-C، مما يثير مخاوف من خطر الحريق. تعرف على المشكلة، تقارير المستخدمين، واستجابة Sonos.
04-07-2025
التحول الكبير في بيتكوين: الحيتان تبيع ممتلكاتها للمستثمرين المؤسسيين
اكتشف لماذا سعر البيتكوين راكد: الحيتان تتخلص من ممتلكاتها للمستثمرين المؤسسيين، مما يغير بشكل أساسي ديناميكيات سوق العملات المشفرة.
10-06-2025
كشف غرفة الصدى: لماذا تعزز روبوتات الدردشة المدعومة بالذكاء الاصطناعي معتقداتك
تكشف دراسة جديدة لماذا غالبًا ما تعزز روبوتات الدردشة المدعومة بالذكاء الاصطناعي مثل ChatGPT المعتقدات الحالية، مما يقود المستخدمين إلى متاهات معلوماتية. تعرف على كيفية مساهمة تحيزات المستخدم وتصميم المنصة في "تأثير البحث الضيق" هذا واكتشف استراتيجيات للحصول على مجموعة أكثر توازنًا من المعلومات.
20-08-2025
CNET تستضيف حفل مشاهدة مباشر لحدث بيكسل من جوجل
انضم إلى حفلة مشاهدة CNET المباشرة لحدث Google Pixel. احصل على تحليل في الوقت الفعلي ورؤى الخبراء حول الكشف عن الهواتف الجديدة بدءًا من الغد الساعة 12:30 ظهرًا بتوقيت شرق الولايات المتحدة.
09-07-2025
روبوت Optimus من Tesla سيكتسب دماغًا بفضل تكامل Grok من xAI
تقوم Tesla بدمج Grok AI الخاص بـ xAI في روبوتها البشري Optimus، مما يمنحه فهمًا متقدمًا للغة الطبيعية وقدرات استدلالية. تهدف هذه الخطوة إلى إنشاء روبوت بشري متعدد الأغراض حقًا وتسلط الضوء على تعاون أعمق بين Tesla و xAI.
17-06-2025
مستقبل تيك توك في الولايات المتحدة: موعد نهائي آخر يلوح في الأفق
استكشف آخر التطورات حيث يواجه TikTok موعدًا نهائيًا حاسمًا آخر لبيع عملياته في الولايات المتحدة، مع حظر فيدرالي يلوح في الأفق وموقف الرئيس ترامب يتطور.
18-08-2025
نظارات ميتا للواقع المعزز 'هايبرنوفا' تستعد لظهور أرخص
من المتوقع أن تُطلق نظارات الواقع المعزز "هايبرنوفا" القادمة من ميتا بسعر أقل يبلغ حوالي 800 دولار، مما قد يجعل تقنية الواقع المعزز في متناول المستهلكين بشكل أكبر.
22-07-2025
يتيح Chrome على iOS تبديلًا سلسًا بين الملفات الشخصية وملفات العمل
يتيح Google Chrome على نظام iOS الآن التبديل السلس بين الملفات الشخصية وملفات العمل لمستخدمي المؤسسات، مما يعزز فصل البيانات وأمانها.
05-08-2025
تطلق راوند هيل للاستثمارات صندوق ETF للروبوتات البشرية للانكشاف المستهدف
يناقش ديفيد مازا، الرئيس التنفيذي لشركة Roundhill Investments، إطلاق صندوق استثمار متداول (ETF) جديد يركز على الروبوتات البشرية، مما يوفر للمستثمرين انكشافًا على الشركات التي تسوّق هذه الآلات المتقدمة.
05-08-2025
ميغان 2.0 تتخطى دور السينما اليابانية وسط عدم اليقين بشأن الامتياز
ألغت يونيفرسال بيكتشرز العرض السينمائي لفيلم "M3GAN 2.0" في اليابان، مشيرةً إلى أسباب غير محددة. يأتي هذا القرار بعد الظهور الأول التنافسي للفيلم في أمريكا الشمالية ويثير تساؤلات حول مستقبل السلسلة.
29-08-2025
ترجمة جوجل تتبنى الذكاء الاصطناعي لممارسة تعلم اللغة المخصصة
أصبح مترجم جوجل يستخدم الآن Gemini AI لتقديم ممارسة شخصية لتعلم اللغة، بما في ذلك تمارين الاستماع والتحدث، مما قد ينافس دوولينجو.
22-08-2025
Xbox Ally: جهاز مايكروسوفت المحمول يمهد الطريق لنظام تشغيل ألعاب ويندوز موحد
استكشف جهاز Xbox Ally المحمول من مايكروسوفت، وهو جهاز يقدم لمحة عن نظام تشغيل ويندوز مستقبلي للألعاب بواجهته المبسطة وتكامله المحسن مع ألعاب الكمبيوتر.