أعلنت شركة OpenAI عن إطلاق ميزة “وضع الصوت المتقدم مع الرؤية” لتطبيق “ChatGPT”، مما يمنحه القدرة على فهم مقاطع الفيديو في الوقت الفعلي وتحليل الصور بشكل غير مسبوق.
تأتي هذه الخطوة بعد سبعة أشهر من استعراض الشركة لهذه التقنية لأول مرة.
ويمكن للمشتركين في باقات “Plus” أو “Team” أو “Pro” من خلال تطبيق “ChatGPT”، ببساطة توجيه كاميرات هواتفهم نحو الأجسام أو العناصر المختلفة ليحصلوا على استجابة فورية من “ChatGPT”، بحسب تقرير نشره موقع “تك كرانش” واطلعت عليه “العربية Business”.
يستطيع أيضاً التطبيق فهم الشاشة نفسها عبر “مشاركة الشاشة”، ما يتيح شرح قوائم الإعدادات أو تقديم حلول لمسائل رياضية معقدة.
طريقة تفعيل الميزة الجديدة
يمكنك تفعيل ميزة فهم مقاطع الفيديو والصور من خلال خطوات بسيطة على تطبيق “ChatGPT”، وهي كالتالي:
1. اضغط على رمز الصوت بجوار شريط المحادثة.
2. اختر رمز الفيديو أسفل الشاشة لبدء وضع الفيديو.
3. لمشاركة الشاشة، توجه إلى قائمة النقاط الثلاث واختر “مشاركة الشاشة”.
قالت شركة “OpenAI”، إن إطلاق الميزة الجديدة بدأ منذ يوم الخميس وستكتمل خلال أسبوع. ومع ذلك، لن يتمكن جميع المستخدمين من الاستفادة منها في الوقت الحالي، إذ سيُتاح الوضع لمشتركي “ChatGPT Enterprise” و”Edu” فقط اعتبارًا من يناير المقبل.
وأظهر رئيس “OpenAI”، جريج بروكمان، كيف يمكن للوضع الجديد “فهم” الرسومات البسيطة، مثل الأشكال التشريحية التي يرسمها المستخدم، ومع ذلك، فإن التقنية ليست خالية من العيوب؛ حيث ارتكبت خطأ في حل مسألة هندسية.
يذكر أن شركة غوغل كشفت هذا الأسبوع عن مشروع “Project Astra”، الذي يجمع بين المحادثة بالذكاء الاصطناعي وتحليل الفيديو في الوقت الفعلي.
إضافات “سانتا كلوز”
قدمت “OpenAI” ميزة “وضع سانتا”، التي تضيف صوت شخصية “سانتا كلوز” كخيار صوتي مميز.
وتؤكد شركة OpenAI بهذه الخطوة، سعيها لتطوير الذكاء الاصطناعي نحو فهم أعمق وأكثر تفاعلية مع العالم الحقيقي، لتبقى في طليعة المنافسة العالمية.