إطلاق جيميني لايف.. إجابة جوجل على وضع الصوت المتقدم في شات جي بي تي
تم إطلاق جيميني لايف، إجابة جوجل على Advanced Voice Mode الذي تم إطلاقه مؤخرًا (في إصدار ألفا محدود) لـ ChatGPT من OpenAI، يوم الثلاثاء، بعد أشهر من الإعلان عنه في مؤتمر Google I/O 2024 للمطورين. تم الإعلان عنه في حدث Made by Google 2024 من Google.
جيميني لايف
يتيح Gemini Live للمستخدمين إجراء محادثات صوتية “متعمقة” مع Gemini، روبوت الدردشة المولد للذكاء الاصطناعي من Google، على هواتفهم الذكية. بفضل محرك الكلام المحسن الذي يوفر ما تدعي Google أنه حوار متعدد الأدوار أكثر اتساقًا وتعبيرًا عاطفيًا وواقعية، يمكن للأشخاص مقاطعة Gemini أثناء تحدث روبوت الدردشة لطرح أسئلة متابعة، وسيتكيف مع أنماط كلامهم في الوقت الفعلي.
المواصفات
إليك كيف تصفه Google في منشور مدونة: “باستخدام Gemini Live [عبر تطبيق Gemini]، يمكنك التحدث إلى Gemini والاختيار من بين [10] أصوات طبيعية يمكنه الرد بها. يمكنك حتى التحدث بالسرعة التي تريدها أو مقاطعة الرد في منتصفه بأسئلة توضيحية، تمامًا كما تفعل في أي محادثة.”
بدون استخدام اليدين
Gemini Live هو تطبيق بدون استخدام اليدين إذا كنت ترغب في ذلك. يمكنك الاستمرار في التحدث باستخدام تطبيق Gemini في الخلفية أو عندما يكون هاتفك مقفلاً، ويمكن إيقاف المحادثات مؤقتًا واستئنافها في أي وقت.
جوجل
إذن كيف يمكن أن يكون هذا مفيدًا؟ تقدم Google مثالاً للتدرب على مقابلة عمل – وهو سيناريو ساخر بعض الشيء، ولكن لا بأس. تقول Google إن Gemini Live يمكن أن يتدرب معك، ويقدم نصائح التحدث ويقترح مهارات لتسليط الضوء عليها عند التحدث مع مدير التوظيف (أو الذكاء الاصطناعي، حسب الحالة).
برنامج Gemini Live
من بين المزايا التي قد يتمتع بها برنامج Gemini Live مقارنة بـ Advanced Voice Mode في ChatGPT هي الذاكرة الأفضل. إن بنية نموذج الذكاء الاصطناعي التوليدي الذي يدعم Live وGemini 1.5 Pro وGemini 1.5 Flash، لديها “نافذة سياق” أطول من المتوسط، مما يعني أنها يمكن أن تستوعب وتستدل على الكثير من البيانات – نظريًا ساعات من المحادثات ذهابًا وإيابًا – قبل صياغة استجابة.
نماذج Gemini Advanced
قال متحدث باسم Google لـ TechCrunch عبر البريد الإلكتروني: “يستخدم Live نماذج Gemini Advanced التي قمنا بتكييفها لتكون أكثر محادثة. يتم استخدام نافذة السياق الكبيرة للنموذج عندما يجري المستخدمون محادثات طويلة مع Live.”
الممارسة العملية
سيتعين علينا أن نرى مدى نجاح كل هذا في الممارسة العملية، بالطبع. إذا كانت انتكاسات OpenAI مع Advanced Voice Mode هي أي مؤشر، فنادراً ما تترجم العروض التوضيحية بسلاسة إلى العالم الحقيقي.
مقاطع فيديو
في هذا الموضوع، لا يحتوي Gemini Live على إحدى القدرات التي عرضتها Google في I/O حتى الآن: الإدخال المتعدد الوسائط. في مايو، أصدرت Google مقاطع فيديو مسجلة مسبقًا تُظهر Gemini Live وهي ترى وتستجيب لمحيط المستخدمين من خلال الصور واللقطات التي تم التقاطها بواسطة كاميرات هواتفهم – على سبيل المثال، تسمية جزء من دراجة مكسورة أو شرح ما يفعله جزء من التعليمات البرمجية على شاشة الكمبيوتر.
الإدخال المتعدد الوسائط
قالت Google إن الإدخال المتعدد الوسائط سيصل “في وقت لاحق من هذا العام”، رافضة تقديم تفاصيل محددة. في وقت لاحق من هذا العام أيضًا، سيتوسع Live إلى لغات إضافية وإلى iOS عبر تطبيق Google؛ إنه متاح باللغة الإنجليزية فقط في الوقت الحالي.
خطة Google One AI Premium
Gemini Live، مثل Advanced Voice Mode، ليس مجانيًا. إنها حصرية لـ Gemini Advanced، وهي نسخة أكثر تطوراً من Gemini محصورة خلف خطة Google One AI Premium، بسعر 20 دولارًا شهريًا.
ميزات جيميني الجديدة الأخرى في الطريق مجانية
يمكن لمستخدمي Android قريبًا (في الأسابيع المقبلة) إظهار تراكب Gemini أعلى أي تطبيق يستخدمونه لطرح أسئلة حول ما هو موجود على الشاشة (على سبيل المثال، مقطع فيديو على YouTube) عن طريق الضغط على زر الطاقة في هواتفهم أو قول، “مرحبًا Google”. سيكون Gemini قادرًا على إنشاء صور (ولكن لا يزال ليس صورًا لأشخاص، للأسف) مباشرة من التراكب – صور يمكن سحبها وإفلاتها في تطبيقات مثل Gmail وGoogle Messages.
خدمات Google
يكتسب Gemini أيضًا تكاملات جديدة مع خدمات Google (أو “الإضافات”، كما تفضل الشركة تسميتها) سواء على الهاتف المحمول أو الويب. خلال الأسابيع المقبلة، سيكون جهاز Gemini قادرًا على اتخاذ المزيد من الإجراءات باستخدام Google Calendar وKeep وTasks وYouTube Music وUtilities، وهي التطبيقات التي تتحكم في ميزات الجهاز مثل المؤقتات والمنبهات وعناصر التحكم في الوسائط والمصباح اليدوي ومستوى الصوت وWi-Fi وBluetooth وما إلى ذلك.
تدوينات جوجل
في إحدى تدوينات جوجل، تقدم جوجل بعض الأفكار حول كيفية استفادة الناس من هذه الفكرة. تبدو الفكرة رائعة، على افتراض أن كل شيء يعمل بشكل موثوق:
اطلب من جيميني “إنشاء قائمة تشغيل للأغاني التي تذكرني بأواخر التسعينيات”.
التقط صورة لإعلان حفل موسيقي واسأل جيميني عما إذا كنت متاحًا في ذلك اليوم – بل واضبط حتى تذكيرًا لشراء التذاكر.
اطلب من جيميني استخراج وصفة من Gmail واطلب منه إضافة المكونات إلى قائمة التسوق الخاصة بك في Keep.
أخيرًا، بدءًا من وقت لاحق من هذا الأسبوع، سيتوفر جيميني على الأجهزة اللوحية التي تعمل بنظام Android.