أدوات الذكاء الاصطناعي مثل ChatGPT موجودة في كل مكان: ما تحتاج إلى معرفته
منذ أكثر من سبع سنوات ، دعت CNET القراء لمساعدتنا في كتابة رواية خيال علمي, استغرقت جهود التعهيد الجماعي عدة أشهر وتضمنت مساهمات من عشرات الكتاب والمحررين المتطوعين من جميع أنحاء العالم, يمكننا اليوم إنشاء قصة متماسكة بطول مماثل في ساعات قليلة – أو ربما بضع دقائق فقط مع المطالبات الصحيحة – باستخدام أدوات الذكاء الاصطناعي التوليدية مثل ChatGPT التي أحدثت ثورة في العالم في الأشهر الأخيرة.
أكثر جنونًا: الرسوم التوضيحية التي أنشأها فنانو CNET وآخرون لروايتنا الجماعية في ذلك الوقت يمكن إجراؤها اليوم بواسطة أدوات الذكاء الاصطناعي مثل Dall-E 2 في دقائق ، ولن يلاحظ سوى القليل الفرق (الحيلة هي عدم النظر إلى الأصابع – المزيد عن ذلك لاحقًا).
أصبح ChatGPT بالفعل أحد أسرع المنتجات التكنولوجية الجديدة التي تم تبنيها في التاريخ.
ربما سمعت عن استخدامه للمساعدة في تكوين كل شيء من رسائل البريد الإلكتروني ورسائل الغلاف إلى مهام المدرسة. وفي الوقت نفسه ، لا يمكن للنماذج المتشابهة أن تولد فقط صورًا بأنماط لا حصر لها ، ولكن أيضًا مقاطع فيديو وحتى موسيقى.
من الصعب تذكر أي شيء يُحدث المزيد من الضجة ، ربما مثل Siri أو iPhone. من الصعب مواكبة كل ذلك ، لذا إليك بعض الإجابات السريعة على جميع أسئلتك الأكثر إلحاحًا حول الذكاء الاصطناعي التوليدي.
ما ChatGPT ؟
على الرغم مما قد يخبرك به حتى بعض مهندسي Google ، فإن برامج الدردشة من OpenAI أو روبوت Bing الجديد من Microsoft ، والذي يطلق على نفسه على ما يبدو سيدني ، ليس واعيًا أو واعيًا.
ما أوصلنا إلى هذه النقطة ليس سحرًا أو مؤامرة شريرة لاستعبادنا جميعًا.
بدلاً من ذلك ، فهو نتاج الرياضيات المعقدة ، والتعليمات البرمجية ، وقيمة المكتبات من البيانات والكثير من قوة الحوسبة.
تعتمد الأنظمة الأساسية على ما يسمى نماذج اللغة الكبيرة (LLMs) أو أحيانًا نماذج اللغة التوليدية أو نماذج لغة المحولات – يرمز GPT في البرنامج إلى “المحولات المولدة مسبقًا”.
هذه هي أنظمة التعلم الآلي التي تعالج ما يعادل تيرابايت من البيانات ، وغالبًا ما يتم كشطها مباشرة من الإنترنت ، وتدوين الأنماط والارتباطات داخل مجموعة البيانات ، والتي تسمى بيانات التدريب.
في حالة البرنامج ، تكون مجموعات البيانات النصية كافية. يتم تدريب منشئي الصور مثل Dall-E و Stable Diffusion و Midjourney من خلال النظر إلى مجموعة كبيرة من الصور ومعرفة ما هي عليه من خلال قراءة التعليقات المصاحبة لها ، لذلك لا تزال النماذج تعتمد على اللغة.
الشبكة العصبية هي نوع من أنظمة التعلم الآلي التي يمكن تدريبها على الكثير من البيانات ويمكنها بعد ذلك استنباط رؤى من الأنماط. هذه الشبكة العصبية ليست جديدة.
ما يحدث مع الأنظمة التوليدية المتاحة للجمهور والتي ظهرت لأول مرة في العام الماضي هو أن هذه الأنماط لا تتعلم فقط ، بل يتم إقرانها أيضًا بشبكة عصبية ثانية تعمل على عكس هندسة عملية إنشاء المحتوى وفحصه مقابل الشبكة العصبية الأولى للتأكد من مطابقته للموجه المعطى للنظام.
في الأساس ، أنت تعطي ChatGPT أو Dall-E موجهًا ويقومان بصياغة استجابة من خلال التنبؤ بما يجب أن تستند إليه الكلمة التالية (أو البكسل في حالة الصورة) على جميع الأنماط والارتباطات المستقاة من بيانات التدريب.
ما الذي يمكن أن تفعله LLM أيضًا؟
بالإضافة إلى إنشاء النصوص والصور ، فإن أنظمة الذكاء الاصطناعي الأخرى ، مثل Runway’s Gen1 و Meta Make-a-Video ، تولد تأثيرات فيديو وفلاتر ومشاهد كاملة من خلال وسائل مماثلة.
في الآونة الأخيرة ، أصدر ذراع البحث في Google إصدارًا مبكرًا من MusicLM ، والذي يمكنه أخذ المطالبات المستندة إلى النصوص وتحويلها إلى عينات من الموسيقى, كانت النتائج مبهرة.
تُستخدم الأنظمة التوليدية أيضًا لإنشاء رموز وتصميمات ثلاثية الأبعاد لجميع أنواع الكائنات ، من الملابس إلى المباني.
نظريًا ، إذا كان هناك شكل أو وسيط للمحتوى أو حتى مجرد مجموعة بيانات متوفرة بما يكفي لتدريب الذكاء الاصطناعي عليه ، فيجب أن يكون الذكاء الاصطناعي قادرًا على إنشاء هذا النوع من المحتوى بمفرده.
تستخدم شركة IBM أنظمة إنتاجية لتطوير أشباه موصلات وجزيئات جديدة يمكن أن تساعد في مكافحة السرطان أو العدوى البكتيرية.
قد لا يكون هناك حد لما يمكن إنشاؤه ، وهو أمر مثير ومخيف بعض الشيء في نفس الوقت.
كيف يمكن استخدام هذه الأشياء؟
يمكن القول إن هناك فقاعة ذكاء اصطناعي متضخمة بسرعة ، حيث تدعي الشركات الناشئة فجأة أنها تستخدم الذكاء الاصطناعي لتوليد كل شيء بدءًا من المزيد من رسائل البريد الإلكتروني العشوائية للأعمال التي تؤدي إلى مقاطع فيديو تسويقية كاملة.
يستمتع الأشخاص بالتأكيد مع روبوتات الدردشة ومولدات الصور ، ويجد بعض التصميمات الأدوات مفيدة عند العمل على المفاهيم أو المسودات المبكرة للعمل الجديد.
أحدثت الأشكال المجاورة من الذكاء الاصطناعي ثورة بهدوء في أشياء مثل التنبؤ بالطقس وتحليل التصوير الطبي.
من المزايا التي نادرًا ما يتم ذكرها للحالة الحالية للذكاء الاصطناعي أنها جيدة بشكل ملحوظ في الأشياء التي قد يستغرق البشر سنوات لإكمالها ، مثل معالجة الشريعة الكاملة لحركة أدبية أو فنية معينة أو التلميح عن البنية النغمية لنوع معين من الموسيقى.
في الوقت نفسه ، فإن بعض نقاط ضعف الذكاء الاصطناعي – فهم السياقات المعقدة ، والتصرف بطرق مبتكرة أو غير متوقعة وتقييم المشاعر أو المدخلات الحسية – هي أشياء يتفوق فيها البشر دون بذل مجهود يذكر.
قد تكمن العديد من استخدامات هذه التكنولوجيا في طرق جديدة للتعاون مع الذكاء الاصطناعي لإبراز أفضل ما يفعله كل من الذكاء البيولوجي والاصطناعي.
كيف يمكنك التأكد من أنها ليست حساسة؟
بسيط ، حقًا: المعلومات ليست معرفة. تشبه LLMs وجود أمينة مكتبة مرجعية يمكنها تجاوز مجرد توجيهك إلى القسم الصحيح من المكتبة – يمكنها اقتباس أي سطر من أي كتاب في المكتبة لأنها قرأتها وحفظتها جميعًا, لكن هناك مشكلة.
لم يقم أمين المكتبة هذا الذي يبدو مثاليًا بأي شيء آخر سوى قراءة كل شيء في المكتبة.
إن افتقارها إلى الخبرة الحياتية يجعل من الصعب عليها تفسير السياقات والنصوص الفرعية والنوايا والفروق الدقيقة الأخرى غير الحرفية وراء كل كلمة تناولتها بشكل صحيح.
ما هو أسوأ: الأمر نفسه ينطبق على قدرتها على فهم الأسئلة بشكل صحيح والمطالبات التي تحصل عليها من رعاة المكتبة. لذلك غالبا ما تفهم الأمور بشكل خاطئ.
يبدو الأمر كما لو أن الكلمة المكتوبة بأكملها تم حفظها من قبل شخص واحد مستعد للإجابة على أسئلتنا حول أي شيء. المصيد الوحيد هو أن الشخص أيضًا أجنبي.
لاحظ الكثير من مستخدمي البرنامج أخطاء واقعية متكررة وتناقضات في الردود التي يقدمها النظام.
هذا لأنه تم تدريبه على ثروة من البيانات التي لم يتم التحقق منها ولا تتحقق من صحة نفسها ، بل يتنبأ فقط بالكلمة التي يجب أن تكون بعد ذلك بناءً على كل ما يتم قراءته. حرفيا ليس له منطق سليم.
هذا يمكن أن يؤدي إلى أخطاء ، وهو أمر اختبره CNET نفسه في استخدام نموذج الذكاء الاصطناعي التوليدي.