كيف تصنع جوجل شرائح مخصصة تستخدم لتدريب نماذج آبل للذكاء الاصطناعي وروبوت الدردشة جيميني؟
داخل معمل مترامي الأطراف في جوجل في المقر الرئيسي للشركة في ماونتن فيو، كاليفورنيا، هناك المئات من رفوف الخوادم تطن عبر عدة ممرات، وتؤدي مهام أقل انتشارًا بكثير من تشغيل محرك البحث المهيمن في العالم أو تنفيذ أعباء العمل لملايين عملاء Google Cloud.
اختبارات على الرقائق
وبدلاً من ذلك، يقومون بإجراء اختبارات على الرقائق الدقيقة الخاصة بشركة Google، والتي تسمى وحدات معالجة Tensor، أو TPUs.
وحدات TPU
تم تدريب وحدات TPU الخاصة بشركة Google في الأصل على أعباء العمل الداخلية، وهي متاحة لعملاء السحابة منذ عام 2018.
نماذج الذكاء الاصطناعي
كشفت أنها تستخدم وحدات TPU لتدريب نماذج الذكاء الاصطناعي التي تدعم ذكاء Apple. تعتمد Google أيضًا على وحدات TPU لتدريب وتشغيل برنامج Gemini chatbot الخاص بها.
حجم التدريب
“إن العالم لديه هذا الاعتقاد الأساسي بأن جميع نماذج الذكاء الاصطناعي، ونماذج اللغات الكبيرة، يتم تدريبها على Nvidia
وبالطبع نفيديا لها نصيب الأسد من حجم التدريب.
جوجل
قال دانييل نيومان، الرئيس التنفيذي لمجموعة فوتروم، “لكن جوجل سلكت طريقها الخاص هنا”. لقد كان يغطي شرائح Google السحابية المخصصة منذ إطلاقها في عام 2015.
أمازون
كانت Google أول مزود سحابي يصنع شرائح الذكاء الاصطناعي المخصصة, وبعد ثلاث سنوات، أمازون أعلنت عن أول شريحة سحابية للذكاء الاصطناعي، Inferentia, ولم يتم الإعلان عن أول شريحة ذكاء اصطناعي مخصصة لشركة Maia حتى نهاية عام 2023.
إصدارات المنتجات الفاشلة
لكن كونك الأول في مجال رقائق الذكاء الاصطناعي لم يُترجم إلى المركز الأول في سباق الفئران الشامل للذكاء الاصطناعي التوليدي. واجهت Google انتقادات بسبب إصدارات المنتجات الفاشلة، وخرجت Gemini بعد أكثر من عام من إصدار ChatGPT من OpenAI.
Google Cloud
ومع ذلك، فقد اكتسبت Google Cloud زخمًا ويرجع ذلك جزئيًا إلى عروض الذكاء الاصطناعي. أعلنت شركة Alphabet، الشركة الأم لشركة Google، عن ارتفاع إيراداتها السحابية بنسبة 29% في الربع الأخير، متجاوزة 10 مليارات دولار في الإيرادات الفصلية للمرة الأولى.
عصر الذكاء الاصطناعي
“لقد أعاد عصر الذكاء الاصطناعي السحابي ترتيب الطريقة التي يُنظر بها إلى الشركات بالكامل، وقد يكون هذا التمايز السليكوني، أو مادة TPU نفسها، أحد أكبر الأسباب التي دفعت Google إلى الانتقال من السحابة الثالثة إلى الظهور بشكل متكافئ حقًا، وفي بعض العيون، ربما قال نيومان: “حتى قبل السحابتين الأخريين لبراعة الذكاء الاصطناعي”.
“تجربة فكرية بسيطة ولكنها قوية”
في شهر يوليو، قامت قناة CNBC بأول جولة أمام الكاميرا في مختبر الرقائق التابع لشركة Google وجلست مع رئيس الرقائق السحابية المخصصة، أمين فاهدات. لقد كان بالفعل في شركة جوجل عندما طرحت فكرة صنع الرقائق لأول مرة في عام 2014.
العملاء المحتملين
قال فاهدات: “بدأ الأمر كله بتجربة فكرية بسيطة لكنها قوية”. “طرح عدد من العملاء المحتملين في الشركة السؤال التالي: ماذا سيحدث إذا أراد مستخدمو Google التفاعل مع Google عبر الصوت لمدة 30 ثانية فقط في اليوم؟ وما مقدار قوة الحوسبة التي سنحتاجها لدعم مستخدمينا؟
عدد أجهزة الكمبيوتر
وقررت المجموعة أن جوجل ستحتاج إلى مضاعفة عدد أجهزة الكمبيوتر في مراكز البيانات الخاصة بها. لذلك بحثوا عن حل أفضل.
أجهزة مخصصة
“لقد أدركنا أنه يمكننا بناء أجهزة مخصصة، وليس أجهزة للأغراض العامة، ولكن أجهزة مخصصة – وحدات معالجة Tensor في هذه الحالة – لدعم ذلك بكثير وبكفاءة أكبر. وقال فاهدات: “في الواقع، كان عامل 100 أكثر كفاءة مما كان يمكن أن يكون عليه خلاف ذلك”.
مراكز بيانات
لا تزال مراكز بيانات Google تعتمد على وحدات المعالجة المركزية للأغراض العامة، أو وحدات المعالجة المركزية، ووحدات معالجة الرسومات من نفيديا، أو وحدات معالجة الرسومات. تعد وحدات TPU من Google نوعًا مختلفًا من الرقائق تسمى الدائرة المتكاملة الخاصة بالتطبيقات، أو ASIC، والتي تم تصميمها خصيصًا لأغراض محددة. يركز TPU على الذكاء الاصطناعي. تقوم Google بإنشاء ASIC آخر يركز على الفيديو يسمى وحدة ترميز الفيديو.
شرائح مخصصة
وتقوم جوجل أيضًا بتصنيع شرائح مخصصة لأجهزتها، على غرار استراتيجية السيليكون المخصصة التي تتبعها شركة أبل. يعمل جهاز Tensor G4 على تشغيل هاتف Pixel 9 الجديد المزود بتقنية الذكاء الاصطناعي من Google، كما تعمل شريحة A1 الجديدة على تشغيل Pixel Buds Pro 2.
مجموعة Futurum Group
ومع ذلك، فإن مادة TPU هي ما يميز Google. لقد كان الأول من نوعه عندما تم إطلاقه في عام 2015. ولا تزال وحدات TPU الخاصة بشركة Google تهيمن على مسرعات الذكاء الاصطناعي السحابية المخصصة، حيث تبلغ حصتها 58% من السوق، وفقًا لمجموعة Futurum Group.
تطبيقات الذكاء الاصطناعي
صاغ جوجل هذا المصطلح بناءً على المصطلح الجبري “الموتر”، في إشارة إلى مضاعفات المصفوفات واسعة النطاق التي تحدث بسرعة لتطبيقات الذكاء الاصطناعي المتقدمة.
معالجة الرسومات
مع الإصدار الثاني من مادة TPU في عام 2018، وسعت Google نطاق التركيز من الاستدلال إلى التدريب وجعلتها متاحة لعملائها السحابيين لتشغيل أعباء العمل، إلى جانب الرقائق الرائدة في السوق مثل وحدات معالجة الرسومات من Nvidia.
“إذا كنت تستخدم وحدات معالجة الرسومات، فهي أكثر قابلية للبرمجة وأكثر مرونة. وقالت ستايسي راسجون، كبيرة المحللين الذين يغطون أشباه الموصلات في شركة بيرنشتاين للأبحاث: “لكن المعروض منها كان محدودا”.
طفرة الذكاء الاصطناعي
لقد أدت طفرة الذكاء الاصطناعي إلى ارتفاع أسهم شركة Nvidia إلى أعلى المستويات، مما دفع شركة صناعة الرقائق إلى القيمة السوقية البالغة 3 تريليون دولار في يونيو، متجاوزة Alphabet والتنافس مع Apple وMicrosoft للحصول على مكانة الشركة العامة الأكثر قيمة في العالم.
“لكي أكون صريحًا، فإن مسرعات الذكاء الاصطناعي المتخصصة هذه ليست بنفس المرونة أو القوة التي تتمتع بها منصة Nvidia، وهذا ما ينتظر السوق أيضًا رؤيته: هل يمكن لأي شخص اللعب في هذا المجال؟” قال نيومان.
الآن بعد أن علمنا أن شركة Apple تستخدم وحدات TPU من Google لتدريب نماذج الذكاء الاصطناعي الخاصة بها، سيأتي الاختبار الحقيقي مع طرح ميزات الذكاء الاصطناعي الكاملة هذه على أجهزة iPhone وMac في العام المقبل.
من برودكوم وTSMC
ليس بالأمر الهين تطوير بدائل لمحركات الذكاء الاصطناعي من Nvidia. من المقرر أن يتم طرح الجيل السادس من مادة TPU من Google، والذي يسمى Trillium، في وقت لاحق من هذا العام.
“إنها باهظة الثمن. قال راسغون: “أنت بحاجة إلى الكثير من الحجم”. “ولذلك فهو ليس شيئًا يمكن للجميع القيام به. لكن هؤلاء المتفوقين، لديهم الحجم والمال والموارد اللازمة للسير في هذا الطريق.
“رقائق الذكاء الاصطناعي – إنها معقدة للغاية. هناك الكثير من الأشياء هناك. وقال راسغون: “لذا فإن جوجل تقدم الحوسبة”. “تقوم شركة Broadcom بكل الأشياء الطرفية. إنهم يقومون بعمليات الإدخال/الإخراج وSerDes، وجميع الأجزاء المختلفة التي تدور حول هذا الحساب. كما يقومون بالتغليف.”
التصميم النهائي للتصنيع
ثم يتم إرسال التصميم النهائي للتصنيع في مصنع تصنيع، أو مصنع تصنيع أشباه الموصلات – في المقام الأول تلك المملوكة لشركة تايوان لتصنيع أشباه الموصلات، وهي أكبر شركة لتصنيع الرقائق في العالم، والتي تصنع 92% من أشباه الموصلات الأكثر تقدمًا في العالم.
المجال الجيوسياسي
وعندما سُئل عما إذا كان لدى Google أي ضمانات في حالة حدوث الأسوأ في المجال الجيوسياسي بين الصين وتايوان، قال فاهدات: “إنه بالتأكيد شيء نستعد له ونفكر فيه أيضًا، لكننا نأمل أنه في الواقع ليس شيئًا التي سيتعين علينا تفعيلها.”
إن الحماية من هذه المخاطر هي السبب الرئيسي وراء قيام البيت الأبيض بتوزيع 52 مليار دولار من تمويل قانون تشيبس للشركات التي تقوم ببناء المصانع في الولايات المتحدة – مع ذهاب الجزء الأكبر إلى Intel وTSMC وSamsung حتى الآن.
المعالجات والطاقة
وبغض النظر عن المخاطر، فقد قامت Google للتو بخطوة كبيرة أخرى في مجال الرقائق، حيث أعلنت أن أول وحدة معالجة مركزية للأغراض العامة، Axion، ستكون متاحة بحلول نهاية العام.
وقال فاهدات: “الآن أصبحنا قادرين على جلب القطعة الأخيرة من اللغز، وهي وحدة المعالجة المركزية”. “وبالتالي فإن الكثير من خدماتنا الداخلية، سواء كانت BigQuery، أو Spanner، أو إعلانات YouTube، وغيرها، يتم تشغيلها على Axion.”
لقد تأخرت Google في لعبة وحدة المعالجة المركزية. أطلقت أمازون معالجها Graviton في عام 2018.
علي بابا
أطلقت علي بابا شريحة الخادم الخاصة بها في عام 2021. وأعلنت مايكروسوفت عن وحدة المعالجة المركزية الخاصة بها في نوفمبر.
وحدة المعالجة المركزية
وعندما سُئل عن سبب عدم قيام Google بتصنيع وحدة المعالجة المركزية في وقت مبكر، قال فاهدات: “كان تركيزنا منصبًا على المكان الذي يمكننا فيه تقديم أكبر قيمة لعملائنا، وهناك بدأنا بـ TPU، ووحدات ترميز الفيديو لدينا، وشبكاتنا. لقد اعتقدنا حقًا أن الوقت قد حان الآن.
انتل
كل هذه المعالجات التي تنتجها شركات غير صانعة للرقائق، بما في ذلك معالجات Google، أصبحت ممكنة بفضل شركة Arm
بنية الرقاقة – بديل أكثر قابلية للتخصيص وكفاءة في استهلاك الطاقة ويكتسب قوة جذب مقارنة بالطراز x86 التقليدي من Intel و أيه إم دي.
كفاءة الطاقة
تعد كفاءة الطاقة أمرًا بالغ الأهمية، لأنه بحلول عام 2027، من المتوقع أن تستهلك خوادم الذكاء الاصطناعي قدرًا كبيرًا من الطاقة كل عام مثل دولة مثل الأرجنتين. أظهر أحدث تقرير بيئي لشركة Google أن الانبعاثات ارتفعت بنسبة 50٪ تقريبًا من عام 2019 إلى عام 2023 ويرجع ذلك جزئيًا إلى نمو مراكز البيانات لتشغيل الذكاء الاصطناعي.
وقال فاهدات: “لولا كفاءة هذه الرقائق، لكان من الممكن أن تنتهي الأرقام في مكان مختلف تمامًا”. “نحن لا نزال ملتزمين بدفع هذه الأرقام من حيث انبعاثات الكربون من بنيتنا التحتية، على مدار الساعة طوال أيام الأسبوع، ودفعها نحو الصفر.”
تبريد الخوادم
يتطلب الأمر كمية هائلة من المياه لتبريد الخوادم التي تقوم بتدريب وتشغيل الذكاء الاصطناعي. ولهذا السبب بدأ الجيل الثالث من مادة TPU من Google في استخدام التبريد المباشر للرقاقة، والذي يستخدم كمية أقل بكثير من المياه. هذه أيضًا هي الطريقة التي تقوم بها Nvidia بتبريد أحدث وحدات معالجة الرسومات الخاصة بها من Blackwell.
الطاقة والمياه
على الرغم من التحديات، بدءًا من الجغرافيا السياسية إلى الطاقة والمياه، فإن شركة جوجل ملتزمة بأدوات الذكاء الاصطناعي التوليدية الخاصة بها وبتصنيع رقائقها الخاصة.
وقال فاهدات: “لم أر شيئاً كهذا من قبل ولا توجد علامة على تباطؤه حتى الآن”. “وسوف تلعب الأجهزة دورًا مهمًا حقًا هناك.”