
AI Platform & Inference Suite Engineer (Staff/Senior Staff level) - Riyadh, KSA📣 إعلان
| نوع العقد | دوام كامل | |
| طبيعة الوظيفة | بالموقع | |
| الموقع | الرياض |
عن الدور
تبحث شركة كوالكوم لتقنية المعلومات في الشرق الأوسط ذ.م.م عن مهندس منصة ذكاء اصطناعي ومجموعة استدلال (AI Platform & Inference Suite Engineer) على مستوى موظف كبير/أقدم للانضمام إلى فريقنا في الرياض، المملكة العربية السعودية. في كوالكوم، نمكّن عالماً يمكن فيه لكل شخص وكل شيء أن يكون متصلاً بذكاء. هذا الدور هو منصب تقني للغاية يواجه العملاء ويركز على دعم تمكين أعباء عمل التعلم العميق على نطاق الرفوف على مسرعات استدلال الذكاء الاصطناعي المتقدمة من كوالكوم. تستفيد هذه المسرعات من خبرة كوالكوم في الذكاء الاصطناعي المسرّع بالأجهزة لتقديم حلول استدلال الذكاء الاصطناعي التوليدي والرؤية الحاسوبية عالية الأداء وذات الكفاءة في استهلاك الطاقة لمراكز البيانات الحديثة.
المسؤوليات الأساسية
سيكون المهندس عنصراً أساسياً في نقل وتحسين والتحقق من صحة نماذج الذكاء الاصطناعي للتعلم العميق على أنظمة الإنتاج. يشمل ذلك تمكين شركاء كوالكوم من تطوير ونشر تطبيقات التعلم الآلي المتقدمة، مثل نماذج الرؤية الحاسوبية، والكلام، والذكاء الاصطناعي التوليدي، والاستدلال متعدد الوسائط، باستخدام أطر عمل شائعة مثل PyTorch و TensorFlow و ONNX على مسرعات الذكاء الاصطناعي السحابية من كوالكوم. تشمل المسؤوليات الرئيسية نشر وتحسين وتوسيع نطاق نماذج الذكاء الاصطناعي للتعلم العميق على منصات مراكز البيانات المعتمدة على المسرعات، بما في ذلك سير عمل تحويل النماذج، وتقنيات التكميم (INT8 / الدقة المختلطة)، والتكامل والتحسين في وقت التشغيل. يتطلب الدور أيضاً دمج نماذج التعلم الآلي في حزمة الذكاء الاصطناعي السحابية من كوالكوم ودفع التحسينات في إنتاجية النموذج وزمن الاستجابة والدقة مع تحليل واضح للمفاضلات.
- بناء واختبار ونشر خطوط أنابيب استدلال قابلة للتطوير باستخدام أطر عمل تقديم مثل vLLM و TGI و Triton.
- تحسين أعباء العمل لنماذج LLM و GenAI عبر معماريات متعددة الشرائح (multi-SoC) ومتعددة البطاقات (multi-card).
- التعاون مع فرق الهندسة لتحليل وتحسين التدريب والاستدلال لتطبيقات التعلم العميق المتقدمة، وتحديد الاختناقات عبر الحوسبة والذاكرة ووقت التشغيل، وتوجيه استراتيجيات التحسين.
- المساهمة في مستودع GitHub الخاص بالذكاء الاصطناعي السحابي من كوالكوم ووثائق المطورين، ومشاركة أفضل الممارسات والحلول التقنية.
- تطوير ودمج خطوط أنابيب تطبيقات التعلم الآلي الشاملة مع أطر عمل ومكتبات العملاء.
- العمل كمستشار تقني موثوق به للعملاء الذين ينشرون أعباء عمل الذكاء الاصطناعي، والمشاركة في مناقشات تحديد حجم الأجهزة والهندسة المعمارية، وتقديم التوجيه الفني حول اختيار نماذج الذكاء الاصطناعي، وجدوى النشر، والهندسة المعمارية للنظام، وتوقعات الأداء.
- قيادة المناقشات حول قدرات النماذج وقيودها بناءً على حالات استخدام العملاء الفعلية، وتقييم متطلبات نماذج الذكاء الاصطناعي، والتوصية بنهج نماذج بديلة عند الضرورة.
- مواءمة خصائص النموذج مع قدرات المسرّع والنظام، ودعم العملاء في تحديد استراتيجيات اختيار النموذج بناءً على واقع النشر.
- تقييم خصائص أداء نماذج الذكاء الاصطناعي في سيناريوهات الإنتاج وتوجيه قرارات الهندسة المعمارية حول استراتيجيات التوسع وتحديد حجم نشر الأجهزة.
- المساهمة في المناقشات حول حدود قابلية توسع أعباء العمل وتقديم رؤى حول تخطيط السعة وتحسين البنية التحتية.
- قيادة المناقشات حول خطوط أنابيب الذكاء الاصطناعي الشاملة، بما في ذلك سير العمل متعدد النماذج ومراحل المعالجة المسبقة واللاحقة للبيانات، وتوجيه القرارات بشأن مكدسات معالجة الفيديو والبيانات.
- تسليط الضوء وشرح المفاضلات بين الدقة مقابل التوافق، وجودة النموذج مقابل جدوى النشر، وتبسيط النموذج مقابل مكاسب الأداء، والدقة مقابل الكفاءة.
- قيادة أو دعم التحقق من قدرة النموذج في بيئات النشر والتعاون مع العملاء لتحديد افتراضات الاستدلال واستراتيجيات تحديد حجم النموذج لأعباء العمل واسعة النطاق.
المؤهلات المطلوبة
يجب أن يمتلك المرشحون درجة البكالوريوس في علوم الكمبيوتر أو هندسة الكمبيوتر أو الهندسة الكهربائية أو مجال ذي صلة، أو خبرة معادلة. يتطلب الدور خبرة تتراوح بين 10-15+ سنة في تطوير أو نشر نماذج التعلم العميق على وحدات المعالجة المركزية/وحدات معالجة الرسومات/الدوائر المتكاملة المخصصة (CPUs/GPUs/ASICs)، وأنظمة الاستدلال وتحسينها، ومنصات الذكاء الاصطناعي في مراكز البيانات أو الحافة. خبرة قوية في تقنيات تكميم النماذج وتحسينها، وأطر عمل نماذج الذكاء الاصطناعي (مثل PyTorch و TensorFlow)، وخطوط أنابيب نشر النماذج أمر ضروري. مهارات برمجة وتصميم برامج ممتازة في C/C++/Python، بما في ذلك تصحيح الأخطاء وتحليل الأداء، مطلوبة.
- خبرة عملية مع الأنظمة المستندة إلى Linux، والبرامج منخفضة المستوى، وبرامج التشغيل، وتشغيل النظام.
- القدرة المثبتة على تحليل وتحسين أداء النموذج في بيئات الإنتاج.
- فهم قوي لقيود أجهزة استدلال الذكاء الاصطناعي واختناقات أداء النظام على مستوى النظام.
- مهارات اتصال قوية وخبرة في الأدوار التقنية التي تواجه العملاء.
- الاستعداد للسفر للمشاركة في فعاليات العملاء والمراجعات الاستراتيجية.
- مهارة في نشر النماذج على المنصات التي تستخدم مسرعات الأجهزة للاستدلال.
- خبرة في إدارة سير العمل متعدد النماذج وبناء أنظمة ذكاء اصطناعي في الوقت الفعلي، بما في ذلك مشاريع الرؤية الحاسوبية والفيديو والتحليلات.
- معرفة بطرق الاستدلال الموزعة والتعامل مع عمليات نشر النماذج واسعة النطاق.
- إتقان تطوير وصيانة سير عمل معالجة الفيديو واستخدام أطر عمل البرامج ذات الصلة.
- فهم عميق لكيفية تأثير قرارات النظام على الأداء في بيئات النشر الفعلية.
- القدرة على تبسيط الأفكار التقنية المعقدة إلى نصائح واضحة ومفيدة للعملاء.
- خبرة عملية في تشغيل نماذج التعلم العميق على أطر عمل التعلم الآلي الشائعة مثل PyTorch و TensorFlow و ONNX.
- خبرة في تطوير حلول برمجية تعمل في بيئات Linux مع الحاويات والتنسيق.
- خبرة مع أدوات إدارة الكود المصدري والتكوين، مع معرفة Git مطلوبة.
- خبرة في التعامل مع العملاء لترجمة متطلباتهم إلى حلول تقنية (الاكتشاف، تحديد النطاق، معايير النجاح، وخطط التنفيذ).
- القدرة المثبتة على بناء وتقديم عروض توضيحية تقنية، وإثباتات للمفاهيم، وتطبيقات مرجعية لأعباء عمل التعلم الآلي/الذكاء الاصطناعي التوليدي.
- مهارات كتابة تقنية قوية لإنتاج وثائق جاهزة للعملاء وتقديم دورات تدريبية للشركاء.
- خبرة في قيادة فرز المشكلات والتصعيدات التقنية مع العملاء، والتنسيق عبر فرق المنتجات والأجهزة والبرامج لحلها.
- مهارات ممتازة في إدارة أصحاب المصلحة والتواصل، مع القدرة على تقديم المفاهيم التقنية المعقدة بوضوح لكل من الجماهير الهندسية وغير الهندسية.
- درجة البكالوريوس في الهندسة أو نظم المعلومات أو علوم الكمبيوتر أو مجال ذي صلة و 6+ سنوات من الخبرة في هندسة البرمجيات أو العمل ذي الصلة، أو درجة الماجستير في الهندسة أو نظم المعلومات أو علوم الكمبيوتر أو مجال ذي صلة و 5+ سنوات من الخبرة في هندسة البرمجيات أو العمل ذي الصلة، أو درجة الدكتوراه في الهندسة أو نظم المعلومات أو علوم الكمبيوتر أو مجال ذي صلة و 4+ سنوات من الخبرة في هندسة البرمجيات أو العمل ذي الصلة.
- 3+ سنوات من الخبرة العملية مع لغات البرمجة مثل C و C++ و Java و Python وما إلى ذلك.
المهارات والخبرات التقنية
يُتوقع إتقان نقل نماذج الذكاء الاصطناعي وتحسينها، وسير عمل تحويل النماذج، وتقنيات التكميم (INT8 / الدقة المختلطة). خبرة في التكامل والتحسين في وقت التشغيل، ونماذج التعلم الآلي، وأطر العمل الشائعة مثل PyTorch و TensorFlow و ONNX مطلوبة. خبرة مع خطوط أنابيب الاستدلال، بما في ذلك vLLM و TGI و Triton، ضرورية لبناء ونشر حلول قابلة للتطوير. فهم قوي لنماذج LLM و GenAI، وتطبيقات التعلم العميق، وقيود أجهزة استدلال الذكاء الاصطناعي، بالإضافة إلى اختناقات أداء النظام، أمر بالغ الأهمية.
- التفاعل التقني مع العملاء، واختيار نماذج الذكاء الاصطناعي، وجدوى النشر، والهندسة المعمارية للنظام، وتوقعات الأداء.
- مواءمة النموذج مع البنية التحتية، وفهم قيود الذاكرة، وهندسة المسرّعات، وحدود التوسع.
- هندسة الأداء وقابلية التوسع، بما في ذلك استراتيجيات التوسع (أفقي مقابل رأسي) وتحديد حجم نشر الأجهزة.
- حدود قابلية توسع أعباء العمل وتصميم خط أنابيب الذكاء الاصطناعي الشامل، بما في ذلك سير العمل متعدد النماذج، والمعالجة المسبقة للبيانات، ومراحل المعالجة اللاحقة.
- خيارات خط أنابيب الفيديو (مثل FFMPEG مقابل GStreamer) والتكامل في خطوط أنابيب الاستدلال، مما يضمن التوافق مع متطلبات الأداء وقيود الوقت الفعلي.
- تحليل المفاضلات للنماذج والتحقق منها، بما في ذلك تبسيط النموذج والمفاضلات بين الدقة والكفاءة.
- تطوير نماذج التعلم العميق، وأنظمة الاستدلال، ومنصات الذكاء الاصطناعي في مراكز البيانات أو الحافة.
- تقنيات تكميم النماذج وتحسينها، وخطوط أنابيب نشر النماذج.
- إتقان لغتي C++ و Python، وتصميم البرامج، وتصحيح الأخطاء، وتحليل الأداء.
- خبرة عملية مع الأنظمة المستندة إلى Linux، والبرامج منخفضة المستوى، وبرامج التشغيل، وتشغيل النظام.
- فهم أجهزة استدلال الذكاء الاصطناعي واختناقات أداء النظام على مستوى النظام.
- خبرة مع مسرعات الأجهزة للاستدلال، وأنظمة الذكاء الاصطناعي في الوقت الفعلي، والرؤية الحاسوبية، ومشاريع تحليل الفيديو.
- معرفة بطرق الاستدلال الموزعة وعمليات نشر النماذج واسعة النطاق.
- إتقان سير عمل معالجة الفيديو وأطر عمل البرامج ذات الصلة.
- خبرة مع بيئات Linux، والحاويات، والتنسيق، وأدوات إدارة الكود المصدري مثل Git.
- ترجمة متطلبات العملاء إلى حلول تقنية، بما في ذلك الاكتشاف، وتحديد النطاق، ومعايير النجاح، وخطط التنفيذ.
- القدرة على بناء وتقديم عروض توضيحية تقنية، وإثباتات للمفاهيم، وتطبيقات مرجعية.
- مهارات الكتابة التقنية للوثائق والتدريب على الشركاء.
- خبرة في فرز المشكلات والتصعيدات التقنية وإدارة أصحاب المصلحة.
بيئة العمل والموقع
هذا منصب بدوام كامل مقره في الرياض، المملكة العربية السعودية. يتضمن الدور تفاعلات مع العملاء وقد يتطلب السفر للمشاركة في فعاليات العملاء والمراجعات الاستراتيجية. كوالكوم هي صاحب عمل يلتزم بتكافؤ الفرص وتهدف إلى توفير عملية يسهل الوصول إليها للأفراد ذوي الإعاقة. يُتوقع من الموظفين الالتزام بجميع السياسات والإجراءات المعمول بها، بما في ذلك متطلبات الأمان والمعلومات السرية.
متطلبات الوظيفة
- تتطلب اكثر من ١٠ سنوات خبرة
وظائف مشابهة
قد يعجبك أيضاً
- وظائف ذات صلة بـ AI Platform & Inference Suite Engineer (Staff/Senior Staff level) - Riyadh, KSA
- وظائف محضر قهوة (باريستا) في جدة
- وظائف موظف استقبال في جدة
- وظائف مدخل بيانات في جدة
- وظائف مدير فرع في جدة
- وظائف مضيف (هوست) في جدة
- مجالات وظيفية أخرى في الرياض
- وظائف محضر قهوة (باريستا) في الرياض
- وظائف موظف استقبال في الرياض
- وظائف مدخل بيانات في الرياض
- وظائف مدير فرع في الرياض
- وظائف مضيف (هوست) في الرياض
- وظائف Food & Beverage Crew Member في الرياض
- وظائف محاسب عام في الرياض
- وظائف مشرف محل في الرياض
- وظائف بائع مستحضرات وأدوات تجميل ومكياج في الرياض
- وظائف مساعد إداري في الرياض
- استكشف الوظائف في أنحاء المملكة
- وظائف رئيس طهاه (هيد شيف) في جدة
- وظائف فني تبريد وتكييف في الدمام
- وظائف محاسب زبائن (كاشير) في الخبر
- وظائف مدير تسويق في مكة المكرمة
- وظائف أمين مخزن في جدة
- وظائف كابتن مقدم طعام في جدة
- وظائف مصور فوتوغرافي في الجبيل
- وظائف Sales Engineer في الرياض
- وظائف بائع في خميس مشيط
- وظائف أخصائي جودة في مكة المكرمة