@RIOTU_LAB
حول المشروع
يُعد مشروع ArabianLLM في مختبر الروبوتات وإنترنت الأشياء في جامعة الأمير سلطان جهداً مبتكراً في نمذجة اللغة العربية. يهدف إلى تطوير نماذج لغوية كبيرة متخصصة للغة العربية، مواجهاً التحديات الصرفية والنحوية والنصية الخاصة بها.
مُصممة بدقة لتعزيز الكفاءة والدقة في نمذجة اللغة العربية.
مُركز على حلول مبتكرة لتوليد النصوص ونمذجة اللغة العربية.
فريقنا يجلب منظوراً جديداً ونهجاً مكرساً لمجال اللغويات الحاسوبية والذكاء الاصطناعي، محققاً تقدماً كبيراً في مجال معالجة اللغة العربية ونمذجتها.
استكشف مشاريعنا الحديثة في معالجة اللغة العربية، حيث نُعرض النماذج المتخصصة وأدوات تقسيم النصوص المصممة للتحليل اللغوي العميق.
ArabianGPT 0.1B، جزء من سلسلة ArabianLLM، يحتوي على 134 مليون معلمة، 12 طبقة، ونافذة سياق مكونة من 768 رمز، تم تدريبه على مجموعة أبو الخير لمعالجة محتوى الأخبار.
ArabianGPT 0.3B يتضمن 345 مليون معلمة، 24 طبقة، 16 MALs، ونافذة سياق مكونة من 1024 رمز، قادر على التقاط التفاصيل العربية المعقدة عبر مجموعة متنوعة من المجالات.
أرانايزر، بتقنية SentencePiece و BPE، يعزز معالجة اللغة العربية بمتغيرات تصل إلى 86 ألف كلمة، مما يحسن بشكل كبير الدقة ونتائج F1 في تحليل النصوص.
تعرف على الخبراء المخلصين وراء عملنا الرائد في مجال معالجة اللغة الطبيعية والذكاء الاصطناعي في مختبر RIOTU بجامعة الأمير سلطان.
1
2
3
4
5
اكتشف آخر التطورات الرائدة في معالجة اللغة العربية من خلال منشوراتنا وتقاريرنا التقنية الأخيرة من فريق مختبر RIOTU.
Aranizer Tokenizer
Aranizer: Leveraging SentencePiece and Byte Pair Encoding for Arabic Text Tokenization
ArabianGPT
ArabianLLM: Native Arabic Large Language Modeling for Text Generation
© Robotics and Internet-of-Things Lab.