۱۸ شهریور ۱۴۰۳

رونمایی از الگوهای زبانی فارسی همراه اول با حضور وزیر ارتباطات

۱۰ تیر ۱۴۰۳

الگوهای زبانی فارسی توسعه یافته توسط همراه اول که با هوش مصنوعی قادر به تحلیل و یادگیری حجم بسیاری از داده‌های متنی هستند با حضور وزیر ارتباطات در الکامپ 1403 رونمایی شدند.

به گزارش پایگاه خبری بازار سهام نیوز، گروه MCINext همراه اول در نخستین روز برگزاری نمایشگاه بین المللی الکامپ ۱۴۰۳، تعدادی از الگوهای زبانی توسعه یافته شامل سیلک (با ۱٫۳میلیارد پارامتر)، آهوران (با ۸ میلیارد پارامتر) و آوا (با ۱۳ میلیارد پارامتر) را با حضور عیسی زارع پور وزیر ارتباطات در سالن اختصاصی همراه اول (سالن ۳۵)، رونمایی کرد.

الگوهای زبانی بزرگ (LLM)، سیستم های هوش مصنوعی هستند که با تحلیل و یادگیری از حجم زیادی از داده های متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر نیز با حمایت مرکز تحقیق و توسعه همراه اول توسعه یافته اند.

الگوی زبانی سیلک که از پایه با مجموعه دادگان فارسی در این شرکت آموزش داده شده با وجود تعداد متغیر نسبتا کم، قابلیت زبانی مناسبی را به نمایش می گذارد که با ادامه فرآیند آموزش در آینده از لحاظ دانش نیز بهتر خواهد شد.

الگوی آهوران بر پایه مدل چند زبانه Llama3 شرکت Meta و به صورت آموزش ادامه دار بر روی مجموعه دادگان فارسی توسعه داده شده است. با توجه به قابلیت های بسیار مدل پایه، ادامه آموزش باعث تقویت تولید متن به زبان فارسی شده در حالی که قابلیت های دیگر الگو تا حد بسیاری حفظ شده است.

کاربردهای تجاری این الگوها بسیار گسترده و نظیر تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت بات ها، تحلیل احساسات و نظرات کاربران در شبکه های اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان است. این الگوها می توانند به شرکت ها در افزایش بهره وری، کاهش هزینه ها و بهبود تجربه مشتری کمک کنند.

الگوی آوا به منظور پاسخگویی از داخل یک متن و بر پایه مدل aya از شرکت cohere توسعه داده شده است. بر خلاف دو الگوی قبلی که جوابگوی سوالات کلی هستند این الگو نیازمند ارایه اطلاعات اولیه برای پاسخگویی است و تا حد امکان از ارائه اطلاعات استفاده شده در حین آموزش پرهیز می کند. استفاده اصلی این الگو در ربات های پاسخگوی خاص منظوره است.

علاوه بر آموزش این الگوها، تلاش شده تا به کمک روش های همترازسازی (RLHF و DPO) از تولید محتوای آسیب زا جلوگیری شود.

گروه MCINext همراه اول تلاش دارد تا در آینده نزدیک امکان استفاده عمومی از این الگوها را نیز فراهم کند.

برچسب‌ها

گزارش و یادداشت
گفتگو
روی خط
چند رسانه ای
0
افکار شما را دوست داریم، لطفا نظر دهید.x