مایکروسافت به تازگی از مدل هوش مصنوعی Phi-3-vision رونمایی کرده که میتواند با نگاه به تصاویر درباره آنها اطلاعاتی به شما ارائه کند. این مدل 4.2 میلیارد پارامتری اکنون در اختیار توسعهدهندگان قرار گرفته و در آینده برای عموم کاربران منتشر خواهد شد. جزئیات بیشتر درباره مدل Phi-3-vision را در ادامه این نوشتار از شهر سخت افزار بخوانید.
بر اساس گزارش mspoweruser مایکروسافت نسخه دیگری از مدل زبانی کوچک Phi-3 خود را معرفی کرده که Phi-3-vision نام دارد. این مدل جدید هوش مصنوعی میتواند به تصاویر نگاه کند و درباره آن اطلاعاتی به شما بدهد.
تفسیر نمودارها و تصاویر خود را به Phi-3-vision بسپارید!
Phi-3-vision را میتوان یک مدل چندوجهی دانست که هم متن و هم تصاویر را درک کرده و به کاربران گوشیهای هوشمند کمک شایانی کند. مایکروسافت میگوید مدل Phi-3-vision بهصورت پیشنمایش برای توسعهدهندگان عرضه شده است. این مدل 4.2 میلیارد پارامتری میتواند وظایف استدلال بصری کلی مانند پرسیدن سؤال در مورد نمودارها یا تصاویر را انجام دهد.
البته Phi-3-vision به مراتب بسیار کوچکتر از سایر مدلهای هوش مصنوعی تصویرمحور مانند DALL-E یا Stable Diffusion است. البته باید گفت که مدل هوش مصنوعی Phi-3-vision توانایی تولید تصویر نداشته اما میتواند محتوای یک تصویر را درک کند و تجزیه و تحلیل آن را در اختیار کاربران قرار دهد.
پیش از این مایکروسافت در ماه آوریل مدل هوش مصنوعی Phi-3-mini را معرفی کرد. کوچکترین مدل خانواده Phi-3 با 3.8 میلیارد پارامتر در اختیار کاربران قرار گرفته است. همچنین خانواده هوش مصنوعی Phi-3 شامل دو مدل دیگر Phi-3-small با 7 میلیارد پارامتر و Phi-3-medium با 14 میلیارد پارامتر است.
مایکروسافت میگوید که Phi-3 بهتر از نسخه قبلی عمل میکند و میتواند پاسخهایی نزدیک به مدلی ۱۰ برابر بزرگتر را ارائه دهد. مدلهای هوش مصنوعی کوچک ارزانتر بوده و در دستگاههای کوچک مانند گوشی و لپتاپ عملکرد بهتری از خود نشان میدهند. مدل Phi-3-vision اکنون بهصورت پیش نمایش در دسترس برخی کاربران بوده و هنوز زمان عرضه عمومی آن مشخص نشده است.