Phi-3-vision معرفی شد؛ مدل هوش مصنوعی مایکروسافت که تصاویر و نمودارها را برایتان تفسیر می‌کند

مایکروسافت به تازگی از مدل هوش مصنوعی Phi-3-vision رونمایی کرده که می‌تواند با نگاه به تصاویر درباره آنها اطلاعاتی به شما ارائه کند. این مدل 4.2 میلیارد پارامتری اکنون در اختیار توسعه‌دهندگان قرار گرفته و در آینده برای عموم کاربران منتشر خواهد شد. جزئیات بیشتر درباره مدل Phi-3-vision را در ادامه این نوشتار از شهر سخت افزار بخوانید.

بر اساس گزارش mspoweruser مایکروسافت نسخه دیگری از مدل زبانی کوچک Phi-3 خود را معرفی کرده که Phi-3-vision نام دارد. این مدل جدید هوش مصنوعی می‌تواند به تصاویر نگاه کند و درباره آن اطلاعاتی به شما بدهد.

تفسیر نمودارها و تصاویر خود را به Phi-3-vision بسپارید!

Phi-3-vision را می‌توان یک مدل چندوجهی دانست که هم متن و هم تصاویر را درک کرده و به کاربران گوشی‌های هوشمند کمک شایانی کند. مایکروسافت می‌گوید مدل Phi-3-vision به‌صورت پیش‌نمایش برای توسعه‌دهندگان عرضه شده است. این مدل 4.2 میلیارد پارامتری می‌تواند وظایف استدلال بصری کلی مانند پرسیدن سؤال در مورد نمودارها یا تصاویر را انجام دهد.

البته Phi-3-vision به مراتب بسیار کوچک‌تر از سایر مدل‌های هوش مصنوعی تصویرمحور مانند DALL-E یا Stable Diffusion است. البته باید گفت که مدل هوش مصنوعی Phi-3-vision توانایی تولید تصویر نداشته اما می‌تواند محتوای یک تصویر را درک کند و تجزیه و تحلیل آن را در اختیار کاربران قرار دهد.

پیش از این مایکروسافت در ماه آوریل مدل هوش مصنوعی Phi-3-mini را معرفی کرد. کوچکترین مدل خانواده Phi-3 با 3.8 میلیارد پارامتر در اختیار کاربران قرار گرفته است. همچنین خانواده هوش مصنوعی Phi-3 شامل دو مدل دیگر Phi-3-small با 7 میلیارد پارامتر و Phi-3-medium با 14 میلیارد پارامتر است.

مایکروسافت می‌گوید که Phi-3 بهتر از نسخه‌ قبلی عمل می‌کند و می‌تواند پاسخ‌هایی نزدیک به مدلی ۱۰ برابر بزرگ‌تر را ارائه دهد. مدل‌های هوش مصنوعی کوچک ارزان‌تر بوده و در دستگاه‌های کوچک مانند گوشی و لپ‌تاپ‌ عملکرد بهتری از خود نشان می‌دهند. مدل Phi-3-vision اکنون به‌صورت پیش نمایش در دسترس برخی کاربران بوده و هنوز زمان عرضه عمومی آن مشخص نشده است. 


چاپ