بهبود استدلال، ویژگی‌های صوتی و پشتیبانی چندزبانه در هوش مصنوعی «گوگل»

مدل «جمینای ۲.۵ پرو» تنظیمات جدیدی را برای بهبود استدلال، ویژگی‌های صوتی و پشتیبانی چندزبانه دریافت کرد.

گوگل در کنفرانس «Google I/O 2025» از به‌روزرسانی‌های جدیدی برای مجموعه مدل‌های «جمینای ۲.۵»(Gemini 2.5) خود رونمایی کرد که شامل استدلال قوی‌تر، خروجی صدای بومی، ارتقاء امنیت و قابلیت‌های بهبودیافته برای توسعه‌دهندگان است. گوگل در اعلام به‌روزرسانی‌های جدید گفت: ما در ماه مارس «جمینای ۲.۵ پرو»(Gemini 2.5 Pro) را معرفی کردیم که هوشمندترین مدل ما تا به امروز است و امروز، قابلیت‌های جدیدی را به ۲.۵ پرو و «۲.۵ فلش»(2.5 Flash) اضافه می‌کنیم.

به نقل از تایمز آو ایندیا، مدل ارتقاءیافته جمینای ۲.۵ پرو اکنون در صدر نمودارهای عملکرد از جمله «WebDev Arena» برای کدنویسی و «LMArena» برای آزمایش ترجیحات انسانی قرار دارد. همچنین، این مدل دارای یک پنجره زمینه با یک میلیون توکن است که به آن امکان می‌دهد تا ورودی‌های طولانی‌تر و وظایف درک ویدئو را مدیریت کند.

گوگل اعلام کرد: به لطف «LearnLM» – نسخه‌ای از جمینای که با متخصصان آموزشی توسعه داده شده – این مدل اکنون در وظایف مرتبط با یادگیری نیز پیشرو است. مربیان و متخصصان، جمینای ۲.۵ پرو را در طیف متنوعی از سناریوها نسبت به سایر مدل‌ها ترجیح دادند.

صدای بومی، گفت‌وگوی احساسی و پشتیبانی چندزبانه

گوگل خروجی صدای بومی را نیز برای داشتن یک تجربه طبیعی‌تر با هوش مصنوعی معرفی کرد. جمینای اکنون می‌تواند با تُن‌ها، لهجه‌ها و سبک‌های گوناگون صحبت کند. برای مثال، هنگام تعریف کردن یک داستان می‌تواند صدای دراماتیک داشته باشد. موارد دیگر بهبود صوتی به شرح زیر هستند:

۱. احساسات کاربر را تشخیص می‌دهد و بر اساس آنها پاسخ می‌دهد (گفتگوی عاطفی).

۲. نویز پس‌زمینه را نادیده می‌گیرد (صدای فعال).

۳. وظایف صوتی پیچیده‌تر را انجام می‌دهد (تفکر در API زنده).

سیستم تبدیل متن به گفتار اکنون از چندین گوینده و بیش از ۲۴ زبان پشتیبانی می‌کند و می‌تواند هنگام گفت‌وگو بین زبان‌ها جابه‌جا شود. این ویژگی‌ها از طریق رابط برنامه‌نویسی جمینای در دسترس خواهند بود.

تفکر عمیق برای کارهای پیچیده

گوگل اعلام کرد که در حال آزمایش یک حالت استدلال پیشرفته به نام «تفکر عمیق» است که به جمینای کمک می‌کند تا پیش از پاسخ دادن، چندین پاسخ را در نظر بگیرد. این حالت برای چالش‌های دشواری مانند ریاضیات پیشرفته و برنامه‌نویسی طراحی شده است.

سخنگوی این شرکت گفت: ما در حال آغاز کردن آزمایش یک حالت استدلال بهبودیافته به نام «دیپ ثینک»(Deep Think) هستیم. ما زمان بیشتری را به ارزیابی‌های ایمنی پیشرفته‌تر و دریافت نظرات بیشتر از متخصصان ایمنی اختصاص می‌دهیم.

دیپ ثینک در حال حاضر در معیارهایی مانند «2025 USAMO» برای ریاضی، «LiveCodeBench» برای کدنویسی و «MMMU» برای استدلال چندوجهی پیشرو است.

افزایش سرعت و کارآیی جمینای ۲.۵ فلش

این شرکت اعلام کرد جمینای ۲.۵ فلش که نسخه سبک‌تر مدل است، اکنون از ۲۰ تا ۳۰ درصد توکن کمتر استفاده می‌کند و در عین حال، استدلال، کدنویسی و وظایف چندوجهی را بهبود می‌بخشد. این نسخه اکنون در اپلیکیشن جمینای و پلتفرم‌های «ای‌آی استودیو»(AI Studio) و «ورتکس ای‌آی»(Vertex AI) در دسترس است.

انتظار می‌رود نسخه عمومی مدل به‌روزرسانی‌شده در اوایل ژوئن عرضه شود و نسخه ۲.۵ پرو نیز اندکی پس از آن از راه برسد.

0 دیدگاه

افزایش شفافیت مالی با حذف ۳۵۰ میلیون حساب بانکی

به گفته یک کارشناس اقتصادی، واردات بیش‌ از ۱۰۰ تن طلا در…

اخبار

21 خرداد 1404

0 دیدگاه

آغاز مقدمات احداث نیروگاه‌های انرژی خورشیدی ۱۳۰۰ مگاواتی در ورامین

فرماندار ویژه شهرستان ورامین از فراهم شدن مقدمات احداث نیروگاه‌های خورشیدی با…

اخبار

21 خرداد 1404

0 دیدگاه

وابستگی ۹۰ درصدی روغن به واردات/ تولیدکننده انگیزه‌ای برای کشت دانه‌های روغنی ندارد

رئیس بخش تحقیقات دانه‌های روغنی سازمان تحقیقات با اشاره به اینکه حدود…

اخبار

21 خرداد 1404

:: برای جستجو تایپ کنید ::

آخرین گزارش‌ها

تبلیغات

بهبود استدلال، ویژگی‌های صوتی و پشتیبانی چندزبانه در هوش مصنوعی «گوگل»

افزایش شفافیت مالی با حذف ۳۵۰ میلیون حساب بانکی

آغاز مقدمات احداث نیروگاه‌های انرژی خورشیدی ۱۳۰۰ مگاواتی در ورامین

وابستگی ۹۰ درصدی روغن به واردات/ تولیدکننده انگیزه‌ای برای کشت دانه‌های روغنی ندارد

دیدگاهتان را بنویسید لغو پاسخ

دنبال چی می‌گردی؟

دسته‌ها

آخرین گزارش‌ها

موضوعات پرطرفدار

شبکه های اجتماعی ما

با ما همراه باشید

سرمایه‌گذاری در بورس برای مبتدیان

اعتماد به مودیان با حسابرسی سیستمی ۹۵ درصد اظهارنامه‌های مالیات عملکرد

یارانه سه دهک اول واریز شد

:: برای جستجو تایپ کنید ::

آخرین گزارش‌ها

تبلیغات

بهبود استدلال، ویژگی‌های صوتی و پشتیبانی چندزبانه در هوش مصنوعی «گوگل»

اشتراک گذاری

اشتراک گذاری

افزایش شفافیت مالی با حذف ۳۵۰ میلیون حساب بانکی

آغاز مقدمات احداث نیروگاه‌های انرژی خورشیدی ۱۳۰۰ مگاواتی در ورامین

وابستگی ۹۰ درصدی روغن به واردات/ تولیدکننده انگیزه‌ای برای کشت دانه‌های روغنی ندارد

دیدگاهتان را بنویسید لغو پاسخ

دنبال چی می‌گردی؟

دسته‌ها

آخرین گزارش‌ها

سرمایه‌گذاری در بورس برای مبتدیان

اعتماد به مودیان با حسابرسی سیستمی ۹۵ درصد اظهارنامه‌های مالیات عملکرد

یارانه سه دهک اول واریز شد