[ad_1]
Deepgram، ارائهدهنده تشخیص گفتار، پردازش زبان طبیعی، و راهحلهای هوش مصنوعی مولد، امروز Aura را منتشر کرد، یک رابط برنامهنویسی متن به گفتار (TTS) که مکالمات شبیه انسان را ارائه میدهد.
Aura برای توسعهدهندگانی است که میخواهند عوامل هوش مصنوعی صوتی مکالمهای در زمان واقعی بسازند که میتوانند با مشتریان، کارمندان و سایر کاربران به روشی طبیعی تعامل داشته باشند. هاله میتواند گفتار را از هر ورودی متنی، از جمله پاسخهای مدلهای زبان بزرگ مانند ChatGPT، در کسری از ثانیه تولید کند. Aura مجموعه ای از صداهای متنوع را ارائه می دهد که به شدت برای موارد استفاده مکالمه و ترجیحات مناسب هستند.
Aura کاملاً مکمل API گفتار به متن Nova-2 Deepgram است. با این نسخه، دیپگرام یک پلتفرم کامل هوش مصنوعی صوتی را ارائه میکند که به توسعهدهندگان بلوکهایی برای رونویسی به تجزیه و تحلیل احساسات و سنتز صدا میدهد.
“ما از راه اندازی Aura، API متن به گفتار خود، پس از مشاهده تقاضای بسیار زیاد برای محصول دسترسی زودهنگام خود در پاییز، هیجان زده هستیم. Aura نتیجه سال ها تحقیق و توسعه توسط تیم ما در سطح جهانی است. اسکات استفنسون، مدیرعامل و یکی از بنیانگذاران دیپگرام، گفت: دانشمندان و مهندسان هوش مصنوعی، که از آخرین پیشرفت ها در یادگیری عمیق و فناوری GPU برای ایجاد یک راه حل پیشرفته TTS استفاده کرده اند که بهتر از هر چیز دیگری در بازار است. در یک بیانیه. با Aura، ما به توسعهدهندگان قدرت میدهیم تا برنامههای هوش مصنوعی صوتی ایجاد کنند که میتواند واقعاً گفتار انسان را درک کند و به آن پاسخ دهد، و فرصتهای جدیدی را برای افزایش تجربه مشتری، بهرهوری و نوآوری باز میکند.»
[ad_2]
Source link