Uncategorized

دیپگرام Aura را راه‌اندازی می‌کند، یک API تبدیل متن به گفتار برای عوامل هوش مصنوعی صوتی مکالمه در زمان واقعی

[ad_1]

Deepgram، ارائه‌دهنده تشخیص گفتار، پردازش زبان طبیعی، و راه‌حل‌های هوش مصنوعی مولد، امروز Aura را منتشر کرد، یک رابط برنامه‌نویسی متن به گفتار (TTS) که مکالمات شبیه انسان را ارائه می‌دهد.

Aura برای توسعه‌دهندگانی است که می‌خواهند عوامل هوش مصنوعی صوتی مکالمه‌ای در زمان واقعی بسازند که می‌توانند با مشتریان، کارمندان و سایر کاربران به روشی طبیعی تعامل داشته باشند. هاله می‌تواند گفتار را از هر ورودی متنی، از جمله پاسخ‌های مدل‌های زبان بزرگ مانند ChatGPT، در کسری از ثانیه تولید کند. Aura مجموعه ای از صداهای متنوع را ارائه می دهد که به شدت برای موارد استفاده مکالمه و ترجیحات مناسب هستند.

Aura کاملاً مکمل API گفتار به متن Nova-2 Deepgram است. با این نسخه، دیپگرام یک پلتفرم کامل هوش مصنوعی صوتی را ارائه می‌کند که به توسعه‌دهندگان بلوک‌هایی برای رونویسی به تجزیه و تحلیل احساسات و سنتز صدا می‌دهد.

“ما از راه اندازی Aura، API متن به گفتار خود، پس از مشاهده تقاضای بسیار زیاد برای محصول دسترسی زودهنگام خود در پاییز، هیجان زده هستیم. Aura نتیجه سال ها تحقیق و توسعه توسط تیم ما در سطح جهانی است. اسکات استفنسون، مدیرعامل و یکی از بنیانگذاران دیپگرام، گفت: دانشمندان و مهندسان هوش مصنوعی، که از آخرین پیشرفت ها در یادگیری عمیق و فناوری GPU برای ایجاد یک راه حل پیشرفته TTS استفاده کرده اند که بهتر از هر چیز دیگری در بازار است. در یک بیانیه. با Aura، ما به توسعه‌دهندگان قدرت می‌دهیم تا برنامه‌های هوش مصنوعی صوتی ایجاد کنند که می‌تواند واقعاً گفتار انسان را درک کند و به آن پاسخ دهد، و فرصت‌های جدیدی را برای افزایش تجربه مشتری، بهره‌وری و نوآوری باز می‌کند.»

کاور SpeechTek

[ad_2]

Source link