Skip to main content
Danh mục sản phẩm
TIN TỨC – SỰ KIỆN

Mô hình AI mới của Google có thể nghe, nói và dịch ngôn ngữ

Biên tập Hiệp Võ
26/06/2023
9000

Google đã công bố một nghiên cứu mới mang tên AudioPaLM, một mô hình ngôn ngữ trí tuệ nhân tạo có khả năng nghe, nói và dịch ngôn ngữ với độ chính xác cao. Được phát triển bởi các nhà nghiên cứu của Google, AudioPaLM là kết hợp giữa hai kiến trúc mô hình PaLM-2 và AudioLM.

AudioPaLM
Google giới thiệu một mô hình ngôn ngữ AI mới có tên AudioPaLM (Ảnh: LinkedIn)

Mô hình PaLM-2 đã được chứng minh là rất hiệu quả trong việc đọc hiểu văn bản, trong khi mô hình AudioLM xuất sắc trong việc nhận dạng ngôn ngữ và âm điệu của người nói. Bằng cách kết hợp hai mô hình này, Google đã tạo ra AudioPaLM, mở ra khả năng cho trí tuệ nhân tạo hiểu và tạo ra văn bản hoặc lời nói chất lượng cao.

AudioPaLM sử dụng một từ vựng chung với một số lượng hạn chế các mã thông báo riêng biệt để biểu diễn lời nói và văn bản. Điều này cho phép nó thực hiện các tác vụ như nhận dạng giọng nói, tổng hợp văn bản thành giọng nói và dịch lời nói thành ngôn ngữ khác.

PaLM-2
Google đang nghiên cứu và phát triển mô hình ngôn ngữ AI mới (Ảnh: Gizmochina)

Đáng chú ý, AudioPaLM đã được chứng minh là hoạt động tốt hơn các nền tảng dịch giọng nói hiện tại và có thể thực hiện dịch giọng nói thành văn bản với ngôn ngữ mà mô hình này chưa từng tiếp xúc trước đây. Ngoài ra, AudioPaLM còn có khả năng thu và tái tạo các giọng nói riêng biệt của các ngôn ngữ khác nhau.

Công nghệ AudioPaLM của Google đánh dấu một bước tiến mới trong việc ứng dụng trí tuệ nhân tạo trong việc xử lý và hiểu ngôn ngữ, mang lại tiềm năng rộng lớn cho các ứng dụng trong lĩnh vực giao tiếp và dịch thuật.

hiepvo1304

Trả lời