Mới đây, hai đề tài nghiên cứu liên quan đến công nghệ xử lý tiếng nói của nhóm kỹ sư Zalo AI đã được công nhận tại Hội nghị châu Á – Thái Bình Dương về trí tuệ nhân tạo quốc tế.

PRICAI – hội nghị quốc tế tập trung nghiên cứu về AI và ứng dụng trong lĩnh vực kinh tế – xã hội trên phạm vi châu Á – Thái Bình Dương, được tổ chức lần đầu vào năm 1990, năm nay được tổ chức tại Việt Nam. Theo giới пghiêп cứu về AI, PRICAI là một troпg rất ít hội пghị về côпg пghệ thôпg tiп có thứ hạпg cao trêп thế giới. Đây là пơi quy tụ rất пhiều chuyêп gia xuất sắc trêп thế giới troпg troпg lĩпh vực tuệ пhâп tạo пói riêпg và lĩпh vực côпg пghệ thôпg tiп пói chuпg. Năm 2021, PRICAI được tổ chức tại Hà пội (Việt Nam).

Thực hiện đề tài này là các nhà nghiên cứu trẻ tuổi đến từ Zalo AI – đơn vị dẫn đầu trong nghiên cứu và ứng dụng AI trong nước, tập trung vào 4 mảng chính của trí tuệ nhân tạo là Thị giác máy tính (Computer Vision), Xử lý tiếng nói (Speech processing), Xử lý ngôn ngữ tự nhiên (NLP), và Big Data & Machine Learning (Dữ liệu lớn và máy học).

Đội ngũ kỹ sư trẻ bao gồm: Trang Trương (1994), Việt Lâm (1995), Cúc Bùi (1997), và Mạnh Cường (1999). Đội ngũ mất khoảng 6 tháng để nghiên cứu, thử nghiệm và 2 tháng để hoàn thành phần bài báo khoa học. Các đề tài đều xuất phát từ nhu cầu thực tiễn trong quá trình xây dựng các sản phẩm AI để phục vụ người dùng.

Cúc Bùi cho biết: “Module chuẩn hóa văn bản để tổng hợp giọng nói có nhiều hạn chế về từ viết tắt, từ mới, từ sai chính tả và vấn đề ngắt nghỉ. Điều này có thể ảnh hưởng mức độ tự nhiên của giọng nói AI. Vì thế, chúng tôi xây dựng mô hình nhằm cải thiện vấn đề này”.

Nghiên cứu về xử lý giọng nói của nhóm kỹ sư trẻ Việt Nam được công nhận cấp quốc tế

Hiện tại, cả “Nghiên cứu về việc chuẩn hóa văn bản đa tác vụ cho hệ thống thống tổng hợp giọng nói” và “Nghiên cứu các giải pháp để xây dựng hệ thống tổng hợp giọng nói đa ngôn ngữ” đều đang được ứng dụng vào thực tiễn. Cụ thể là 2 nghiên cứu đang được áp dụng vào hệ thống tổng hợp giọng nói nhằm hỗ trợ sản phẩm thực tế chạy trên trang Báo Mới và loa thông minh Kiki.

Sau khi tham dự PRICAI 2021, nhóm kỹ sư vẫn tiếp tục các nghiên cứu còn dang dở nhằm cải thiện sản phẩm họ đang phụ trách tại Zalo. Nếu có cơ hội hay ý tưởng tốt, nhóm vẫn vẫn sẵn sàng thực hiện các bài báo khoa học để chia sẻ tri thức tới cộng đồng AI.

Nói về mong muốn mang giải pháp AI của Việt Nam ra đấu trường quốc tế, kỹ sư Mạnh Cường cho rằng: “Việc mang những kiến thức về trí tuệ nhân tạo của người Việt Nam ra thế giới là mong muốn của rất nhiều kỹ sư AI. Và mình cảm thấy khá tự hào khi được góp một phần nhỏ trong hành trình ấy”.

Ứng dụng AI đi vào sản phẩm công nghệ cho người Việt

Ứng dụng AI đi vào sản phẩm công nghệ cho người Việt

Đây không phải lần đầu tiên Zalo có thành tích tốt về mặt học thuật tại đấu trường quốc tế. Đầu năm nay, 2 kỹ sư trẻ của Zalo đạt quán quân cuộc thi AI trên Kaggle – một trong những sân chơi trí tuệ lớn nhất thế giới. Zalo AI cũng nhiều lần đạt giải cao về xử lý tiếng nói và ngôn ngữ tự nhiên ở Việt Nam.

Thành tựu nghiên cứu từ AI của Zalo được ứng dụng trên nhiều sản phẩm hiện có của hệ sinh thái, nhằm mang đến trải nghiệm tốt nhất cho người Việt. Ngoài ra, Zalo cũng cung cấp các công cụ phát hiện đường lưỡi bò phi pháp, chuyển đổi văn bản thành giọng nói, phân loại hình ảnh, kiểm duyệt nội dung miễn phí cho cộng đồng.

Đặc biệt, sản phẩm trợ lý tiếng nói Kiki của Zalo dựa trên công nghệ tổng hợp tiếng nói và xử lý ngôn ngữ tự nhiên được ứng dụng phổ biến trên xe hơi điều khiển bằng giọng nói, app nghe nhạc Zing MP3, sắp tới sẽ xuất hiện trên hệ thống nhà thông minh.