ThS37.017_Nghiên cứu các đặc trưng tiếng Việt áp dụng vào nhận dạng tiếng nói tiếng Việt
Trong quá trính tiến hoá, con người đã trở thành động vật mạnh nhất, cao cấp nhất nhờ vào hai thứ: lao động và tiếng nói. Lao động tạo ra tư duy và tiếng nói giúp con người kết hợp với nhau. Cùng với thời gian, các phương tiện giao tiếp-thông tin của con người đã phát triển rất phong phú đa dạng. Tuy nhiên, dù đa dạng đến đâu cũng không thể thay thế được vai trò của tiếng nói. Tiếng nói là một phương tiện giao tiếp đặc biệt hiệu quả và cực kỳ phổ dụng, là một chức năng vô cùng quý giá của con người [L.V.Lợi-99]. Sự phát triển vượt bậc của con người chính là nhờ ở tốc độ và khả năng giao tiếp phong phú của tiếng nói. Ngày nay, nhờ sự phát triển củakhoa học kỹ thuật, máy móc dần dần thay thế các lao động tay chân. Tuy nhiên để điều khiển máy móc, con người phải làm khá nhiều thao tác tốn nhiều thời gian và cần phải được đào tạo. Điều này gây trở
ngại không ít đối với việc sử dụng các máy móc, thànhtựu khoa học kỹ thuật.
Chúng ta hãy tưởng tượng trong nhà có một người máy giúp việc. Khi ta muốn người máy làm việc, ta phải lục tìm đĩa chương trình tương ứng, phải nạp chương trình, … phải chạy lăng xăng làm một danh sách các công việc trong khi lúc đó ta đang ngồi bên bàn làm việc, đang phải tập trung suy nghĩ vào một vấn đề cần giải quyết. Và ta hãy tưởng tượng xem nếu người máy đó “nghe hiểu” được những gì ta nói. Lúc đó ta chỉ cần “nhờ vả” một câu, mọi việc sẽ trở nên dễ dàng! Đi tìm giải pháp giúpcho máy có thể “nghe hiểu” được, con người đã bước vào lĩnh vực nhận dạng tiếng nói. Hơn nửa thế kỷ trôi qua, con người đã thu được những thành tựu đáng kể, có những ứng dụng khá hữu ích vào đời sống. Nhưng dù sao, khả năng “nghe hiểu” của máy vẫn còn mộtkhoảng cách khá xa so với thực tế. Mặt khác, các hệ thống nhân dạng hiện nay cũng chỉ được phát triển tương đối tốt đối với một số ngôn ngữ như tiếng Anh, tiếng Pháp, tiếng Hoa,… Còn đối với nước ta, nhận dạng tiếng nói vẫn còn là một lĩnh vực khá mới mẻ. Đến nay tuy
cũng đã đạt được một số thành tựu và đã có những ứng dụng nhất định, nhưng nhìn chung, nhận dạng tiếng Việt vẫn chưa đạt được kết quả cần thiết để có thể tạo ra một sản phẩm thực tế hoàn chỉnh. Khó khăn nằm ở tính phức tạp của vấn đề và mức độ đầu tư cũng như kế thừa chưa cao. Các nghiên cứu chủ yếu vẫn là nhận dạng tiếng nói chung chung chứ chưa có nhiều phân tích kỹ các đặc tính riêng của tiếng Việt. Các hệ nhận dạng trước đây hầu hết không phân biệt được từ đồng âm như: a, á, à, ả,ã, ạ… Hơnnữa kích thước từ điển (số từ nhận biết được) còn nhỏ, thời gian học mẫu khá lâu, và nhận dạng mang tính phụ thuộc người nói khá cao.
Luận văn này xây dựng với mong muốn góp phần khắc phục những hạn chế trên, nâng cao hiệu quả nhận dạng tiếng Việt; bằng cách rút trích và sử dụng nhiều đặc trưng âm học tiếng Việt hơn, từ đó dùng nhiều đặc trưng hơn để nhận dạng giúp nâng cao độ chính xác và phân biệt được các từ đồng âm góp phần nâng kích thước từ điển lên lớn hơn.
Nội dung luận văn được trình bày thành các chương như sau:
Chương 1: Tiếng nói và ngữ âm tiếng Việt. Chương thứ nhất tóm tắt về tiếng nói và trình bày một số đặc điểm ngữ âm tiếng Việt. Trong số đó, luận văn quan tâm nhiều đến thanh điệu, là đặc điểm khác biệt của tiếng Việt so với nhiều ngôn ngữ khác.
Chương 2: Xử lý tín hiệu số -phân tích tiếng nói: Trình bày một số kiến thức cơ bản về xử lý tín hiệu số và một số phương pháp tiếp cận tín hiệu tiếng nói.
Chương 3: Nhận dạng tiếng nói. Chương này mô tả một hệ nhận dạng tiếng nói tổng quát, và đi cụ thể vào hệ nhận dạng tiếng nói sử dụng mô hình Markov ẩn liên tục.
Chương 4: Một số khảo sát về thanh điệu tiếng Việt. Đây là các khảo sát của người viết về thanh điệu tiếng Việt. Kết quả khảo sát sẽ được kết hợp, so sánh với các nghiên cứu về ngữ âm tiếng Việt trước đây để rút ra các đặc điểm ngữ âm tiếng Việt, làm cơ sở cho việc xây dựng một hệ nhận dạng tiếng Việt theo mô tả của luận văn.
Chương 5: Xây dựng môhình nhận dạng thanh điệu tiếng Việt. Nhận dạng thanh điệu là bước đầu tiên ứng dụng các nghiên cứu nói trên vào một hệ nhận dạng tiếng Việt của luận văn. Bắt đầu từ đặc tính đặc trưng của tiếng Việt là thanh điệu.
Chương 6: Thiết kế mô hình nhận dạng tiếng Việt. Phần này là thiết kế của luận văn về một hệ nhận dạng tiếng Việt hoàn chỉnh. Ứng dụng mô đun nhận dạng thanh điệu vào một hệ nhận dạng tiếng Việt hoàn chỉnh.
Chương 7: Hiện thực hoá mô hình nhận dạng tiếng Việt. Chương cuối cùng là các cài đặt cụ thể của luận văn về một hệ nhận dạng tiếng Việt.
Phần phụ lục 1: giới thiệu về một số đặc điểm ngữ âm tiếng Việt. Trong đó, luận văn chú ý nhiều đến đặc điểm thanh điệu được dùng để ứng dụng trong phân lớp tiếng Việt.
Phần phụ lục 2: Giới thiệu vai trò củatần số cơ bản trong tiếng nói và một số phương pháp rút trích tần số cơ bản.