Dạy tiếng Việt bằng AI, tại sao không?

Huy Thông
14/07/2023 10:01
D

Việc kết hợp giữa ngôn ngữ và khoa học máy tính có thể giúp đẩy nhanh quá trình học những ngôn ngữ mới sẽ giúp người học ngoại ngữ nhanh hơn, giúp trí tuệ nhân tạo có thể “hiểu” và “phản hồi” ngôn ngữ tự nhiên tốt hơn.

zalo

Kết hợp AI “dạy” tiếng Việt

Lãnh đạo của một doanh nghiệp có vốn đầu tư tiếp trực tiếp nước ngoài (FDI) tại Việt Nam mong muốn học tiếng Việt nhanh, đọc được 90% nội dung các văn bản thông thường. Vấn đề là, ông quá bận và chỉ có chừng 1 giờ (từ 12-13h trưa mỗi ngày) để học. Vậy, cần áp dụng công nghệ vào phần mềm học ngôn ngữ ra sao để giúp ông học ngoại ngữ nhanh?

Trên đây là bài toán của vị lãnh đạo công ty FDI đặt ra với PGS.TS Đinh Điền, Giám đốc Trung tâm Ngôn ngữ học tính toán, Trường Đại học Khoa học tự nhiên, Đại học Quốc gia TP.HCM, người có nhiều đề tài nghiên cứu khoa học và công trình công bố quốc tế về áp dụng trí tuệ nhân tạo (AI) trong dịch máy, ngôn ngữ học đối chiếu và dạy tiếng Việt cho người nước ngoài.

Theo PGS.TS Điền, bước đầu tiên của việc học bất kỳ một ngôn ngữ nào là dạy ngữ âm. Rào cản ở đây là tiếng Việt có thanh điệu, do đó, khi dạy cho những người học thuộc hệ ngôn ngữ không có thanh điệu như người Anh, Pháp… sẽ rất khó. Đơn cử, thay vì hỏi: “Bạn đi ngủ chưa?” thì người học sẽ nói “Bạn đi ngu chưa?”, bởi, họ không phân biệt được thanh điệu. Cần dạy họ đặt lưỡi ở đâu khi phát âm, khẩu hình miệng ra sao, tiếng phát âm ra đúng hay sai khác nhau như thế nào.

Lúc này, phần mềm ứng dụng AI trong dạy ngoại ngữ có thể mô phỏng khẩu hình miệng, phát âm sẵn để người học bắt chước. Sau đó, người học tập phát âm lại, thu vào phần mềm, sử dụng công nghệ đối sánh giữa phát âm của người học và phát âm chuẩn từ phần mềm, cải thiện nhanh khả năng phát âm. Tất cả các công đoạn trên đều bắt buộc phải ứng dụng AI.

Zalo

Một dẫn chứng khác, theo Từ điển tiếng Việt của Viện Ngôn ngữ học do cố Giáo sư Hoàng Phê chủ biên, vốn từ gốc tiếng Việt có khoảng 34.000 từ, tính toán cho thấy, cần dạy khoảng 10% số lượng từ cho máy, tương đương 3.400 từ thông dụng, là máy có thể đọc khoảng 90% văn bản tiếng Việt thông thường. Để có được dữ liệu thống kê này, PGS Điền buộc phải sử dụng AI, gán nhãn lên hệ thống từ vựng trong kho ngữ liệu tiếng Việt.

AI đã thay đổi cách dạy - học của ngành giáo dục. Thực tế, rất nhiều các ứng dụng trí tuệ nhân tạo đã ra đời nhằm hỗ trợ quá trình dạy - học trở nên nhanh chóng, hiệu quả hơn.

Câu chuyện kết hợp giữa khoa học máy tính và ngôn ngữ học khá thú vị ở trên cho thấy, quá trình để huấn luyện, ứng dụng AI vào thực tiễn là rất cần thiết, song không dễ. Các dữ liệu cần được phân tách theo nhiều lớp định danh, ở mỗi lớp sẽ phải xử lý tiếp từng biến số với những định danh cụ thể khác nhau nữa.

zalo

Khi máy móc học ngôn ngữ...

Không chỉ giúp con người học ngôn ngữ, trí tuệ nhân tạo (AI) còn giúp hệ thống các trợ lý thông minh hiểu ngôn ngữ tốt hơn. Máy móc được huấn luyện và tiến bộ mỗi ngày.

Tương tự câu chuyện của PGS Điền, dưới đây lại là dẫn chứng sinh động khác về cách mà một trợ lý thông minh hiểu ngôn ngữ con người.

Đó là quá trình nghiên cứu và phát triển trợ lý giọng nói tiếng Việt Kiki trên xe ô tô, để nhận dạng tốt giọng nói với nhiều ngữ điệu vùng miền khác nhau. Trong khoa học máy tính, nhận dạng giọng nói là một nhánh quan trọng của trí tuệ nhân tạo (AI), chuyển đổi giọng nói con người thành một định dạng hữu ích và có thể hiểu được bằng các ứng dụng máy tính.

Công nghệ này là cầu nối tương tác giữa máy móc và con người. Trợ lý giọng nói đã trở thành ứng dụng không thể thiếu trên toàn thế giới. Phổ biến nhất có thể kể đến như: Siri của Apple, Google Assistant, Amazon Alexa, hay Kiki ở Việt Nam.

Anh Nguyễn Hoàng Khánh Duy, người viết những dòng code đầu tiên cho Kiki chia sẻ, để huấn luyện mô hình AI đủ thông minh khi nhận diện giọng nói, phản hồi thông tin đúng cho người dùng, thì dữ liệu ngôn ngữ đóng vai trò chủ chốt.

zalo

Dẫn chứng, chức năng rất quan trọng với người dùng trợ lý tiếng Việt Kiki trên ôtô là dẫn đường. Do đó, đội ngũ phát triển sản phẩm phải chuẩn bị dữ liệu, vốn từ vựng để hỗ trợ “mượt” cho các câu lệnh từ người dùng. Sau quá trình thu thập dữ liệu, huấn luyện mô hình, chỉ số thể hiện chất lượng nhận diện giọng nói ở phiên bản sau đã cải thiện 40% so với ban đầu.

Việc nhận diện giọng nói trên xe ô tô không chỉ dừng lại ở mỗi bài toán về dẫn đường, địa điểm mà còn nhiều vấn đề khác.

Ví dụ, đặc thù sử dụng Kiki trên xe ô tô thì tiếng ồn do động cơ, gió hay tiếng phát ra từ các thiết bị giao thông trên đường cũng rất lớn, điều này ảnh hưởng trực tiếp tới chất lượng nhận diện giọng nói của Kiki trên xe. Do đó, đòi hỏi đội ngũ Kiki phải cố gắng giả lập điều kiện ồn bằng cách tăng cường dữ liệu giọng nói trong điều kiện tiếng ồn sao cho sát với cuộc sống thực tế nhất. Bằng các kỹ thuật mới như self-supervised (học tự giám sát), Kiki đang cố gắng “học” từ cả những dữ liệu không được gán nhãn, để cải thiện mô hình tốt hơn nữa. Tính ổn định của trợ lý giọng nói tiếng Việt này đang cải thiện với việc không ngừng đào tạo, nâng cấp sản phẩm.

 zalo

Rõ ràng, tiến bộ của công nghệ đang diễn ra hàng ngày, hàng giờ. ChatGPT ra đời cuối năm 2022 đã trả lời một phần cho câu hỏi về cách dữ liệu lớn vận hành. Công nghệ đang “bước” vào giữa đời sống, đặc biệt, trong giáo dục, ngôn ngữ, những lĩnh vực vốn phụ thuộc nhiều vào con người trước đây. AI tái định nghĩa cách chúng ta học tập, làm việc, sinh hoạt,... như những ví dụ cụ thể nêu trên.

Theo tạp chí Điện tử và Ứng dụng

Bình luận

Tối thiểu 10 chữ Tiếng việt có dấu Không chứa liên kết

Gửi bình luận

Tin cùng chuyên mục

FPT bắt tay LG CNS thúc đẩy AI vào lĩnh vực giáo dục tại Đông Nam Á

FPT bắt tay LG CNS thúc đẩy AI vào lĩnh vực giáo dục tại Đông Nam Á

Hà Nội: Phường Giảng Võ gắn biển công trình trường học chào mừng Đại hội XIV của Đảng

Hà Nội: Phường Giảng Võ gắn biển công trình trường học chào mừng Đại hội XIV của Đảng

Đại học Đại Nam hợp tác chiến lược với KdKOO, thành lập Khoa Thể thao điện tử đầu tiên tại Việt Nam

Đại học Đại Nam hợp tác chiến lược với KdKOO, thành lập Khoa Thể thao điện tử đầu tiên tại Việt Nam

Triển khai công tác tư vấn học đường và công tác xã hội trường học đáp ứng yêu cầu kỷ nguyên số

Triển khai công tác tư vấn học đường và công tác xã hội trường học đáp ứng yêu cầu kỷ nguyên số

45 năm Trường Đại học Sân khấu - Điện ảnh Hà Nội: Gìn giữ truyền thống, nâng tầm chất lượng đào tạo nghệ thuật

45 năm Trường Đại học Sân khấu - Điện ảnh Hà Nội: Gìn giữ truyền thống, nâng tầm chất lượng đào tạo nghệ thuật

Trường Đào tạo cán bộ Lê Hồng Phong Hà Nội được công nhận đạt chuẩn mức 1

Trường Đào tạo cán bộ Lê Hồng Phong Hà Nội được công nhận đạt chuẩn mức 1

Trường Đại học Công nghiệp Hà Nội chính thức trở thành Đại học đa ngành

Trường Đại học Công nghiệp Hà Nội chính thức trở thành Đại học đa ngành

Di sản 80 năm - Những giá trị bền vững của trường Đại học Khoa học Xã hội và Nhân văn Hà Nội

Di sản 80 năm - Những giá trị bền vững của trường Đại học Khoa học Xã hội và Nhân văn Hà Nội

Bộ GD&ĐT gặp mặt 80 gương giáo viên chương trình 'Chia sẻ cùng thầy cô' năm 2025

Bộ GD&ĐT gặp mặt 80 gương giáo viên chương trình 'Chia sẻ cùng thầy cô' năm 2025

Trường nghề Việt Nam đẩy mạnh đào tạo AI cho sinh viên

Trường nghề Việt Nam đẩy mạnh đào tạo AI cho sinh viên

Trường Đại học Hòa Bình đưa trí tuệ nhân tạo vào hành trang cho tân sinh viên

Trường Đại học Hòa Bình đưa trí tuệ nhân tạo vào hành trang cho tân sinh viên

Keysight và đại học Universiti Sains Malaysia phát triển giáo dục trong lĩnh vực bán dẫn và quang tử tại Malaysia

Keysight và đại học Universiti Sains Malaysia phát triển giáo dục trong lĩnh vực bán dẫn và quang tử tại Malaysia

Tin mới cập nhật

Mercedes-Benz Việt Nam bổ nhiệm ông René Neumann làm CEO, đón cột mốc 140 năm

Mercedes-Benz Việt Nam bổ nhiệm ông René Neumann làm CEO, đón cột mốc 140 năm

Trường Tiểu học Đoàn Thị Điểm được phong tặng danh hiệu Anh hùng Lao động

Trường Tiểu học Đoàn Thị Điểm được phong tặng danh hiệu Anh hùng Lao động

Giá vàng và bạc liên tiếp lập đỉnh lịch sử: Thị trường kim loại quý có đang 'mất kiểm soát'?

Giá vàng và bạc liên tiếp lập đỉnh lịch sử: Thị trường kim loại quý có đang 'mất kiểm soát'?

SK Hynix lần đầu vượt Samsung về lợi nhuận nhờ bùng nổ AI

SK Hynix lần đầu vượt Samsung về lợi nhuận nhờ bùng nổ AI

Sony kêu gọi người dùng PS4 nâng cấp lên PS5, trong bối cảnh PS6 vẫn chưa ra mắt

Sony kêu gọi người dùng PS4 nâng cấp lên PS5, trong bối cảnh PS6 vẫn chưa ra mắt

FPT thành lập nhà máy chip: Từ cam kết đến hành động

FPT thành lập nhà máy chip: Từ cam kết đến hành động

Bộ Công an chủ trì, phối hợp xử lý dứt điểm SIM rác và tài khoản ảo

Bộ Công an chủ trì, phối hợp xử lý dứt điểm SIM rác và tài khoản ảo

Phúc Thanh Audio trở thành Nhà phân phối toàn quốc của OHM Manchester tại Việt Nam

Phúc Thanh Audio trở thành Nhà phân phối toàn quốc của OHM Manchester tại Việt Nam

Crossfire Thanks Day 2025 - vinh danh cộng đồng hệ sinh thái thể thao điện tử

Crossfire Thanks Day 2025 - vinh danh cộng đồng hệ sinh thái thể thao điện tử

Xiaomi ra mắt khóa cửa thông minh tám phương thức mở, lắp đặt không khoan đục

Xiaomi ra mắt khóa cửa thông minh tám phương thức mở, lắp đặt không khoan đục

NVIDIA mở mã nguồn AI dự báo thời tiết Earth-2: Dự đoán bão 15 ngày nhanh gấp 60 lần

NVIDIA mở mã nguồn AI dự báo thời tiết Earth-2: Dự đoán bão 15 ngày nhanh gấp 60 lần

Khơi thông nguồn vốn cho chuyển đổi xanh tại Việt Nam

Khơi thông nguồn vốn cho chuyển đổi xanh tại Việt Nam

Tin đọc nhiều

FPT bắt tay LG CNS thúc đẩy AI vào lĩnh vực giáo dục tại Đông Nam Á

FPT bắt tay LG CNS thúc đẩy AI vào lĩnh vực giáo dục tại Đông Nam Á

Hà Nội: Phường Giảng Võ gắn biển công trình trường học chào mừng Đại hội XIV của Đảng

Hà Nội: Phường Giảng Võ gắn biển công trình trường học chào mừng Đại hội XIV của Đảng

Đài Loan trao học bổng cho 52 du học sinh Việt Nam xuất sắc năm 2025

Đài Loan trao học bổng cho 52 du học sinh Việt Nam xuất sắc năm 2025

Bộ máy lãnh đạo Học viện Chiến lược Khoa học và Công nghệ hoàn thiện với 5 nhân sự mới

Bộ máy lãnh đạo Học viện Chiến lược Khoa học và Công nghệ hoàn thiện với 5 nhân sự mới

Top 5 trường Đại học có điểm chuẩn Điện tử Viễn thông cao nhất Hà Nội năm 2024

Top 5 trường Đại học có điểm chuẩn Điện tử Viễn thông cao nhất Hà Nội năm 2024

Nam sinh ở Hà Nội 'phao tin' lộ đề thi tốt nghiệp THPT 2024 trên TikTok là ai?

Nam sinh ở Hà Nội 'phao tin' lộ đề thi tốt nghiệp THPT 2024 trên TikTok là ai?

Panasonic trao tải cuộc thi 'Cùng em sáng tạo STEM'

Panasonic trao tải cuộc thi 'Cùng em sáng tạo STEM'

 Đại học Quốc gia TP.HCM mở đợt tuyển dụng thứ hai của chương trình VNU350

Đại học Quốc gia TP.HCM mở đợt tuyển dụng thứ hai của chương trình VNU350

ViewSonic triển khai lớp học thông minh tại trường Đại học Giáo Dục (ĐHQGHN)

ViewSonic triển khai lớp học thông minh tại trường Đại học Giáo Dục (ĐHQGHN)

Học sinh, sinh viên Bắc Ninh trở lại trường hoàn thành chương trình năm học 2020-2021

Học sinh, sinh viên Bắc Ninh trở lại trường hoàn thành chương trình năm học 2020-2021

Video xem nhiều

Toàn cảnh xác lập kỷ lục Bản đồ Việt Nam được xếp từ nhiều xe ô tô nhất năm 2022

Toàn cảnh xác lập kỷ lục Bản đồ Việt Nam được xếp từ nhiều xe ô tô nhất năm 2022

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Thông điệp lan tỏa mùa dịch COVID-19

Thông điệp lan tỏa mùa dịch COVID-19

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Làm thế nào để nâng cao tương tác giữa loa và phòng nghe hiệu quả

Làm thế nào để nâng cao tương tác giữa loa và phòng nghe hiệu quả

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Chiếc điều hòa cá nhân này của Sony là tất cả những gì bạn cần để sống sót qua mùa hè nóng nực

Chiếc điều hòa cá nhân này của Sony là tất cả những gì bạn cần để sống sót qua mùa hè nóng nực

5G thay đổi tương lai của bạn như thế nào?

5G thay đổi tương lai của bạn như thế nào?

Bàn về tầm nhìn và các trụ cột của công nghệ thông tin di động 6G
04/03/2022
Chip xử lý A15 Bionic của Apple có gì mới
15/09/2021
Sex Education mùa 3 được Netflix công chiếu vào 17/9
14/09/2021
iPhone 13 không thay đổi nhiều về ngoại hình, camera được nâng cấp mạnh
13/09/2021
Cách xem trực tiếp sự kiện ra mắt iPhone 13 và Apple Watch 7
10/09/2021
VNEID của Bộ Công an khác các ứng dụng đang được vận hành?
10/09/2021
'Cái tôi' thời 4.0 và tính hai mặt của mạng xã hội
04/09/2021
'Muôn màu' cảm xúc của trẻ trong ngày khai giảng online
24/08/2021
Chủ tịch Chu Ngọc Anh giải toả 'ách tắc' về Giấy đi đường cho người dân Thủ đô
10/08/2021
Hàng loạt Macbook M1 tự dưng vỡ màn hình, Apple có đồng ý bảo hành?
02/08/2021
6 bộ phim hay nhất để xem trên VieON
29/01/2021
Bắc Ninh: Không ký kết triển khai dự án Owifi 5G với CSE Singapore
27/06/2020
Bị World Bank cấm dự thầu 7 năm, công ty Sao Bắc Đẩu thừa nhận sai sót
27/06/2020
Wefinex - Mô hình hoạt động đa cấp "đội lốt" đầu tài chính trên mạng internet
10/06/2020
Khai trừ MISA khỏi Câu lạc bộ Chữ ký số và Giao dịch điện tử Việt Nam
27/05/2020
Chuyển đổi số - Nên hiểu như thế nào cho đúng
25/05/2020
Chống thất thu thuế là thách thức lớn đối với nền kinh tế số
29/04/2020
Cách chuyển tập tin sang máy tính mới
10/11/2019
VNPT, MobiFone, VTC sẽ hoàn thành cổ phần hóa trước năm 2021
20/08/2019
5G thay đổi tương lai của bạn như thế nào?
26/07/2019
Nhận diện hành vi lừa đảo trên không gian mạng
25/07/2019
Truyền hình OTT - Hướng đi mới của các “nhà Đài”
24/07/2019