NeMo Guardrails - Mô hình 'cảnh sát AI' cần thiết trong giới công nghệ

Vân Tước
29/04/2023 15:00
D

Trước sự phát triển mạnh mẽ của công nghệ AI cũng như những tác động của mặt trái mà công nghệ mang đến cho con ngườn, phần mềm NeMo Guardrails được Nvidia phát triển để buộc các siêu AI không trả lời lan man, tự sáng tác, tránh chủ đề độc hại và loại bỏ câu lệnh nguy hiểm.

Theo đó, NeMo Guardrails là lớp phần mềm nằm giữa người dùng và mô hình ngôn ngữ lớn hoặc các siêu AI. Nó lọc những kết quả được cho là độc hại của AI, giảm khả năng đưa ra câu trả lời vô nghĩa, hoặc từ khóa xấu có thể xuất hiện trong dữ liệu học máy của các nền tảng.

Cohen lấy ví dụ một chatbot phục vụ khách hàng, được thiết kế để nói về sản phẩm của công ty, sẽ được NeMo Guardrails hạn chế tối đa việc nói về các sản phẩm của đối thủ cạnh tranh dù được khách hàng hỏi. Thậm chí, phần mềm có thể ngăn chatbot trả lời những câu liên quan đến nhân sự nội bộ và thông tin bảo mật của công ty.

"Cảnh sát AI" của Nvidia dùng một mô hình ngôn ngữ lớn khác để kiểm tra câu trả lời tự bịa của siêu AI. Nếu chatbot không đưa ra câu trả lời phù hợp, Nemo Guardrails sẽ không hiển thị nội dung đến người dùng. NeMo Guardrails được cung cấp dưới dạng nguồn mở thông qua các dịch vụ của Nvidia và có thể dùng trong ứng dụng thương mại.

NeMo Guardrails được xem như mô hình cần thiết để có thể đảm bảo sự an toàn của con người trong trào lưu sử dụng AI
NeMo Guardrails được xem như mô hình cần thiết để có thể đảm bảo sự an toàn của con người trong trào lưu sử dụng và sự phát triển vượt bậc của AI.

Các công ty AI như Google, OpenAI, Microsoft cũng đang ngăn AI tự bịa nội dung hoặc nói thông tin độc hại bằng cách để con người "dạy" AI. Tuy nhiên, điều này cũng gây nên một làn sóng tranh cãi về đạo đức nghề nghiệp và rủi ro liên quan đến vấn đề thiên vị giới tính, sắc tộc.

Phần mềm NeMo Guardrails, được Nvidia công bố hôm 25/4, được đánh giá là một trong những bước tiến quan trọng của trí tuệ nhân tạo nhằm giải quyết vấn đề siêu AI bị "ảo giác" - vấn đề lớn mà những mô hình AI tạo sinh như GPT của OpenAI hay LaMDA của Google đang gặp phải.

Các siêu AI như ChatGPT, Bard được đào tạo trên hàng terabyte dữ liệu để trả lời như con người. Tuy nhiên, chúng có một xu hướng xấu là có thể bịa ra nội dung. Trong cuộc phỏng vấn với CBS tuần trước, CEO Google Sundar Pichai thừa nhận ngay cả hãng cũng không hiểu đầy đủ về AI khi nó có thể tạo ra câu trả lời có phần ngớ ngẩn, thậm chí nguy hiểm.

NeMo Guardrails có thể giảm thiểu các câu trả lời tự bịa bằng cách thêm nhiều lớp ngăn AI nói ra chủ đề ngoài tầm hiểu biết. Phần mềm mới buộc chatbot chỉ nói về một chủ đề cụ thể, loại bỏ nội dung độc hại và hạn chế việc thực thi các lệnh có hại trên máy tính.

"Một siêu AI cần được mã hóa cứng trong các logic thực thi của hệ thống bảo vệ, đảm bảo không nói luyên thuyên những thứ ngoài chủ đề người dùng đang đề cập hoặc nhắc đến nội dung độc hại", Jonathan Cohen, Phó chủ tịch nghiên cứu ứng dụng của Nvidia, nói.

Trong lĩnh vực phần cứng, Nvidia hiện chiếm hơn 95% thị trường chip đào tạo AI và đang cung cấp hàng nghìn bộ xử lý đồ họa cần thiết để xây dựng những siêu AI như ChatGPT.

Theo tạp chí Điện tử và Ứng dụng

Tin cùng chuyên mục

Giải Bóng rổ Trẻ VnExpress 2025 - Cúp Ziaja khởi động tại Hà Nội

Giải Bóng rổ Trẻ VnExpress 2025 - Cúp Ziaja khởi động tại Hà Nội

Nhà xuất bản Kim Đồng ra mắt nhiều sách mới chào đón Trung thu 2025

Nhà xuất bản Kim Đồng ra mắt nhiều sách mới chào đón Trung thu 2025

Ra mắt sách ảnh ‘Chúng tôi đó - Phụ nữ Kiên cường’

Ra mắt sách ảnh ‘Chúng tôi đó - Phụ nữ Kiên cường’

Hướng dẫn tắt quảng cáo, tăng cường bảo mật trên điện thoại Samsung

Hướng dẫn tắt quảng cáo, tăng cường bảo mật trên điện thoại Samsung

Hơn 350 thương hiệu cà phê và trà quốc tế góp mặt tại Cafe Show và Tea Show Hanoi 2025

Hơn 350 thương hiệu cà phê và trà quốc tế góp mặt tại Cafe Show và Tea Show Hanoi 2025

Tập đoàn VNPT chính thức triển khai mô hình mới từ hôm nay

Tập đoàn VNPT chính thức triển khai mô hình mới từ hôm nay

Triển lãm 'Cuộc sống tươi đẹp' tôn vinh 100 năm Mỹ thuật Đông Dương và 71 năm Giải phóng Thủ đô

Triển lãm 'Cuộc sống tươi đẹp' tôn vinh 100 năm Mỹ thuật Đông Dương và 71 năm Giải phóng Thủ đô

Bộ Khoa học và Công nghệ được trao tặng Huân chương Lao động hạng Nhất

Bộ Khoa học và Công nghệ được trao tặng Huân chương Lao động hạng Nhất

80 năm Bưu chính và Viễn thông, 66 năm Khoa học và Công nghệ: Dấu mốc lịch sử, khát vọng tương lai

80 năm Bưu chính và Viễn thông, 66 năm Khoa học và Công nghệ: Dấu mốc lịch sử, khát vọng tương lai

VNPT ra mắt dịch vụ mới VNPT Safe Motor

VNPT ra mắt dịch vụ mới VNPT Safe Motor

UNIQLO ra mắt BST đầu tiên kết hợp cùng thương hiệu thời trang Nhật Bản NDLS

UNIQLO ra mắt BST đầu tiên kết hợp cùng thương hiệu thời trang Nhật Bản NDLS

Diễn đàn Phát triển Hạ tầng số Việt Nam 2025: Khẳng định vai trò nền tảng làm chủ công nghệ chiến lược

Diễn đàn Phát triển Hạ tầng số Việt Nam 2025: Khẳng định vai trò nền tảng làm chủ công nghệ chiến lược

Tin mới cập nhật

Giải Bóng rổ Trẻ VnExpress 2025 - Cúp Ziaja khởi động tại Hà Nội

Giải Bóng rổ Trẻ VnExpress 2025 - Cúp Ziaja khởi động tại Hà Nội

Thị trường chứng khoán châu Á - Thái Bình Dương tăng điểm dù Chính phủ Mỹ đóng cửa

Thị trường chứng khoán châu Á - Thái Bình Dương tăng điểm dù Chính phủ Mỹ đóng cửa

Nhà xuất bản Kim Đồng ra mắt nhiều sách mới chào đón Trung thu 2025

Nhà xuất bản Kim Đồng ra mắt nhiều sách mới chào đón Trung thu 2025

Cá nhân hóa quảng cáo và nội dung từ tương tác với Meta AI

Cá nhân hóa quảng cáo và nội dung từ tương tác với Meta AI

Ra mắt sách ảnh ‘Chúng tôi đó - Phụ nữ Kiên cường’

Ra mắt sách ảnh ‘Chúng tôi đó - Phụ nữ Kiên cường’

Hướng dẫn tắt quảng cáo, tăng cường bảo mật trên điện thoại Samsung

Hướng dẫn tắt quảng cáo, tăng cường bảo mật trên điện thoại Samsung

Trường Đại học Sư phạm Hà Nội có Hiệu trưởng mới nhiệm kỳ 2025-2030

Trường Đại học Sư phạm Hà Nội có Hiệu trưởng mới nhiệm kỳ 2025-2030

Cổ phiếu SK Hynix lập đỉnh 24 năm, Samsung tăng vọt khi bắt tay OpenAI

Cổ phiếu SK Hynix lập đỉnh 24 năm, Samsung tăng vọt khi bắt tay OpenAI

Locknlock lan toả sống xanh bền vững cùng sự kiện 'Love for Vietnam - Act for climate'

Locknlock lan toả sống xanh bền vững cùng sự kiện 'Love for Vietnam - Act for climate'

Microsoft đang tăng tốc phát triển chip riêng cho trung tâm dữ liệu AI

Microsoft đang tăng tốc phát triển chip riêng cho trung tâm dữ liệu AI

Jellycat - Thương hiệu đồ chơi thế hệ Z mê mẩn đã tăng gấp đôi lợi nhuận

Jellycat - Thương hiệu đồ chơi thế hệ Z mê mẩn đã tăng gấp đôi lợi nhuận

Thị thực K của Trung Quốc làm dấy lên lo ngại cạnh tranh việc làm trong lĩnh vực công nghệ

Thị thực K của Trung Quốc làm dấy lên lo ngại cạnh tranh việc làm trong lĩnh vực công nghệ

Tin đọc nhiều

Hơn 350 thương hiệu cà phê và trà quốc tế góp mặt tại Cafe Show và Tea Show Hanoi 2025

Hơn 350 thương hiệu cà phê và trà quốc tế góp mặt tại Cafe Show và Tea Show Hanoi 2025

Tập đoàn VNPT chính thức triển khai mô hình mới từ hôm nay

Tập đoàn VNPT chính thức triển khai mô hình mới từ hôm nay

Triển lãm 'Cuộc sống tươi đẹp' tôn vinh 100 năm Mỹ thuật Đông Dương và 71 năm Giải phóng Thủ đô

Triển lãm 'Cuộc sống tươi đẹp' tôn vinh 100 năm Mỹ thuật Đông Dương và 71 năm Giải phóng Thủ đô

Bộ Khoa học và Công nghệ được trao tặng Huân chương Lao động hạng Nhất

Bộ Khoa học và Công nghệ được trao tặng Huân chương Lao động hạng Nhất

80 năm Bưu chính và Viễn thông, 66 năm Khoa học và Công nghệ: Dấu mốc lịch sử, khát vọng tương lai

80 năm Bưu chính và Viễn thông, 66 năm Khoa học và Công nghệ: Dấu mốc lịch sử, khát vọng tương lai

UNIQLO ra mắt BST đầu tiên kết hợp cùng thương hiệu thời trang Nhật Bản NDLS

UNIQLO ra mắt BST đầu tiên kết hợp cùng thương hiệu thời trang Nhật Bản NDLS

Diễn đàn Phát triển Hạ tầng số Việt Nam 2025: Khẳng định vai trò nền tảng làm chủ công nghệ chiến lược

Diễn đàn Phát triển Hạ tầng số Việt Nam 2025: Khẳng định vai trò nền tảng làm chủ công nghệ chiến lược

Tổng Bí thư dự Lễ kỷ niệm 80 năm ngành Bưu chính Viễn thông, 66 năm ngành Khoa học và Công nghệ

Tổng Bí thư dự Lễ kỷ niệm 80 năm ngành Bưu chính Viễn thông, 66 năm ngành Khoa học và Công nghệ

Trung thu 2025 tại Bảo tàng Dân tộc học Việt Nam: Vui cùng trẻ thơ, kết nối di sản và sáng tạo

Trung thu 2025 tại Bảo tàng Dân tộc học Việt Nam: Vui cùng trẻ thơ, kết nối di sản và sáng tạo

Lễ kỷ niệm 80 năm ngành Bưu chính và Viễn thông, 66 năm ngành Khoa học và Công nghệ và Đại hội Thi đua yêu nước lần thứ I

Lễ kỷ niệm 80 năm ngành Bưu chính và Viễn thông, 66 năm ngành Khoa học và Công nghệ và Đại hội Thi đua yêu nước lần thứ I

Video xem nhiều

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Isuzu Mu-X 2021 hoàn toàn mới: Thiết kế hiện đại và đầy công nghệ

Isuzu Mu-X 2021 hoàn toàn mới: Thiết kế hiện đại và đầy công nghệ

Hướng dẫn cài đặt phần mềm ký số vSignPDF 3.1.7

Hướng dẫn cài đặt phần mềm ký số vSignPDF 3.1.7

Thông điệp lan tỏa mùa dịch COVID-19

Thông điệp lan tỏa mùa dịch COVID-19

Subaru Eyesight con mắt "Nhị Lang thần" phòng ngừa va chạm an toàn cho mỗi chuyến đi

Subaru Eyesight con mắt "Nhị Lang thần" phòng ngừa va chạm an toàn cho mỗi chuyến đi

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

Xe máy điện VinFast được CNN chọn là 1 trong 5 biểu tượng mới của Hà Nội

Xe máy điện VinFast được CNN chọn là 1 trong 5 biểu tượng mới của Hà Nội

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Những gì bạn muốn biết về 5G

Những gì bạn muốn biết về 5G

5G thay đổi tương lai của bạn như thế nào?

5G thay đổi tương lai của bạn như thế nào?

Bàn về tầm nhìn và các trụ cột của công nghệ thông tin di động 6G
04/03/2022
Chip xử lý A15 Bionic của Apple có gì mới
15/09/2021
Sex Education mùa 3 được Netflix công chiếu vào 17/9
14/09/2021
iPhone 13 không thay đổi nhiều về ngoại hình, camera được nâng cấp mạnh
13/09/2021
Cách xem trực tiếp sự kiện ra mắt iPhone 13 và Apple Watch 7
10/09/2021
VNEID của Bộ Công an khác các ứng dụng đang được vận hành?
10/09/2021
'Cái tôi' thời 4.0 và tính hai mặt của mạng xã hội
04/09/2021
'Muôn màu' cảm xúc của trẻ trong ngày khai giảng online
24/08/2021
Chủ tịch Chu Ngọc Anh giải toả 'ách tắc' về Giấy đi đường cho người dân Thủ đô
10/08/2021
Hàng loạt Macbook M1 tự dưng vỡ màn hình, Apple có đồng ý bảo hành?
02/08/2021
6 bộ phim hay nhất để xem trên VieON
29/01/2021
Bắc Ninh: Không ký kết triển khai dự án Owifi 5G với CSE Singapore
27/06/2020
Bị World Bank cấm dự thầu 7 năm, công ty Sao Bắc Đẩu thừa nhận sai sót
27/06/2020
Wefinex - Mô hình hoạt động đa cấp "đội lốt" đầu tài chính trên mạng internet
10/06/2020
Khai trừ MISA khỏi Câu lạc bộ Chữ ký số và Giao dịch điện tử Việt Nam
27/05/2020
Chuyển đổi số - Nên hiểu như thế nào cho đúng
25/05/2020
Chống thất thu thuế là thách thức lớn đối với nền kinh tế số
29/04/2020
Cách chuyển tập tin sang máy tính mới
10/11/2019
VNPT, MobiFone, VTC sẽ hoàn thành cổ phần hóa trước năm 2021
20/08/2019
5G thay đổi tương lai của bạn như thế nào?
26/07/2019
Nhận diện hành vi lừa đảo trên không gian mạng
25/07/2019
Truyền hình OTT - Hướng đi mới của các “nhà Đài”
24/07/2019