NeMo Guardrails - Mô hình 'cảnh sát AI' cần thiết trong giới công nghệ

Trước sự phát triển mạnh mẽ của công nghệ AI cũng như những tác động của mặt trái mà công nghệ mang đến cho con ngườn, phần mềm NeMo Guardrails được Nvidia phát triển để buộc các siêu AI không trả lời lan man, tự sáng tác, tránh chủ đề độc hại và loại bỏ câu lệnh nguy hiểm.

Theo đó, NeMo Guardrails là lớp phần mềm nằm giữa người dùng và mô hình ngôn ngữ lớn hoặc các siêu AI. Nó lọc những kết quả được cho là độc hại của AI, giảm khả năng đưa ra câu trả lời vô nghĩa, hoặc từ khóa xấu có thể xuất hiện trong dữ liệu học máy của các nền tảng.

Cohen lấy ví dụ một chatbot phục vụ khách hàng, được thiết kế để nói về sản phẩm của công ty, sẽ được NeMo Guardrails hạn chế tối đa việc nói về các sản phẩm của đối thủ cạnh tranh dù được khách hàng hỏi. Thậm chí, phần mềm có thể ngăn chatbot trả lời những câu liên quan đến nhân sự nội bộ và thông tin bảo mật của công ty.

"Cảnh sát AI" của Nvidia dùng một mô hình ngôn ngữ lớn khác để kiểm tra câu trả lời tự bịa của siêu AI. Nếu chatbot không đưa ra câu trả lời phù hợp, Nemo Guardrails sẽ không hiển thị nội dung đến người dùng. NeMo Guardrails được cung cấp dưới dạng nguồn mở thông qua các dịch vụ của Nvidia và có thể dùng trong ứng dụng thương mại.

NeMo Guardrails được xem như mô hình cần thiết để có thể đảm bảo sự an toàn của con người trong trào lưu sử dụng và sự phát triển vượt bậc của AI.

Các công ty AI như Google, OpenAI, Microsoft cũng đang ngăn AI tự bịa nội dung hoặc nói thông tin độc hại bằng cách để con người "dạy" AI. Tuy nhiên, điều này cũng gây nên một làn sóng tranh cãi về đạo đức nghề nghiệp và rủi ro liên quan đến vấn đề thiên vị giới tính, sắc tộc.

Phần mềm NeMo Guardrails, được Nvidia công bố hôm 25/4, được đánh giá là một trong những bước tiến quan trọng của trí tuệ nhân tạo nhằm giải quyết vấn đề siêu AI bị "ảo giác" - vấn đề lớn mà những mô hình AI tạo sinh như GPT của OpenAI hay LaMDA của Google đang gặp phải.

Các siêu AI như ChatGPT, Bard được đào tạo trên hàng terabyte dữ liệu để trả lời như con người. Tuy nhiên, chúng có một xu hướng xấu là có thể bịa ra nội dung. Trong cuộc phỏng vấn với CBS tuần trước, CEO Google Sundar Pichai thừa nhận ngay cả hãng cũng không hiểu đầy đủ về AI khi nó có thể tạo ra câu trả lời có phần ngớ ngẩn, thậm chí nguy hiểm.

NeMo Guardrails có thể giảm thiểu các câu trả lời tự bịa bằng cách thêm nhiều lớp ngăn AI nói ra chủ đề ngoài tầm hiểu biết. Phần mềm mới buộc chatbot chỉ nói về một chủ đề cụ thể, loại bỏ nội dung độc hại và hạn chế việc thực thi các lệnh có hại trên máy tính.

"Một siêu AI cần được mã hóa cứng trong các logic thực thi của hệ thống bảo vệ, đảm bảo không nói luyên thuyên những thứ ngoài chủ đề người dùng đang đề cập hoặc nhắc đến nội dung độc hại", Jonathan Cohen, Phó chủ tịch nghiên cứu ứng dụng của Nvidia, nói.

Trong lĩnh vực phần cứng, Nvidia hiện chiếm hơn 95% thị trường chip đào tạo AI và đang cung cấp hàng nghìn bộ xử lý đồ họa cần thiết để xây dựng những siêu AI như ChatGPT.

Theo tạp chí Điện tử và Ứng dụng

Tags:

#NeMo Guardrails

#Công nghệ AI

Tin cùng chuyên mục

Bộ Nông nghiệp và Môi trường quyết liệt đẩy nhanh thực hiện Nghị quyết 57-NQ/TW

Gala chương trình 'Trường học không ma túy' Mùa 3 năm 2025: Hành trình kiến tạo tương lai của Gen Z Việt Nam

Phụ nữ trong thời đại chuyển đổi số và cách mạng công nghiệp lần thứ 4

Hà Nội tổ chức Liên hoan Ẩm thực - Du lịch làng nghề, phố nghề 2025 tại phố đi bộ Trịnh Công Sơn

Hãy để tuổi trẻ của chúng ta để lại dấu ấn, để khi nhìn lại mỗi người đều có thể tự hào

Văn hóa Việt ghi dấu mạnh mẽ trên các hạng mục tìm kiếm của Google trong năm qua

Chuyên gia RMIT cảnh báo nguy cơ tổn thương tâm lý từ nội dung thiếu kiểm chứng trên mạng

Việt Nam dự kiến siết chặt quy chuẩn trung tâm dữ liệu

Giải Bóng rổ Sinh viên Việt Nam mùa hai mở rộng quy mô, tạo sân chơi lớn cho tài năng trẻ

Photo Hanoi’25: Hơn 200.000 lượt tham gia, khẳng định Hà Nội là điểm hẹn nhiếp ảnh quốc tế

Hơn 120 doanh nhân dự Giải Golf Hữu nghị Việt - Trung 2025

Số ca cấp cứu liên quan đến thuốc lá điện tử, nung nóng giảm 70% sau lệnh cấm

Tin mới cập nhật

Hơn 400 doanh nghiệp từ 22 quốc gia tham gia chuỗi Triển lãm quốc tế công nghiệp 2026

BYD M9: 'Kẻ thách thức' mới của phân khúc MPV hạng sang Việt Nam

Microsoft rót 17,5 tỷ đô la vào hạ tầng AI Ấn Độ

Bộ Nông nghiệp và Môi trường quyết liệt đẩy nhanh thực hiện Nghị quyết 57-NQ/TW

BYD SEAL: Mẫu Sedan điện phong cách thể thao thế hệ mới

Lộ diện gương mặt sinh viên giành học bổng toàn phần Vice-Chancellor’s ASEAN Awards

‘Lon nước ngọt’ phát nhạc mang tên JBL Grip

Gala chương trình 'Trường học không ma túy' Mùa 3 năm 2025: Hành trình kiến tạo tương lai của Gen Z Việt Nam

Đại học Bách khoa Hà Nội và Huawei Việt Nam ký kết biên bản ghi nhớ

VinaPhone tung loạt ưu đãi cho khách hàng thân thiết

LocknLock Brand Day trở lại dịp Giáng sinh: ưu đãi đến 70%++ tại Long Hậu và Bắc Ninh

FPT hợp tác toàn diện cùng NovaGroup

Tin đọc nhiều

Gala chương trình 'Trường học không ma túy' Mùa 3 năm 2025: Hành trình kiến tạo tương lai của Gen Z Việt Nam

Phụ nữ trong thời đại chuyển đổi số và cách mạng công nghiệp lần thứ 4

Hà Nội tổ chức Liên hoan Ẩm thực - Du lịch làng nghề, phố nghề 2025 tại phố đi bộ Trịnh Công Sơn

Hãy để tuổi trẻ của chúng ta để lại dấu ấn, để khi nhìn lại mỗi người đều có thể tự hào

Văn hóa Việt ghi dấu mạnh mẽ trên các hạng mục tìm kiếm của Google trong năm qua

Chuyên gia RMIT cảnh báo nguy cơ tổn thương tâm lý từ nội dung thiếu kiểm chứng trên mạng

Việt Nam dự kiến siết chặt quy chuẩn trung tâm dữ liệu

Giải Bóng rổ Sinh viên Việt Nam mùa hai mở rộng quy mô, tạo sân chơi lớn cho tài năng trẻ

Việt Nam triển khai mô hình một cổng dịch vụ công toàn quốc từ 1/7

VieON với nội dung giải trí trực tuyến chất lượng cao và chiến lược thanh toán không dùng tiền mặt

Video xem nhiều

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Thông điệp lan tỏa mùa dịch COVID-19

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Làm thế nào để nâng cao tương tác giữa loa và phòng nghe hiệu quả

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Chiếc điều hòa cá nhân này của Sony là tất cả những gì bạn cần để sống sót qua mùa hè nóng nực

Những gì bạn muốn biết về 5G

5G thay đổi tương lai của bạn như thế nào?

Xu hướng đọc Bình luận

Bàn về tầm nhìn và các trụ cột của công nghệ thông tin di động 6G

04/03/2022

Chip xử lý A15 Bionic của Apple có gì mới

15/09/2021

Sex Education mùa 3 được Netflix công chiếu vào 17/9

14/09/2021

iPhone 13 không thay đổi nhiều về ngoại hình, camera được nâng cấp mạnh

13/09/2021

Cách xem trực tiếp sự kiện ra mắt iPhone 13 và Apple Watch 7

10/09/2021

VNEID của Bộ Công an khác các ứng dụng đang được vận hành?

10/09/2021

'Cái tôi' thời 4.0 và tính hai mặt của mạng xã hội

04/09/2021

'Muôn màu' cảm xúc của trẻ trong ngày khai giảng online

24/08/2021

Chủ tịch Chu Ngọc Anh giải toả 'ách tắc' về Giấy đi đường cho người dân Thủ đô

10/08/2021

Hàng loạt Macbook M1 tự dưng vỡ màn hình, Apple có đồng ý bảo hành?

02/08/2021

6 bộ phim hay nhất để xem trên VieON

29/01/2021

Bắc Ninh: Không ký kết triển khai dự án Owifi 5G với CSE Singapore

27/06/2020

Bị World Bank cấm dự thầu 7 năm, công ty Sao Bắc Đẩu thừa nhận sai sót

27/06/2020

Wefinex - Mô hình hoạt động đa cấp "đội lốt" đầu tài chính trên mạng internet

10/06/2020

Khai trừ MISA khỏi Câu lạc bộ Chữ ký số và Giao dịch điện tử Việt Nam

27/05/2020

Chuyển đổi số - Nên hiểu như thế nào cho đúng

25/05/2020

Chống thất thu thuế là thách thức lớn đối với nền kinh tế số

29/04/2020

Cách chuyển tập tin sang máy tính mới

10/11/2019

VNPT, MobiFone, VTC sẽ hoàn thành cổ phần hóa trước năm 2021

20/08/2019

5G thay đổi tương lai của bạn như thế nào?

26/07/2019

Nhận diện hành vi lừa đảo trên không gian mạng

25/07/2019

Truyền hình OTT - Hướng đi mới của các “nhà Đài”

24/07/2019

Tạp chí Điện tử ngày nay, Tin tức, Sự kiện, Viễn thông, Công nghệ thông tin - dientungaynay.vn