Chatbot Claude - AI hoạt động có khuôn khổ đạo đức đầu tiên của giới công nghệ

Ninh Gia
18/05/2023 08:00
D

Là hãng công nghệ đi sau nhưng lại muốn cạnh tranh với ứng dụng đang "làm mưa làm gió" trên thị trường trí tuệ nhân tạo (AI), Anthropic đã tiếp cận vấn đề từ các quy định về đạo đức để định hình sản phẩm chatbot Claude hứa hẹn sẽ tạo sự khác biệt với người dùng cũng như các quốc gia mà ứng dụng này hiện hữu.

Theo đó, công ty khởi nghiệp về AI Anthropic đã công bố văn bản tập hợp các giá trị đạo đức đã được sử dụng để đào tạo và đảm bảo an toàn cho chatbot Claude - đối thủ của phần mềm đang “làm mưa làm gió” ChatGPT.

Văn bản giá trị đạo đức mà Anthropic gọi là “hiến pháp Claude”, được hình thành từ một số nguồn, trong đó có Tuyên bố về Nhân quyền của Liên hợp quốc và các quy tắc bảo mật dữ liệu của Apple.

Đa số các chatbot AI đều dựa vào phản hồi từ nhân viên trong quá trình đào tạo, từ đó sẽ đánh giá và xếp hạng các phản hồi gây hại hoặc khó chịu. Tuy nhiên, những hệ thống này có thể gặp khó khăn trong việc dự đoán các câu hỏi và câu trả lời, vì vậy thường có xu hướng tránh nhắc đến một số chủ đề có khả năng gây tranh cãi như chính trị và chủng tộc.

Chatbot Claude là ứng dụng được nghiên cứu và phát triển bởi các cựu nhân viên của OpenAI
Chatbot Claude là ứng dụng được nghiên cứu và phát triển bởi các cựu nhân viên của OpenAI.

Đối với Anthropic, chatbot Claude được huấn luyện theo một cách khác, khi dựa trên tập hợp các giá trị đạo đức có sẵn để đưa ra quyết định về cách trả lời câu hỏi.

Những giá trị này bao gồm việc phản đối các hành vi và ngôn ngữ tra tấn, tàn ác, liên quan đến nô lệ, đối xử vô nhân đạo hay hạ thấp nhân phẩm con người. Chatbot Claude cũng được thiết lập để tránh các câu trả lời bị coi là xúc phạm đến bất kỳ truyền thống hay nền văn hóa nào.

Trong một cuộc phỏng vấn, người đồng sáng lập Anthropic, ông Jack Clark cho biết “hiến pháp Claude” có thể được sửa đổi để cân bằng, vừa cung cấp các câu trả lời hữu ích và đáng tin cậy, vừa không gây khó chịu.

Ông dự đoán các giá trị AI “hợp hiến” như “hiến pháp Claude” sẽ sớm thu hút sự quan tâm của các chính trị gia trong các cuộc thảo luận trong tương lai về AI, vì các giá trị này có thể được viết ra một cách dễ dàng.

Anthropic là công ty công nghệ do các cựu giám đốc điều hành của OpenAI - “cha đẻ” của ChatGPT thành lập và được tập đoàn Alphabet đầu tư. Các nhà sáng lập Anthropic đang hướng tới việc tạo ra một hệ thống AI an toàn, không chứa các nội dung độc hại như cách chế tạo vũ khí hay sử dụng ngôn ngữ phân biệt chủng tộc.

Giới chức Mỹ ưu tiên xem xét về vấn đề an toàn khi nghiên cứu về cách kiểm soát AI. Tổng thống Mỹ Joe Biden cho rằng các công ty AI phải có nghĩa vụ đảm bảo hệ thống của họ an toàn trước khi giới thiệu với công chúng.

Người đồng sáng lập Anthropic, ông Dario Amodei là một trong số các giám đốc điều hành AI đã gặp Tổng thống Biden vào tuần trước để thảo luận về những nguy cơ tiềm ẩn của công nghệ này.

Theo tạp chí Điện tử và Ứng dụng

Bình luận

Tối thiểu 10 chữ Tiếng việt có dấu Không chứa liên kết

Gửi bình luận

Tin cùng chuyên mục

Công nghệ VR mang Hoàng cung Huế trở lại với công chúng

Công nghệ VR mang Hoàng cung Huế trở lại với công chúng

Keysight tăng cường độ chính xác và tin cậy bằng các giải pháp Smart Bench Essentials Plus

Keysight tăng cường độ chính xác và tin cậy bằng các giải pháp Smart Bench Essentials Plus

Keysight và NIO tiên phong trong lĩnh vực xe điện thông minh thế hệ mới

Keysight và NIO tiên phong trong lĩnh vực xe điện thông minh thế hệ mới

Sam Altman mang công nghệ quét mống mắt gây tranh cãi đến Vương Quốc Anh

Sam Altman mang công nghệ quét mống mắt gây tranh cãi đến Vương Quốc Anh

Keysight mở rộng hỗ trợ tiêu chuẩn USB trong System Designer for USB

Keysight mở rộng hỗ trợ tiêu chuẩn USB trong System Designer for USB

Tin công nghệ: Xiaomi TV A Pro Series 2026 có gì khác biệt so với dòng TV A Series 2026

Tin công nghệ: Xiaomi TV A Pro Series 2026 có gì khác biệt so với dòng TV A Series 2026

Muốn bắt kịp kỷ nguyên AI, đừng bỏ qua ngành kỹ thuật phần mềm

Muốn bắt kịp kỷ nguyên AI, đừng bỏ qua ngành kỹ thuật phần mềm

Mở rộng hạ tầng cho kỷ nguyên AI

Mở rộng hạ tầng cho kỷ nguyên AI

Keysight nâng cao năng lực sẵn sàng chiến đấu cho đơn vị FORACS của NATO

Keysight nâng cao năng lực sẵn sàng chiến đấu cho đơn vị FORACS của NATO

30% mã nguồn Microsoft do AI tạo ra: Lập trình viên sẽ bị thay thế?

30% mã nguồn Microsoft do AI tạo ra: Lập trình viên sẽ bị thay thế?

Thực hư gói Starlink miễn phí? Chi tiết ưu đãi thiết bị internet vệ tinh Starlink

Thực hư gói Starlink miễn phí? Chi tiết ưu đãi thiết bị internet vệ tinh Starlink

MobiFone cán mốc 2,5 triệu người dùng 5G

MobiFone cán mốc 2,5 triệu người dùng 5G

Tin mới cập nhật

VNPT làm chủ hạ tầng kết nối

VNPT làm chủ hạ tầng kết nối

Hà Nội: Một xã đặt mục tiêu thu nhập bình quân đầu người đạt từ 120 triệu đồng/năm vào năm 2030

Hà Nội: Một xã đặt mục tiêu thu nhập bình quân đầu người đạt từ 120 triệu đồng/năm vào năm 2030

Hà Nội tổ chức không gian giới thiệu du lịch tại World Expo 2025

Hà Nội tổ chức không gian giới thiệu du lịch tại World Expo 2025

GS.TSKH Ngô Bảo Châu: Sân chơi toán học giúp học sinh thích ứng với AI

GS.TSKH Ngô Bảo Châu: Sân chơi toán học giúp học sinh thích ứng với AI

Lộ diện 3 ứng viên Việt Nam tranh vương miện Hoa hậu - Nam vương Cộng hòa Liên lục địa Quốc tế 2025

Lộ diện 3 ứng viên Việt Nam tranh vương miện Hoa hậu - Nam vương Cộng hòa Liên lục địa Quốc tế 2025

ChatGPT giới thiệu chế độ học tập giúp học sinh có gia sư trực tuyến 24/7

ChatGPT giới thiệu chế độ học tập giúp học sinh có gia sư trực tuyến 24/7

Yêu cầu cấp thiết bảo đảm an toàn cho Blockchain Việt Nam

Yêu cầu cấp thiết bảo đảm an toàn cho Blockchain Việt Nam

TikTok một thời làm rung chuyển thế giới, giờ AI Trung Quốc sắp làm điều tương tự

TikTok một thời làm rung chuyển thế giới, giờ AI Trung Quốc sắp làm điều tương tự

Thủ tướng: Chậm nhất tới 2027 phải thiết kế, chế tạo, kiểm thử một số chíp bán dẫn cần thiết

Thủ tướng: Chậm nhất tới 2027 phải thiết kế, chế tạo, kiểm thử một số chíp bán dẫn cần thiết

Hướng dẫn cài đặt và gỡ 'Mã khóa màn hình Zalo'

Hướng dẫn cài đặt và gỡ 'Mã khóa màn hình Zalo'

Cần tư duy mới cho cuộc cách mạng năng lượng

Cần tư duy mới cho cuộc cách mạng năng lượng

Chip AI H20 của Nvidia bị giám sát gắt gao từ Trung Quốc vì lo ngại theo dõi và bảo mật

Chip AI H20 của Nvidia bị giám sát gắt gao từ Trung Quốc vì lo ngại theo dõi và bảo mật

Tin đọc nhiều

Keysight tăng cường độ chính xác và tin cậy bằng các giải pháp Smart Bench Essentials Plus

Keysight tăng cường độ chính xác và tin cậy bằng các giải pháp Smart Bench Essentials Plus

Sam Altman mang công nghệ quét mống mắt gây tranh cãi đến Vương Quốc Anh

Sam Altman mang công nghệ quét mống mắt gây tranh cãi đến Vương Quốc Anh

MobiFone cán mốc 2,5 triệu người dùng 5G

MobiFone cán mốc 2,5 triệu người dùng 5G

Sony WH-1000XM5 Hồng Khói: bản hòa tấu của sắc màu và âm thanh

Sony WH-1000XM5 Hồng Khói: bản hòa tấu của sắc màu và âm thanh

Samsung 990 EVO Plus chính thức có mặt tại Việt Nam

Samsung 990 EVO Plus chính thức có mặt tại Việt Nam

Kingston Fury Renegade DDR4-4600 RGB CL19: lựa chọn đáng giá cho người dùng chuyên nghiệp

Kingston Fury Renegade DDR4-4600 RGB CL19: lựa chọn đáng giá cho người dùng chuyên nghiệp

Keysight giới thiệu giải pháp giả lập và xác định đặc tính pin cho thiết bị IoT

Keysight giới thiệu giải pháp giả lập và xác định đặc tính pin cho thiết bị IoT

Chip xử lý A15 Bionic của Apple có gì mới

Chip xử lý A15 Bionic của Apple có gì mới

Cặp đôi Honor Tablet 6 và X6 đã chính thức được ra mắt với giá siêu rẻ

Cặp đôi Honor Tablet 6 và X6 đã chính thức được ra mắt với giá siêu rẻ

Xuất hiện ứng dụng FaceApp giả mạo chuyên cài cắm mã độc

Xuất hiện ứng dụng FaceApp giả mạo chuyên cài cắm mã độc

Video xem nhiều

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Honda MSX 125 Grom 2021 mẫu xe côn tay phiên bản đường đua

Honda MSX 125 Grom 2021 mẫu xe côn tay phiên bản đường đua

Thông điệp lan tỏa mùa dịch COVID-19

Thông điệp lan tỏa mùa dịch COVID-19

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

Một ngày trải nghiệm giấc mơ trở thành tay đua F1 chuyên nghiệp ở Nhật Bản

Một ngày trải nghiệm giấc mơ trở thành tay đua F1 chuyên nghiệp ở Nhật Bản

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Khám phá Huawei Mate X đối thủ của Galaxy Fold tại IFA 2019

Khám phá Huawei Mate X đối thủ của Galaxy Fold tại IFA 2019

Chiếc điều hòa cá nhân này của Sony là tất cả những gì bạn cần để sống sót qua mùa hè nóng nực

Chiếc điều hòa cá nhân này của Sony là tất cả những gì bạn cần để sống sót qua mùa hè nóng nực

5G thay đổi tương lai của bạn như thế nào?

5G thay đổi tương lai của bạn như thế nào?

Bàn về tầm nhìn và các trụ cột của công nghệ thông tin di động 6G
04/03/2022
Chip xử lý A15 Bionic của Apple có gì mới
15/09/2021
Sex Education mùa 3 được Netflix công chiếu vào 17/9
14/09/2021
iPhone 13 không thay đổi nhiều về ngoại hình, camera được nâng cấp mạnh
13/09/2021
Cách xem trực tiếp sự kiện ra mắt iPhone 13 và Apple Watch 7
10/09/2021
VNEID của Bộ Công an khác các ứng dụng đang được vận hành?
10/09/2021
'Cái tôi' thời 4.0 và tính hai mặt của mạng xã hội
04/09/2021
'Muôn màu' cảm xúc của trẻ trong ngày khai giảng online
24/08/2021
Chủ tịch Chu Ngọc Anh giải toả 'ách tắc' về Giấy đi đường cho người dân Thủ đô
10/08/2021
Hàng loạt Macbook M1 tự dưng vỡ màn hình, Apple có đồng ý bảo hành?
02/08/2021
6 bộ phim hay nhất để xem trên VieON
29/01/2021
Bắc Ninh: Không ký kết triển khai dự án Owifi 5G với CSE Singapore
27/06/2020
Bị World Bank cấm dự thầu 7 năm, công ty Sao Bắc Đẩu thừa nhận sai sót
27/06/2020
Wefinex - Mô hình hoạt động đa cấp "đội lốt" đầu tài chính trên mạng internet
10/06/2020
Khai trừ MISA khỏi Câu lạc bộ Chữ ký số và Giao dịch điện tử Việt Nam
27/05/2020
Chuyển đổi số - Nên hiểu như thế nào cho đúng
25/05/2020
Chống thất thu thuế là thách thức lớn đối với nền kinh tế số
29/04/2020
Cách chuyển tập tin sang máy tính mới
10/11/2019
VNPT, MobiFone, VTC sẽ hoàn thành cổ phần hóa trước năm 2021
20/08/2019
5G thay đổi tương lai của bạn như thế nào?
26/07/2019
Nhận diện hành vi lừa đảo trên không gian mạng
25/07/2019
Truyền hình OTT - Hướng đi mới của các “nhà Đài”
24/07/2019