Chatbot Claude - AI hoạt động có khuôn khổ đạo đức đầu tiên của giới công nghệ

Ninh Gia
18/05/2023 08:00
D

Là hãng công nghệ đi sau nhưng lại muốn cạnh tranh với ứng dụng đang "làm mưa làm gió" trên thị trường trí tuệ nhân tạo (AI), Anthropic đã tiếp cận vấn đề từ các quy định về đạo đức để định hình sản phẩm chatbot Claude hứa hẹn sẽ tạo sự khác biệt với người dùng cũng như các quốc gia mà ứng dụng này hiện hữu.

Theo đó, công ty khởi nghiệp về AI Anthropic đã công bố văn bản tập hợp các giá trị đạo đức đã được sử dụng để đào tạo và đảm bảo an toàn cho chatbot Claude - đối thủ của phần mềm đang “làm mưa làm gió” ChatGPT.

Văn bản giá trị đạo đức mà Anthropic gọi là “hiến pháp Claude”, được hình thành từ một số nguồn, trong đó có Tuyên bố về Nhân quyền của Liên hợp quốc và các quy tắc bảo mật dữ liệu của Apple.

Đa số các chatbot AI đều dựa vào phản hồi từ nhân viên trong quá trình đào tạo, từ đó sẽ đánh giá và xếp hạng các phản hồi gây hại hoặc khó chịu. Tuy nhiên, những hệ thống này có thể gặp khó khăn trong việc dự đoán các câu hỏi và câu trả lời, vì vậy thường có xu hướng tránh nhắc đến một số chủ đề có khả năng gây tranh cãi như chính trị và chủng tộc.

Chatbot Claude là ứng dụng được nghiên cứu và phát triển bởi các cựu nhân viên của OpenAI
Chatbot Claude là ứng dụng được nghiên cứu và phát triển bởi các cựu nhân viên của OpenAI.

Đối với Anthropic, chatbot Claude được huấn luyện theo một cách khác, khi dựa trên tập hợp các giá trị đạo đức có sẵn để đưa ra quyết định về cách trả lời câu hỏi.

Những giá trị này bao gồm việc phản đối các hành vi và ngôn ngữ tra tấn, tàn ác, liên quan đến nô lệ, đối xử vô nhân đạo hay hạ thấp nhân phẩm con người. Chatbot Claude cũng được thiết lập để tránh các câu trả lời bị coi là xúc phạm đến bất kỳ truyền thống hay nền văn hóa nào.

Trong một cuộc phỏng vấn, người đồng sáng lập Anthropic, ông Jack Clark cho biết “hiến pháp Claude” có thể được sửa đổi để cân bằng, vừa cung cấp các câu trả lời hữu ích và đáng tin cậy, vừa không gây khó chịu.

Ông dự đoán các giá trị AI “hợp hiến” như “hiến pháp Claude” sẽ sớm thu hút sự quan tâm của các chính trị gia trong các cuộc thảo luận trong tương lai về AI, vì các giá trị này có thể được viết ra một cách dễ dàng.

Anthropic là công ty công nghệ do các cựu giám đốc điều hành của OpenAI - “cha đẻ” của ChatGPT thành lập và được tập đoàn Alphabet đầu tư. Các nhà sáng lập Anthropic đang hướng tới việc tạo ra một hệ thống AI an toàn, không chứa các nội dung độc hại như cách chế tạo vũ khí hay sử dụng ngôn ngữ phân biệt chủng tộc.

Giới chức Mỹ ưu tiên xem xét về vấn đề an toàn khi nghiên cứu về cách kiểm soát AI. Tổng thống Mỹ Joe Biden cho rằng các công ty AI phải có nghĩa vụ đảm bảo hệ thống của họ an toàn trước khi giới thiệu với công chúng.

Người đồng sáng lập Anthropic, ông Dario Amodei là một trong số các giám đốc điều hành AI đã gặp Tổng thống Biden vào tuần trước để thảo luận về những nguy cơ tiềm ẩn của công nghệ này.

Theo tạp chí Điện tử và Ứng dụng

Bình luận

Tối thiểu 10 chữ Tiếng việt có dấu Không chứa liên kết

Gửi bình luận

Tin cùng chuyên mục

Keysight nâng cao năng lực sẵn sàng chiến đấu cho đơn vị FORACS của NATO

Keysight nâng cao năng lực sẵn sàng chiến đấu cho đơn vị FORACS của NATO

30% mã nguồn Microsoft do AI tạo ra: Lập trình viên sẽ bị thay thế?

30% mã nguồn Microsoft do AI tạo ra: Lập trình viên sẽ bị thay thế?

Thực hư gói Starlink miễn phí? Chi tiết ưu đãi thiết bị internet vệ tinh Starlink

Thực hư gói Starlink miễn phí? Chi tiết ưu đãi thiết bị internet vệ tinh Starlink

MobiFone cán mốc 2,5 triệu người dùng 5G

MobiFone cán mốc 2,5 triệu người dùng 5G

Startup Việt ra mắt hệ sinh thái Loca AI: giải pháp giao tiếp toàn cầu cho người Việt

Startup Việt ra mắt hệ sinh thái Loca AI: giải pháp giao tiếp toàn cầu cho người Việt

realme 14 Series sẽ là điện thoại đầu tiên được trang bị chip Snapdragon 6 Gen 4

realme 14 Series sẽ là điện thoại đầu tiên được trang bị chip Snapdragon 6 Gen 4

Ứng dụng của bộ khuếch đại quang học băng thông rộng trong y tế

Ứng dụng của bộ khuếch đại quang học băng thông rộng trong y tế

Keysight ra mắt nền tảng INPT-1600GE và phần mềm xác nhận hiệu năng kết nối mạng

Keysight ra mắt nền tảng INPT-1600GE và phần mềm xác nhận hiệu năng kết nối mạng

Phát triển công nghệ 6G: Xây dựng chiến lược và lộ trình

Phát triển công nghệ 6G: Xây dựng chiến lược và lộ trình

Keysight cách mạng hóa quá trình đo kiểm thu phát quang cho các trung tâm dữ liệu AI

Keysight cách mạng hóa quá trình đo kiểm thu phát quang cho các trung tâm dữ liệu AI

Roborock Saros Z70 ‘gập Công nghệ, mở Tương lai’

Roborock Saros Z70 ‘gập Công nghệ, mở Tương lai’

Sony WH-1000XM5 Hồng Khói: bản hòa tấu của sắc màu và âm thanh

Sony WH-1000XM5 Hồng Khói: bản hòa tấu của sắc màu và âm thanh

Tin mới cập nhật

Thách thức quản lý nhiệt và năng lượng trong hệ thống AI hiện đại

Thách thức quản lý nhiệt và năng lượng trong hệ thống AI hiện đại

Trình luật tổ chức mô hình tòa án mới: Bỏ cấp cao và cấp huyện, sẽ có tòa phá sản, sở hữu trí tuệ

Trình luật tổ chức mô hình tòa án mới: Bỏ cấp cao và cấp huyện, sẽ có tòa phá sản, sở hữu trí tuệ

Thông tin xung quanh việc hiệu trưởng gửi ảnh nhạy cảm vào nhóm zalo trường

Thông tin xung quanh việc hiệu trưởng gửi ảnh nhạy cảm vào nhóm zalo trường

Thị trường châu Á - Thái Bình Dương biến động trái chiều sau quyết định giữ nguyên lãi suất của Fed

Thị trường châu Á - Thái Bình Dương biến động trái chiều sau quyết định giữ nguyên lãi suất của Fed

Lý do Microsoft tiếp tục chọn Snapdragon X cho dòng Surface 2025

Lý do Microsoft tiếp tục chọn Snapdragon X cho dòng Surface 2025

TCL C6K QD-Mini LED TV: hơn cả sự phù hợp

TCL C6K QD-Mini LED TV: hơn cả sự phù hợp

ASUS ROG khuấy đảo thị trường laptop gaming bằng loạt sản phẩm mới

ASUS ROG khuấy đảo thị trường laptop gaming bằng loạt sản phẩm mới

Thanh tra xử phạt hàng loạt công ty Dược phẩm

Thanh tra xử phạt hàng loạt công ty Dược phẩm

FBI truy lùng giáo phái kỹ thuật số '764', mối đe dọa mới nhắm vào thanh thiếu niên

FBI truy lùng giáo phái kỹ thuật số '764', mối đe dọa mới nhắm vào thanh thiếu niên

Việt Nam cần định hình lại vị thế công nghệ trong kỷ nguyên mới

Việt Nam cần định hình lại vị thế công nghệ trong kỷ nguyên mới

BYD Việt Nam thu phí 15 triệu đồng sử dụng trọn đời ứng dụng điều khiển xe từ xa

BYD Việt Nam thu phí 15 triệu đồng sử dụng trọn đời ứng dụng điều khiển xe từ xa

VNPT - Viettel kiến nghị loạt vấn đề về gói thầu tại Sân bay Long Thành

VNPT - Viettel kiến nghị loạt vấn đề về gói thầu tại Sân bay Long Thành

Tin đọc nhiều

Keysight nâng cao năng lực sẵn sàng chiến đấu cho đơn vị FORACS của NATO

Keysight nâng cao năng lực sẵn sàng chiến đấu cho đơn vị FORACS của NATO

30% mã nguồn Microsoft do AI tạo ra: Lập trình viên sẽ bị thay thế?

30% mã nguồn Microsoft do AI tạo ra: Lập trình viên sẽ bị thay thế?

Thực hư gói Starlink miễn phí? Chi tiết ưu đãi thiết bị internet vệ tinh Starlink

Thực hư gói Starlink miễn phí? Chi tiết ưu đãi thiết bị internet vệ tinh Starlink

MobiFone cán mốc 2,5 triệu người dùng 5G

MobiFone cán mốc 2,5 triệu người dùng 5G

Startup Việt ra mắt hệ sinh thái Loca AI: giải pháp giao tiếp toàn cầu cho người Việt

Startup Việt ra mắt hệ sinh thái Loca AI: giải pháp giao tiếp toàn cầu cho người Việt

Ứng dụng của bộ khuếch đại quang học băng thông rộng trong y tế

Ứng dụng của bộ khuếch đại quang học băng thông rộng trong y tế

Microchip ra mắt dòng vi điều khiển giá rẻ đáp ứng yêu cầu an toàn cao

Microchip ra mắt dòng vi điều khiển giá rẻ đáp ứng yêu cầu an toàn cao

Keysight giới thiệu giải pháp giả lập và xác định đặc tính pin cho thiết bị IoT

Keysight giới thiệu giải pháp giả lập và xác định đặc tính pin cho thiết bị IoT

Lenovo Legion 5 Pro: Laptop cho game thủ với mức giá tuyệt vời

Lenovo Legion 5 Pro: Laptop cho game thủ với mức giá tuyệt vời

Chip xử lý A15 Bionic của Apple có gì mới

Chip xử lý A15 Bionic của Apple có gì mới

Video xem nhiều

Toàn cảnh xác lập kỷ lục Bản đồ Việt Nam được xếp từ nhiều xe ô tô nhất năm 2022

Toàn cảnh xác lập kỷ lục Bản đồ Việt Nam được xếp từ nhiều xe ô tô nhất năm 2022

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Isuzu Mu-X 2021 hoàn toàn mới: Thiết kế hiện đại và đầy công nghệ

Isuzu Mu-X 2021 hoàn toàn mới: Thiết kế hiện đại và đầy công nghệ

Honda MSX 125 Grom 2021 mẫu xe côn tay phiên bản đường đua

Honda MSX 125 Grom 2021 mẫu xe côn tay phiên bản đường đua

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Geneva Motor Show 2020: Bentley hé lộ siêu xe Bacalar triệu đô

Geneva Motor Show 2020: Bentley hé lộ siêu xe Bacalar triệu đô

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

Làm thế nào để nâng cao tương tác giữa loa và phòng nghe hiệu quả

Làm thế nào để nâng cao tương tác giữa loa và phòng nghe hiệu quả

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Những gì bạn muốn biết về 5G

Những gì bạn muốn biết về 5G

5G thay đổi tương lai của bạn như thế nào?

5G thay đổi tương lai của bạn như thế nào?

Bàn về tầm nhìn và các trụ cột của công nghệ thông tin di động 6G
04/03/2022
Chip xử lý A15 Bionic của Apple có gì mới
15/09/2021
Sex Education mùa 3 được Netflix công chiếu vào 17/9
14/09/2021
iPhone 13 không thay đổi nhiều về ngoại hình, camera được nâng cấp mạnh
13/09/2021
Cách xem trực tiếp sự kiện ra mắt iPhone 13 và Apple Watch 7
10/09/2021
VNEID của Bộ Công an khác các ứng dụng đang được vận hành?
10/09/2021
'Cái tôi' thời 4.0 và tính hai mặt của mạng xã hội
04/09/2021
'Muôn màu' cảm xúc của trẻ trong ngày khai giảng online
24/08/2021
Chủ tịch Chu Ngọc Anh giải toả 'ách tắc' về Giấy đi đường cho người dân Thủ đô
10/08/2021
Hàng loạt Macbook M1 tự dưng vỡ màn hình, Apple có đồng ý bảo hành?
02/08/2021
6 bộ phim hay nhất để xem trên VieON
29/01/2021
Bắc Ninh: Không ký kết triển khai dự án Owifi 5G với CSE Singapore
27/06/2020
Bị World Bank cấm dự thầu 7 năm, công ty Sao Bắc Đẩu thừa nhận sai sót
27/06/2020
Wefinex - Mô hình hoạt động đa cấp "đội lốt" đầu tài chính trên mạng internet
10/06/2020
Khai trừ MISA khỏi Câu lạc bộ Chữ ký số và Giao dịch điện tử Việt Nam
27/05/2020
Chuyển đổi số - Nên hiểu như thế nào cho đúng
25/05/2020
Chống thất thu thuế là thách thức lớn đối với nền kinh tế số
29/04/2020
Cách chuyển tập tin sang máy tính mới
10/11/2019
VNPT, MobiFone, VTC sẽ hoàn thành cổ phần hóa trước năm 2021
20/08/2019
5G thay đổi tương lai của bạn như thế nào?
26/07/2019
Nhận diện hành vi lừa đảo trên không gian mạng
25/07/2019
Truyền hình OTT - Hướng đi mới của các “nhà Đài”
24/07/2019