Chatbot Claude - AI hoạt động có khuôn khổ đạo đức đầu tiên của giới công nghệ

Ninh Gia
18/05/2023 08:00
D

Là hãng công nghệ đi sau nhưng lại muốn cạnh tranh với ứng dụng đang "làm mưa làm gió" trên thị trường trí tuệ nhân tạo (AI), Anthropic đã tiếp cận vấn đề từ các quy định về đạo đức để định hình sản phẩm chatbot Claude hứa hẹn sẽ tạo sự khác biệt với người dùng cũng như các quốc gia mà ứng dụng này hiện hữu.

Theo đó, công ty khởi nghiệp về AI Anthropic đã công bố văn bản tập hợp các giá trị đạo đức đã được sử dụng để đào tạo và đảm bảo an toàn cho chatbot Claude - đối thủ của phần mềm đang “làm mưa làm gió” ChatGPT.

Văn bản giá trị đạo đức mà Anthropic gọi là “hiến pháp Claude”, được hình thành từ một số nguồn, trong đó có Tuyên bố về Nhân quyền của Liên hợp quốc và các quy tắc bảo mật dữ liệu của Apple.

Đa số các chatbot AI đều dựa vào phản hồi từ nhân viên trong quá trình đào tạo, từ đó sẽ đánh giá và xếp hạng các phản hồi gây hại hoặc khó chịu. Tuy nhiên, những hệ thống này có thể gặp khó khăn trong việc dự đoán các câu hỏi và câu trả lời, vì vậy thường có xu hướng tránh nhắc đến một số chủ đề có khả năng gây tranh cãi như chính trị và chủng tộc.

Chatbot Claude là ứng dụng được nghiên cứu và phát triển bởi các cựu nhân viên của OpenAI
Chatbot Claude là ứng dụng được nghiên cứu và phát triển bởi các cựu nhân viên của OpenAI.

Đối với Anthropic, chatbot Claude được huấn luyện theo một cách khác, khi dựa trên tập hợp các giá trị đạo đức có sẵn để đưa ra quyết định về cách trả lời câu hỏi.

Những giá trị này bao gồm việc phản đối các hành vi và ngôn ngữ tra tấn, tàn ác, liên quan đến nô lệ, đối xử vô nhân đạo hay hạ thấp nhân phẩm con người. Chatbot Claude cũng được thiết lập để tránh các câu trả lời bị coi là xúc phạm đến bất kỳ truyền thống hay nền văn hóa nào.

Trong một cuộc phỏng vấn, người đồng sáng lập Anthropic, ông Jack Clark cho biết “hiến pháp Claude” có thể được sửa đổi để cân bằng, vừa cung cấp các câu trả lời hữu ích và đáng tin cậy, vừa không gây khó chịu.

Ông dự đoán các giá trị AI “hợp hiến” như “hiến pháp Claude” sẽ sớm thu hút sự quan tâm của các chính trị gia trong các cuộc thảo luận trong tương lai về AI, vì các giá trị này có thể được viết ra một cách dễ dàng.

Anthropic là công ty công nghệ do các cựu giám đốc điều hành của OpenAI - “cha đẻ” của ChatGPT thành lập và được tập đoàn Alphabet đầu tư. Các nhà sáng lập Anthropic đang hướng tới việc tạo ra một hệ thống AI an toàn, không chứa các nội dung độc hại như cách chế tạo vũ khí hay sử dụng ngôn ngữ phân biệt chủng tộc.

Giới chức Mỹ ưu tiên xem xét về vấn đề an toàn khi nghiên cứu về cách kiểm soát AI. Tổng thống Mỹ Joe Biden cho rằng các công ty AI phải có nghĩa vụ đảm bảo hệ thống của họ an toàn trước khi giới thiệu với công chúng.

Người đồng sáng lập Anthropic, ông Dario Amodei là một trong số các giám đốc điều hành AI đã gặp Tổng thống Biden vào tuần trước để thảo luận về những nguy cơ tiềm ẩn của công nghệ này.

Theo tạp chí Điện tử và Ứng dụng

Bình luận

Tối thiểu 10 chữ Tiếng việt có dấu Không chứa liên kết

Gửi bình luận

Tin cùng chuyên mục

Sam Altman mang công nghệ quét mống mắt gây tranh cãi đến Vương Quốc Anh

Sam Altman mang công nghệ quét mống mắt gây tranh cãi đến Vương Quốc Anh

Keysight mở rộng hỗ trợ tiêu chuẩn USB trong System Designer for USB

Keysight mở rộng hỗ trợ tiêu chuẩn USB trong System Designer for USB

Tin công nghệ: Xiaomi TV A Pro Series 2026 có gì khác biệt so với dòng TV A Series 2026

Tin công nghệ: Xiaomi TV A Pro Series 2026 có gì khác biệt so với dòng TV A Series 2026

Muốn bắt kịp kỷ nguyên AI, đừng bỏ qua ngành kỹ thuật phần mềm

Muốn bắt kịp kỷ nguyên AI, đừng bỏ qua ngành kỹ thuật phần mềm

Mở rộng hạ tầng cho kỷ nguyên AI

Mở rộng hạ tầng cho kỷ nguyên AI

Keysight nâng cao năng lực sẵn sàng chiến đấu cho đơn vị FORACS của NATO

Keysight nâng cao năng lực sẵn sàng chiến đấu cho đơn vị FORACS của NATO

30% mã nguồn Microsoft do AI tạo ra: Lập trình viên sẽ bị thay thế?

30% mã nguồn Microsoft do AI tạo ra: Lập trình viên sẽ bị thay thế?

Thực hư gói Starlink miễn phí? Chi tiết ưu đãi thiết bị internet vệ tinh Starlink

Thực hư gói Starlink miễn phí? Chi tiết ưu đãi thiết bị internet vệ tinh Starlink

MobiFone cán mốc 2,5 triệu người dùng 5G

MobiFone cán mốc 2,5 triệu người dùng 5G

Startup Việt ra mắt hệ sinh thái Loca AI: giải pháp giao tiếp toàn cầu cho người Việt

Startup Việt ra mắt hệ sinh thái Loca AI: giải pháp giao tiếp toàn cầu cho người Việt

realme 14 Series sẽ là điện thoại đầu tiên được trang bị chip Snapdragon 6 Gen 4

realme 14 Series sẽ là điện thoại đầu tiên được trang bị chip Snapdragon 6 Gen 4

Ứng dụng của bộ khuếch đại quang học băng thông rộng trong y tế

Ứng dụng của bộ khuếch đại quang học băng thông rộng trong y tế

Tin mới cập nhật

Nhà mạng Hutchison công bố chiến lược tạo doanh thu từ 5G

Nhà mạng Hutchison công bố chiến lược tạo doanh thu từ 5G

Tên lửa tái sử dụng Trung Quốc sắp bắt kịp SpaceX

Tên lửa tái sử dụng Trung Quốc sắp bắt kịp SpaceX

L’Oréal khởi động chiến dịch 'Tái nạp đầy, cùng nhau' thúc đẩy tiêu dùng bền vững

L’Oréal khởi động chiến dịch 'Tái nạp đầy, cùng nhau' thúc đẩy tiêu dùng bền vững

Tổng Bí thư Tô Lâm: Báo chí cách mạng phải trở thành lực lượng kiến tạo niềm tin trong kỷ nguyên mới

Tổng Bí thư Tô Lâm: Báo chí cách mạng phải trở thành lực lượng kiến tạo niềm tin trong kỷ nguyên mới

LG và Điện Máy Xanh hợp tác chiến lược

LG và Điện Máy Xanh hợp tác chiến lược

OPPO ra mắt OPPO A5x với giá chỉ từ 3.690.000 đồng

OPPO ra mắt OPPO A5x với giá chỉ từ 3.690.000 đồng

Sony WH-1000XM6 ra mắt với công nghệ chống ồn AI, âm thanh phòng thu chuẩn Hollywood

Sony WH-1000XM6 ra mắt với công nghệ chống ồn AI, âm thanh phòng thu chuẩn Hollywood

Báo chí Việt Nam bước vào kỷ nguyên mới với sứ mệnh chuyển đổi số và phục vụ nhân dân

Báo chí Việt Nam bước vào kỷ nguyên mới với sứ mệnh chuyển đổi số và phục vụ nhân dân

Công ty Xi măng Long Sơn từ lịch sử hướng tương lai

Công ty Xi măng Long Sơn từ lịch sử hướng tương lai

OpenAI giành được hợp đồng quốc phòng trị giá 200 triệu đô la của Mỹ

OpenAI giành được hợp đồng quốc phòng trị giá 200 triệu đô la của Mỹ

Bắt nạt học đường thời AI: Nguy cơ và cảnh báo dành cho Việt Nam

Bắt nạt học đường thời AI: Nguy cơ và cảnh báo dành cho Việt Nam

Vibe Coding: Khi lập trình cần nhiều hơn kỹ thuật

Vibe Coding: Khi lập trình cần nhiều hơn kỹ thuật

Tin đọc nhiều

Fujifilm ra mắt máy ảnh KTS không gương lật "FUJIFILM X-S20"

Fujifilm ra mắt máy ảnh KTS không gương lật "FUJIFILM X-S20"

MediaTek ra mắt nền tảng mới dành cho xe hơi Dimensity Auto

MediaTek ra mắt nền tảng mới dành cho xe hơi Dimensity Auto

Seagate IronWolf Pro 22TB: ổ cứng hiệu suất cao và đáng tin cậy hàng đầu 

Seagate IronWolf Pro 22TB: ổ cứng hiệu suất cao và đáng tin cậy hàng đầu 

Keysight giới thiệu giải pháp giả lập và xác định đặc tính pin cho thiết bị IoT

Keysight giới thiệu giải pháp giả lập và xác định đặc tính pin cho thiết bị IoT

Lenovo Legion 5 Pro: Laptop cho game thủ với mức giá tuyệt vời

Lenovo Legion 5 Pro: Laptop cho game thủ với mức giá tuyệt vời

Qũy hỗ trợ mới của ADB giúp Đông Nam Á phục hồi du lịch

Qũy hỗ trợ mới của ADB giúp Đông Nam Á phục hồi du lịch

Chip xử lý A15 Bionic của Apple có gì mới

Chip xử lý A15 Bionic của Apple có gì mới

Cặp đôi Honor Tablet 6 và X6 đã chính thức được ra mắt với giá siêu rẻ

Cặp đôi Honor Tablet 6 và X6 đã chính thức được ra mắt với giá siêu rẻ

Go-Viet xóa Hoàng Sa, Trường Sa khỏi bản đồ trên app?

Go-Viet xóa Hoàng Sa, Trường Sa khỏi bản đồ trên app?

Xuất hiện ứng dụng FaceApp giả mạo chuyên cài cắm mã độc

Xuất hiện ứng dụng FaceApp giả mạo chuyên cài cắm mã độc

Video xem nhiều

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

Một ngày trải nghiệm giấc mơ trở thành tay đua F1 chuyên nghiệp ở Nhật Bản

Một ngày trải nghiệm giấc mơ trở thành tay đua F1 chuyên nghiệp ở Nhật Bản

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Làm thế nào để nâng cao tương tác giữa loa và phòng nghe hiệu quả

Làm thế nào để nâng cao tương tác giữa loa và phòng nghe hiệu quả

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Hé lộ những hình ảnh thiết kế của Galaxy Fold trong sự kiện ra mắt Galaxy Note 10

Hé lộ những hình ảnh thiết kế của Galaxy Fold trong sự kiện ra mắt Galaxy Note 10

Chiếc điều hòa cá nhân này của Sony là tất cả những gì bạn cần để sống sót qua mùa hè nóng nực

Chiếc điều hòa cá nhân này của Sony là tất cả những gì bạn cần để sống sót qua mùa hè nóng nực

Những gì bạn muốn biết về 5G

Những gì bạn muốn biết về 5G

Bàn về tầm nhìn và các trụ cột của công nghệ thông tin di động 6G
04/03/2022
Chip xử lý A15 Bionic của Apple có gì mới
15/09/2021
Sex Education mùa 3 được Netflix công chiếu vào 17/9
14/09/2021
iPhone 13 không thay đổi nhiều về ngoại hình, camera được nâng cấp mạnh
13/09/2021
Cách xem trực tiếp sự kiện ra mắt iPhone 13 và Apple Watch 7
10/09/2021
VNEID của Bộ Công an khác các ứng dụng đang được vận hành?
10/09/2021
'Cái tôi' thời 4.0 và tính hai mặt của mạng xã hội
04/09/2021
'Muôn màu' cảm xúc của trẻ trong ngày khai giảng online
24/08/2021
Chủ tịch Chu Ngọc Anh giải toả 'ách tắc' về Giấy đi đường cho người dân Thủ đô
10/08/2021
Hàng loạt Macbook M1 tự dưng vỡ màn hình, Apple có đồng ý bảo hành?
02/08/2021
6 bộ phim hay nhất để xem trên VieON
29/01/2021
Bắc Ninh: Không ký kết triển khai dự án Owifi 5G với CSE Singapore
27/06/2020
Bị World Bank cấm dự thầu 7 năm, công ty Sao Bắc Đẩu thừa nhận sai sót
27/06/2020
Wefinex - Mô hình hoạt động đa cấp "đội lốt" đầu tài chính trên mạng internet
10/06/2020
Khai trừ MISA khỏi Câu lạc bộ Chữ ký số và Giao dịch điện tử Việt Nam
27/05/2020
Chuyển đổi số - Nên hiểu như thế nào cho đúng
25/05/2020
Chống thất thu thuế là thách thức lớn đối với nền kinh tế số
29/04/2020
Cách chuyển tập tin sang máy tính mới
10/11/2019
VNPT, MobiFone, VTC sẽ hoàn thành cổ phần hóa trước năm 2021
20/08/2019
5G thay đổi tương lai của bạn như thế nào?
26/07/2019
Nhận diện hành vi lừa đảo trên không gian mạng
25/07/2019
Truyền hình OTT - Hướng đi mới của các “nhà Đài”
24/07/2019