Chatbot Claude - AI hoạt động có khuôn khổ đạo đức đầu tiên của giới công nghệ

Ninh Gia
18/05/2023 08:00
D

Là hãng công nghệ đi sau nhưng lại muốn cạnh tranh với ứng dụng đang "làm mưa làm gió" trên thị trường trí tuệ nhân tạo (AI), Anthropic đã tiếp cận vấn đề từ các quy định về đạo đức để định hình sản phẩm chatbot Claude hứa hẹn sẽ tạo sự khác biệt với người dùng cũng như các quốc gia mà ứng dụng này hiện hữu.

Theo đó, công ty khởi nghiệp về AI Anthropic đã công bố văn bản tập hợp các giá trị đạo đức đã được sử dụng để đào tạo và đảm bảo an toàn cho chatbot Claude - đối thủ của phần mềm đang “làm mưa làm gió” ChatGPT.

Văn bản giá trị đạo đức mà Anthropic gọi là “hiến pháp Claude”, được hình thành từ một số nguồn, trong đó có Tuyên bố về Nhân quyền của Liên hợp quốc và các quy tắc bảo mật dữ liệu của Apple.

Đa số các chatbot AI đều dựa vào phản hồi từ nhân viên trong quá trình đào tạo, từ đó sẽ đánh giá và xếp hạng các phản hồi gây hại hoặc khó chịu. Tuy nhiên, những hệ thống này có thể gặp khó khăn trong việc dự đoán các câu hỏi và câu trả lời, vì vậy thường có xu hướng tránh nhắc đến một số chủ đề có khả năng gây tranh cãi như chính trị và chủng tộc.

Chatbot Claude là ứng dụng được nghiên cứu và phát triển bởi các cựu nhân viên của OpenAI
Chatbot Claude là ứng dụng được nghiên cứu và phát triển bởi các cựu nhân viên của OpenAI.

Đối với Anthropic, chatbot Claude được huấn luyện theo một cách khác, khi dựa trên tập hợp các giá trị đạo đức có sẵn để đưa ra quyết định về cách trả lời câu hỏi.

Những giá trị này bao gồm việc phản đối các hành vi và ngôn ngữ tra tấn, tàn ác, liên quan đến nô lệ, đối xử vô nhân đạo hay hạ thấp nhân phẩm con người. Chatbot Claude cũng được thiết lập để tránh các câu trả lời bị coi là xúc phạm đến bất kỳ truyền thống hay nền văn hóa nào.

Trong một cuộc phỏng vấn, người đồng sáng lập Anthropic, ông Jack Clark cho biết “hiến pháp Claude” có thể được sửa đổi để cân bằng, vừa cung cấp các câu trả lời hữu ích và đáng tin cậy, vừa không gây khó chịu.

Ông dự đoán các giá trị AI “hợp hiến” như “hiến pháp Claude” sẽ sớm thu hút sự quan tâm của các chính trị gia trong các cuộc thảo luận trong tương lai về AI, vì các giá trị này có thể được viết ra một cách dễ dàng.

Anthropic là công ty công nghệ do các cựu giám đốc điều hành của OpenAI - “cha đẻ” của ChatGPT thành lập và được tập đoàn Alphabet đầu tư. Các nhà sáng lập Anthropic đang hướng tới việc tạo ra một hệ thống AI an toàn, không chứa các nội dung độc hại như cách chế tạo vũ khí hay sử dụng ngôn ngữ phân biệt chủng tộc.

Giới chức Mỹ ưu tiên xem xét về vấn đề an toàn khi nghiên cứu về cách kiểm soát AI. Tổng thống Mỹ Joe Biden cho rằng các công ty AI phải có nghĩa vụ đảm bảo hệ thống của họ an toàn trước khi giới thiệu với công chúng.

Người đồng sáng lập Anthropic, ông Dario Amodei là một trong số các giám đốc điều hành AI đã gặp Tổng thống Biden vào tuần trước để thảo luận về những nguy cơ tiềm ẩn của công nghệ này.

Theo tạp chí Điện tử và Ứng dụng

Bình luận

Tối thiểu 10 chữ Tiếng việt có dấu Không chứa liên kết

Gửi bình luận

Tin cùng chuyên mục

ETF chip nhớ AI hút 5 tỷ USD sau hơn một tháng ra mắt

ETF chip nhớ AI hút 5 tỷ USD sau hơn một tháng ra mắt

Hãng phim Trung Quốc gây bão khi giới thiệu 'diễn viên' AI

Hãng phim Trung Quốc gây bão khi giới thiệu 'diễn viên' AI

PRO X2 SUPERSTRIKE: chuột gaming cảm ứng đầu tiên trên thế giới

PRO X2 SUPERSTRIKE: chuột gaming cảm ứng đầu tiên trên thế giới

Sony kêu gọi người dùng PS4 nâng cấp lên PS5, trong bối cảnh PS6 vẫn chưa ra mắt

Sony kêu gọi người dùng PS4 nâng cấp lên PS5, trong bối cảnh PS6 vẫn chưa ra mắt

NVIDIA mở mã nguồn AI dự báo thời tiết Earth-2: Dự đoán bão 15 ngày nhanh gấp 60 lần

NVIDIA mở mã nguồn AI dự báo thời tiết Earth-2: Dự đoán bão 15 ngày nhanh gấp 60 lần

MoMo đã được tích hợp trên đồng hồ Garmin

MoMo đã được tích hợp trên đồng hồ Garmin

MyTV B2B được nhiều bệnh viện tin dùng

MyTV B2B được nhiều bệnh viện tin dùng

Hệ sinh thái số Zalo: Chuyển mình từ ứng dụng nhắn tin sang nền tảng đa dịch vụ

Hệ sinh thái số Zalo: Chuyển mình từ ứng dụng nhắn tin sang nền tảng đa dịch vụ

ViewSonic giới thiệu màn hình Dual Mode XG2730D-4K dành riêng cho game thủ

ViewSonic giới thiệu màn hình Dual Mode XG2730D-4K dành riêng cho game thủ

Việt Nam chính thức được trải nghiệm ứng dụng Sora bằng tiếng Việt

Việt Nam chính thức được trải nghiệm ứng dụng Sora bằng tiếng Việt

NetApp tiên phong tích hợp khả năng phát hiện xâm phạm dữ liệu ngay trong Hệ thống lưu trữ doanh nghiệp

NetApp tiên phong tích hợp khả năng phát hiện xâm phạm dữ liệu ngay trong Hệ thống lưu trữ doanh nghiệp

LG ra mắt màn hình chơi game 5K2K đầu tiên trên thế giới

LG ra mắt màn hình chơi game 5K2K đầu tiên trên thế giới

Tin mới cập nhật

Google tung Gemini Omni, AI tạo video từ mọi dữ liệu đầu vào

Google tung Gemini Omni, AI tạo video từ mọi dữ liệu đầu vào

Viettel Money tự động đăng ký dịch vụ bảo hiểm màn hình điện thoại MIC mà không xin phép, ví điện tử đang tự chọn hộ người dùng

Viettel Money tự động đăng ký dịch vụ bảo hiểm màn hình điện thoại MIC mà không xin phép, ví điện tử đang tự chọn hộ người dùng

Bộ Công Thương siết truy xuất nguồn gốc hàng hóa, tăng minh bạch thị trường

Bộ Công Thương siết truy xuất nguồn gốc hàng hóa, tăng minh bạch thị trường

AI buộc doanh nghiệp tinh gọn, hợp nhất hệ thống bảo mật

AI buộc doanh nghiệp tinh gọn, hợp nhất hệ thống bảo mật

Techmart 2026: Quy tụ loạt giải pháp công nghệ xanh, thúc đẩy chuyển đổi bền vững

Techmart 2026: Quy tụ loạt giải pháp công nghệ xanh, thúc đẩy chuyển đổi bền vững

Vietnam Security Summit 2026 và bài toán an ninh mạng Việt Nam thời hậu lượng tử

Vietnam Security Summit 2026 và bài toán an ninh mạng Việt Nam thời hậu lượng tử

Ba tín hiệu lớn từ chuyến thăm Bắc Kinh của TT Putin

Ba tín hiệu lớn từ chuyến thăm Bắc Kinh của TT Putin

Thời AI bùng nổ khiến lương lao động kỹ thuật tăng vọt

Thời AI bùng nổ khiến lương lao động kỹ thuật tăng vọt

Nvidia thừa nhận mất thị phần chip AI Trung Quốc vào tay Huawei

Nvidia thừa nhận mất thị phần chip AI Trung Quốc vào tay Huawei

Doanh nghiệp tự trói mình bằng các công cụ bảo mật, sàn tài sản số Việt Nam có tránh được vết xe đó?

Doanh nghiệp tự trói mình bằng các công cụ bảo mật, sàn tài sản số Việt Nam có tránh được vết xe đó?

TikToker 9 triệu fan lên tiếng sau vụ 'dàn dựng' tặng iPhone 17 ở Hồ Gươm

TikToker 9 triệu fan lên tiếng sau vụ 'dàn dựng' tặng iPhone 17 ở Hồ Gươm

Blackstone rót 5 tỷ USD xây hạ tầng AI cùng Google

Blackstone rót 5 tỷ USD xây hạ tầng AI cùng Google

Tin đọc nhiều

Innodisk DRAM DDR5 6400 chuyên biệt cho AI

Innodisk DRAM DDR5 6400 chuyên biệt cho AI

COMPUTEX 2023: Kingston giới thiệu bộ nhớ DDR5 Non-Binary mới và ổ cứng SSD gắn ngoài XS1000

COMPUTEX 2023: Kingston giới thiệu bộ nhớ DDR5 Non-Binary mới và ổ cứng SSD gắn ngoài XS1000

Huawei ra mắt bộ ba sản phẩm mới giúp nâng tầm phong cách sống

Huawei ra mắt bộ ba sản phẩm mới giúp nâng tầm phong cách sống

Độc đáo: Máy tính xách tay không màn hình

Độc đáo: Máy tính xách tay không màn hình

Không cải thiện tiêu chuẩn, điều hòa không khí sẽ "nấu chín" hành tinh của chúng ta

Không cải thiện tiêu chuẩn, điều hòa không khí sẽ "nấu chín" hành tinh của chúng ta

Kaspersky ra mắt sản phẩm mới dành cho người dùng cuối

Kaspersky ra mắt sản phẩm mới dành cho người dùng cuối

Không Apple, không Samsung, vậy đâu là thương hiệu smartwatch dành cho bạn?

Không Apple, không Samsung, vậy đâu là thương hiệu smartwatch dành cho bạn?

Chip xử lý A15 Bionic của Apple có gì mới

Chip xử lý A15 Bionic của Apple có gì mới

Công nghệ nào sẽ lên ngôi trong năm 2021?

Công nghệ nào sẽ lên ngôi trong năm 2021?

Hải Phòng: Hồ Hạnh Phúc sau 2 năm áp dụng công nghệ Bakture bây giờ ra sao?

Hải Phòng: Hồ Hạnh Phúc sau 2 năm áp dụng công nghệ Bakture bây giờ ra sao?

Video xem nhiều

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Thông điệp lan tỏa mùa dịch COVID-19

Thông điệp lan tỏa mùa dịch COVID-19

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Làm thế nào để nâng cao tương tác giữa loa và phòng nghe hiệu quả

Làm thế nào để nâng cao tương tác giữa loa và phòng nghe hiệu quả

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Chiếc điều hòa cá nhân này của Sony là tất cả những gì bạn cần để sống sót qua mùa hè nóng nực

Chiếc điều hòa cá nhân này của Sony là tất cả những gì bạn cần để sống sót qua mùa hè nóng nực

Những gì bạn muốn biết về 5G

Những gì bạn muốn biết về 5G

5G thay đổi tương lai của bạn như thế nào?

5G thay đổi tương lai của bạn như thế nào?

Bàn về tầm nhìn và các trụ cột của công nghệ thông tin di động 6G
04/03/2022
Chip xử lý A15 Bionic của Apple có gì mới
15/09/2021
Sex Education mùa 3 được Netflix công chiếu vào 17/9
14/09/2021
iPhone 13 không thay đổi nhiều về ngoại hình, camera được nâng cấp mạnh
13/09/2021
Cách xem trực tiếp sự kiện ra mắt iPhone 13 và Apple Watch 7
10/09/2021
VNEID của Bộ Công an khác các ứng dụng đang được vận hành?
10/09/2021
'Cái tôi' thời 4.0 và tính hai mặt của mạng xã hội
04/09/2021
'Muôn màu' cảm xúc của trẻ trong ngày khai giảng online
24/08/2021
Chủ tịch Chu Ngọc Anh giải toả 'ách tắc' về Giấy đi đường cho người dân Thủ đô
10/08/2021
Hàng loạt Macbook M1 tự dưng vỡ màn hình, Apple có đồng ý bảo hành?
02/08/2021
6 bộ phim hay nhất để xem trên VieON
29/01/2021
Bắc Ninh: Không ký kết triển khai dự án Owifi 5G với CSE Singapore
27/06/2020
Bị World Bank cấm dự thầu 7 năm, công ty Sao Bắc Đẩu thừa nhận sai sót
27/06/2020
Wefinex - Mô hình hoạt động đa cấp "đội lốt" đầu tài chính trên mạng internet
10/06/2020
Khai trừ MISA khỏi Câu lạc bộ Chữ ký số và Giao dịch điện tử Việt Nam
27/05/2020
Chuyển đổi số - Nên hiểu như thế nào cho đúng
25/05/2020
Chống thất thu thuế là thách thức lớn đối với nền kinh tế số
29/04/2020
Cách chuyển tập tin sang máy tính mới
10/11/2019
VNPT, MobiFone, VTC sẽ hoàn thành cổ phần hóa trước năm 2021
20/08/2019
5G thay đổi tương lai của bạn như thế nào?
26/07/2019
Nhận diện hành vi lừa đảo trên không gian mạng
25/07/2019
Truyền hình OTT - Hướng đi mới của các “nhà Đài”
24/07/2019