Một số kỹ thuật và công cụ phát hiện Deepfake

Tường Minh
17/08/2024 10:25
D

Trong những năm gần đây, công nghệ Deepfake đã trở nên ngày càng phổ biến hơn, cho phép tạo ra các video thực đến mức chúng ta khó có thể phân biệt với các video quay thực tế. Tuy nhiên, công nghệ này đã bị các tác nhân đe dọa lợi dụng để tạo ra những nội dung giả mạo, hoán đổi khuôn mặt nhằm mục đích lừa đảo, gây ảnh hưởng tiêu cực đến xã hội. Do đó, việc phát triển các công cụ phát hiện Deepfake mang tính cấp bách hơn bao giờ hết. Bài viết này sẽ giới thiệu tổng quan về một số kỹ thuật và công cụ phát hiện Deepfake hiệu quả.

TỔNG QUAN VỀ PHÁT HIỆN DEEPFAKE

Phát hiện Deepfake

Phát hiện Deepfake là quá trình xác định xem một tệp kỹ thuật số như hình ảnh, âm thanh hoặc video đã được chỉnh sửa hoặc tổng hợp bằng trí tuệ nhân tạo (AI) hay không [1]. Với sự phát triển của công nghệ Deepfake, việc phát hiện Deepfake đã trở thành một nhiệm vụ quan trọng trong việc đảm bảo tính toàn vẹn của phương tiện truyền thông kỹ thuật số. Hiện nay, có nhiều kỹ thuật và công cụ khác nhau được phát triển để phát hiện Deepfake như dựa trên AI, dựa trên ánh mắt,... Những kỹ thuật và công cụ này liên tục phát triển và cải thiện để theo kịp những tiến bộ trong công nghệ Deepfake.

Phát hiện Deepfake không chỉ đơn giản là xác định những tệp kỹ thuật số nào bị thay đổi mà quan trọng hơn đó là ngăn chặn sự lây lan của những thông tin sai lệch, bảo vệ các cá nhân khỏi các sự tác động xấu của các nội dung Deepfake.


XEM THÊM: FPT Software chung tay cùng Ant Digital Technologies thúc đẩy nền kinh tế số


Thách thức đặt ra với việc phát hiện Deepfake

Dưới đây là một số thách thức đặt ra đối với việc phát hiện Deepfake [1]:

  • Các kỹ thuật tạo Deepfake ngày càng tăng độ phức tạp: Khi các kỹ thuật tạo Deepfake trở nên tinh vi hơn, việc phân biệt các video thực và giả cũng ngày càng khó khăn hơn.
  • Hạn chế tính khả dụng của tập dữ liệu đào tạo: Các thuật toán phát hiện Deepfake yêu cầu một lượng lớn dữ liệu được đào tạo để học cách phân biệt giữa các video thực và giả. Tuy nhiên, khi tính khả dụng của dữ liệu đó bị hạn chế lại tạo ra những thách thức cho việc đào tạo các mô hình phát hiện Deepfake một cách chính xác.
  • Các máy dò Deepfake dễ bị tấn công: Những kẻ tấn công có thể thay đổi dữ liệu đầu vào để đánh lừa thuật toán phát hiện Deepfake. Điều này có thể dẫn đến dương tính giả hoặc âm tính giả, giảm độ chính xác của hệ thống phát hiện Deepfake.
  • Phát hiện theo thời gian thực: Đây là một nhiệm vụ đầy thách thức vì nó yêu cầu xử lý một lượng lớn dữ liệu trong thời gian thực. Điều này gây áp lực cho các tài nguyên tính toán và yêu cầu phần cứng chuyên dụng để đạt được hiệu suất xử lý trong thời gian thực.
  • Đảm bảo quyền riêng tư: Phát hiện Deepfake làm tăng các mối quan tâm về quyền riêng tư vì nó liên quan đến việc phân tích và xử lý dữ liệu nhạy cảm như là video và hình ảnh. Điều này đòi hỏi các biện pháp bảo vệ dữ liệu nghiêm ngặt để đảm bảo rằng quyền riêng tư của các cá nhân không bị xâm phạm.

MỘT SỐ KỸ THUẬT THƯỜNG ĐƯỢC SỬ DỤNG ĐỂ PHÁT HIỆN DEEPFAKE

Mạng nơ-ron tích chập

Mạng nơ-ron tích chập (Convolutional Neural Network - CNN) là một trong những mô hình Deep Learning tiên tiến, đây là một loại thuật toán học sâu, thường được sử dụng để phân tích hình ảnh và video. Nó giúp cho chúng ta xây dựng được những hệ thống thông minh với độ chính xác cao như hiện nay [1]. CNN đặc biệt phù hợp để phát hiện Deepfake vì chúng có thể xác định các mẫu và tính năng trong hình ảnh và video mà không thể nhìn thấy bằng mắt thường.

Để phát hiện Deepfake bằng CNN, thuật toán được đào tạo trên một bộ dữ liệu các hình ảnh hoặc các video thực và giả. CNN học cách xác định sự khác biệt tinh tế giữa hình ảnh thực và giả, chẳng hạn như sự khác biệt về ánh sáng, bóng tối và biểu cảm khuôn mặt. Khi CNN đã được đào tạo, nó có thể được sử dụng để phân loại hình ảnh hoặc video là thật hoặc giả với độ chính xác cao.

Bộ mã tự động

Bộ mã tự động (Autoencoder) là mạng nơ-ron tự động mã hóa, một thuật toán học máy không giám sát áp dụng sự lan truyền ngược, đặt các giá trị đích bằng với các đầu vào. Mã tự động được sử dụng để giảm kích thước đầu vào thành một biểu diễn nhỏ hơn. Kiến trúc của này tạo ra “một nút thắt cổ chai” (Hình 1), vì vậy những đặc trưng đại diện được giữ lại [2].

Một số kỹ thuật và công cụ phát hiện Deepfake

Hình 1. Kiến trúc Autoencoder

Để phát hiện Deepfake, thuật toán được huấn luyện trên một tập dữ liệu các hình ảnh thực và giả. Autoencoder học cách nén và xây dựng lại dữ liệu đầu vào, học cách xác định sự khác biệt giữa dữ liệu đầu vào thực và giả. Khi autoencoder được đào tạo, nó có thể được sử dụng để phân loại các hình ảnh và video mới là thật hay là giả dựa trên chất lượng của bản dựng lại.

Mạng đối nghịch tạo sinh

Mạng đối nghịch tạo sinh (Generative Adversarial Networks - GAN) là một loại thuật toán học sâu có thể được sử dụng để tạo ra hình ảnh và video chân thực. GAN gồm một trình sinh (Generator) và một trình phân biệt (Discriminator) tương tác với nhau thông qua mối quan hệ đối nghịch. Trình sinh được đào tạo để tạo ra hình ảnh hoặc video giả để đánh lừa trình phân biệt. Đồng thời, trình phân biệt được đào tạo để phân biệt giữa hình ảnh thật và giả, giữa video thật và giả [3].

Để phát hiện Deepfake bằng GAN, thuật toán được đào tạo trên tập dữ liệu gồm cả hình ảnh hoặc video thật và giả. Từ tập dữ liệu hiện có, trình sinh và trình phân biệt của GAN làm việc cùng nhau để tạo ra và phân biệt các mẫu. Khi GAN đã được huấn luyện, nó có thể được sử dụng để phân loại hình ảnh hoặc video là thật hay giả dựa trên đầu ra của trình phân biệt.

Phát hiện Deepfake bằng cách sử dụng sự không phù hợp về hình ảnh tương ứng của âm vị

Phát hiện Deepfake bằng cách sử dụng sự không phù hợp về hình ảnh tương ứng của âm vị là một kỹ thuật khoa học và giải pháp đột phá trong bối cảnh các video Deepfake xuất hiện ngày càng nhiều trên mạng Internet. Công cụ này được phát triển bởi những chuyên gia tại Đại học Stanford và Đại học California (Mỹ) [4]. Mô hình này có thể phát hiện các đặc điểm khuôn mặt nhân tạo và khai thác sự không nhất quán giữa các hình ảnh khuôn dạng miệng và âm vị nói.

MỘT SỐ CÔNG CỤ PHÁT HIỆN DEEPFAKE

FakeCatcher

FakeCatcher là công cụ phát hiện Deepfake trong thời gian thực của Intel. Công cụ này được phát triển bởi sự hợp tác với Đại học Binghamton, có khả năng phát hiện các video giả với tỷ lệ ấn tượng 96% với những kết quả trong thời gian thực. Bằng cách sử dụng phần cứng và phần mềm nâng cao của Intel, FakeCatcher là một công cụ mạnh mẽ có thể phân biệt được các nội dung thực và các nội dung đã bị chỉnh sửa.

FakeCacher hoạt động bằng cách xác định các dấu hiệu xác thực trong các video thực, chẳng hạn như sự chuyển động của các mạch máu trong các pixel của video. Khi tim của chúng ta bơm máu, tĩnh mạch sẽ thay đổi màu sắc và những tín hiệu về lưu lượng máu này được thu thập từ khắp cơ thể của chúng ta. Các thuật toán sẽ dịch các tín hiệu này thành các bản đồ không gian và với sự trợ giúp của các mô hình học sâu, FakeCatcher có thể xác định ngay lập tức một video là thật hay giả [5].

Video Authenticator

Công cụ xác thực video của Microsoft mang tên Video Authenticator là một công cụ phát hiện Deepfake nâng cao, được phát triển bởi đội ngũ các nhà nghiên cứu Microsoft Research, Microsoft AI và Ethics and Effects in Engineering and Research.

Phương thức hoạt động của Video Authenticator về cơ bản không có gì phức tạp, nó sử dụng thuật toán để phân tích ảnh tĩnh hoặc video ở cấp độ pixel mà mắt thường không thể nhìn thấy được, nhằm đưa ra tỷ lệ phần trăm cơ hội hoặc điểm số tin cậy, cho biết khả năng hình ảnh, video đó bị can thiệp Deepfake là bao nhiêu. Đặc biệt đối với video, công cụ có thể cung cấp điểm số đánh giá theo thời gian thực trên mỗi khung hình nhằm đưa ra kết quả chuẩn xác nhất [6].

Công cụ Deepware Scanner

Deepware Scanner là một công cụ điều tra số nguồn mở, chủ yếu dành riêng cho việc phát hiện các video do AI tạo ra. Công cụ này đã đi đầu trong nghiên cứu Deepfake từ năm 2018, phát triển các phương pháp hiệu quả nhất để phát hiện Deepfake. Deepware Scanner cho phép người dùng tải video lên để xác định xem chúng có bị chỉnh sửa bởi AI hay không. Tương tự như các máy dò quét Deepfake khác, các mô hình Deepware tìm kiếm các dấu hiệu thao túng trên khuôn mặt con người. Hạn chế của công cụ này là không có khả năng phát hiện các kỹ thuật hoán đổi giọng nói, điều này nguy hiểm hơn nhiều so với việc hoán đổi khuôn mặt [7].

Công cụ Faceless - bộ công cụ phát hiện Deepfake Make in Viet Nam

Bộ công cụ Faceless là do Dương Tiểu Đồng (sinh năm 2005) và Phạm Tiến Mạnh (sinh năm 1996) nghiên cứu phát triển. Đây là bộ công cụ của Việt Nam, vận hành bằng cách tiếp nhận một hình ảnh từ người dùng và tiến hành nhận diện khuôn mặt. Khuôn mặt đó sẽ được đưa vào mạng “nơ-ron tích chập” để phân loại xem đó có phải là sản phẩm của quá trình Deepfake hay không. Kết quả thử nghiệm cho thấy, Faceless có khả năng phát hiện Deepfake trong vòng dưới 2 giây với độ chính xác 94.5%. Đây cũng là một kết quả phát hiện Deepfake tương đối nổi bật so với một số công cụ hiện có. Hiện nay bộ công cụ đang được chia sẻ dưới dạng mã nguồn mở. Trong tương lai, nhóm nghiên cứu dự kiến sẽ phát triển bộ công cụ phát hiện Deepfake dựa trên đóng góp của cộng đồng và không nhằm mục đích thương mại hóa [8].

TÀI LIỆU THAM KHẢO

[1]. https://www.straight.com/guides/software/best-deepfake-detector-tools-te....

[2]. Tran Tung Nhi, Pham Van Quan, Phan Cong Dat. Ứng dụng kỹ thuật bộ mã tự động tích chập (convolutional autoencoder) trong khử nhiễu hình ảnh. Tạp chí khoa học Đại học Đông Á. 2022.

[3]. https://m.mic.gov.vn/pages/tintuc/printpage.aspx?tintucID=145971

[4]. Shruti Agarwal and Hany Farid, Ohad Fried and Maneesh Agrawala. Detecting Deep-Fake Videos from Phoneme-Viseme Mismatches. 2020 IEEE/ CVF Conference on Computer Vision and Pattern Recognition Workshops. 2020.

[5] https://aimojo.pro/deepfake-detection-tools/.

[6]. https://cntt.donga.edu.vn/thong-tin-chi-tiet/microsoft-video-authenticat....

[7]. https://www.congluan.vn/nhung-cong-cu-ai-de-chong-lai-deepfake-post26481....

[8]. https://vietnamnet.vn/hacker-mu-trang-viet-phat-trien-cong-cu-phat-hien-....

ThS. Đào Ánh Hương - Học viện An ninh nhân dân

Theo An Toàn thông tin

Theo tạp chí Điện tử và Ứng dụng

Tin cùng chuyên mục

Meta thử nghiệm công nghệ nhận diện khuôn mặt để chống lừa đảo và hỗ trợ khôi phục tài khoản

Meta thử nghiệm công nghệ nhận diện khuôn mặt để chống lừa đảo và hỗ trợ khôi phục tài khoản

Phát hiện lỗ hổng nghiêm trọng trong ASF của Microchip

Phát hiện lỗ hổng nghiêm trọng trong ASF của Microchip

Keysight và Autotalks nâng tầm bảo mật của công nghệ phương tiện kết nối vạn vật

Keysight và Autotalks nâng tầm bảo mật của công nghệ phương tiện kết nối vạn vật

Tình hình an ninh mạng quý II có nhiều thay đổi

Tình hình an ninh mạng quý II có nhiều thay đổi

Hãng tin AFP bị tấn công mạng

Hãng tin AFP bị tấn công mạng

Một số website đặt Hosting tại iNET bị chèn liên kết bất hợp pháp

Một số website đặt Hosting tại iNET bị chèn liên kết bất hợp pháp

Việt Nam, cứ 5 người thì có 1 người từng đối diện với đe dọa an ninh mạng

Việt Nam, cứ 5 người thì có 1 người từng đối diện với đe dọa an ninh mạng

Thiếu hụt kỹ năng an ninh mạng sẽ khiến tổ chức rơi vào vòng nguy hiểm

Thiếu hụt kỹ năng an ninh mạng sẽ khiến tổ chức rơi vào vòng nguy hiểm

Vụ rò rỉ thông tin cá nhân lớn tại đại học nữ sinh Ewha sau tấn công mạng

Vụ rò rỉ thông tin cá nhân lớn tại đại học nữ sinh Ewha sau tấn công mạng

Tình hình an ninh mạng tại Việt Nam 2024: Số lượng thông tin cá nhân bị đánh cắp tăng 50%

Tình hình an ninh mạng tại Việt Nam 2024: Số lượng thông tin cá nhân bị đánh cắp tăng 50%

Cảnh báo về Fanpage giả mạo cuộc thi viết thư UPU lừa đảo học sinh

Cảnh báo về Fanpage giả mạo cuộc thi viết thư UPU lừa đảo học sinh

Buymed và SHIELD chung tay chống gian lận trong hệ sinh thái chăm sóc sức khoẻ

Buymed và SHIELD chung tay chống gian lận trong hệ sinh thái chăm sóc sức khoẻ

Tin mới cập nhật

Blockchain và AI: Làm chủ công nghệ, làm chủ tương lai

Blockchain và AI: Làm chủ công nghệ, làm chủ tương lai

Cùng STEAMese Festival 2024 phiêu lưu đến thế giới 3000

Cùng STEAMese Festival 2024 phiêu lưu đến thế giới 3000

Việt Nam đặt mục tiêu tự chủ về công nghệ bán dẫn trong chiến lược dài hạn

Việt Nam đặt mục tiêu tự chủ về công nghệ bán dẫn trong chiến lược dài hạn

Liên hoan Sáng tạo & Thiết kế Việt Nam: Tái tạo vì phát triển bền vững

Liên hoan Sáng tạo & Thiết kế Việt Nam: Tái tạo vì phát triển bền vững

Ống kính 3D giá rẻ của Canon dự kiến mở bán vào tháng 11

Ống kính 3D giá rẻ của Canon dự kiến mở bán vào tháng 11

Điều cần biết về tính năng ghi âm cuộc gọi trên iOS 18.1

Điều cần biết về tính năng ghi âm cuộc gọi trên iOS 18.1

Cùng Yandex Ads khai phá tiềm năng ứng dụng Việt Nam

Cùng Yandex Ads khai phá tiềm năng ứng dụng Việt Nam

Smart Banking 2024: Định hình tương lai số cho ngành ngân hàng

Smart Banking 2024: Định hình tương lai số cho ngành ngân hàng

Yêu cầu Công ty iQIYI tuân thủ quy định pháp luật Việt Nam

Yêu cầu Công ty iQIYI tuân thủ quy định pháp luật Việt Nam

Khám phá tính năng trên iOS 18.2 Dev Beta

Khám phá tính năng trên iOS 18.2 Dev Beta

OpenAI sắp ra mắt mô hình Orion mạnh gấp 100 lần

OpenAI sắp ra mắt mô hình Orion mạnh gấp 100 lần

Khai mở kỷ nguyên AI, Samsung giới thiệu loạt thiết bị gia dụng BESPOKE AI

Khai mở kỷ nguyên AI, Samsung giới thiệu loạt thiết bị gia dụng BESPOKE AI

Tin đọc nhiều

Meta thử nghiệm công nghệ nhận diện khuôn mặt để chống lừa đảo và hỗ trợ khôi phục tài khoản

Meta thử nghiệm công nghệ nhận diện khuôn mặt để chống lừa đảo và hỗ trợ khôi phục tài khoản

Chiêu thức lừa đảo khách sử dụng thẻ tín dụng

Chiêu thức lừa đảo khách sử dụng thẻ tín dụng

Khoảng 95% các vụ gian lận tài chính liên quan đến người dùng thẻ trực tuyến

Khoảng 95% các vụ gian lận tài chính liên quan đến người dùng thẻ trực tuyến

Trung Quốc nhấn mạnh tầm quan trọng của an ninh mạng trong nền kinh tế số

Trung Quốc nhấn mạnh tầm quan trọng của an ninh mạng trong nền kinh tế số

Kỹ năng an toàn thông tin - 'Lỗ hổng lớn' trên không gian mạng của người dùng Việt

Kỹ năng an toàn thông tin - 'Lỗ hổng lớn' trên không gian mạng của người dùng Việt

Giá xăng dầu có thể bị ảnh hưởng khi hệ thống truyền dẫn nhiên liệu lớn nhất nước Mỹ bị tấn công mạng

Giá xăng dầu có thể bị ảnh hưởng khi hệ thống truyền dẫn nhiên liệu lớn nhất nước Mỹ bị tấn công mạng

Security World 2021 nhận diện thách thức ATTT với những bước tăng trưởng "nóng" của chuyển đổi số

Security World 2021 nhận diện thách thức ATTT với những bước tăng trưởng "nóng" của chuyển đổi số

Google vá lỗ hổng zero-day trên Chrome lần thứ hai trong hai tuần

Google vá lỗ hổng zero-day trên Chrome lần thứ hai trong hai tuần

Lỗ hổng vượt qua xác thực mã PIN mới ảnh hưởng tới thanh toán Visa

Lỗ hổng vượt qua xác thực mã PIN mới ảnh hưởng tới thanh toán Visa

Người dùng mạng riêng ảo VPN Hồng Kông bị lộ thông tin

Người dùng mạng riêng ảo VPN Hồng Kông bị lộ thông tin

Video xem nhiều

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Đại học Miami tạo ra cảm biến chất lượng không khí phát hiện Covid-19

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Ford F-150 Lightning 2022 ra mắt: Bán tải chạy điện giá khởi điểm chưa đến 40 nghìn USD

Thông điệp lan tỏa mùa dịch COVID-19

Thông điệp lan tỏa mùa dịch COVID-19

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Clip: Khuyến cáo đối với người lao động, người làm việc, người bán hàng tại khu dịch vụ trong dịch Covid-19

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

Cỗ xe lai phản lực tăng tốc từ 0 - 1010 km/h trong 50 giây tham vọng phá kỷ lục thế giới

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

“Rắn tiên tri” dự đoán đội tuyển Việt Nam thắng Thái Lan

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Pretzel - Bánh quy cây: Biểu tượng văn hoá châu Âu với nhiều tranh cãi về nguồn gốc

Làm thế nào để nâng cao tương tác giữa loa và phòng nghe hiệu quả

Làm thế nào để nâng cao tương tác giữa loa và phòng nghe hiệu quả

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Trực tiếp: Apple ra mắt Iphone 11 tại Cupertino, California, Mỹ

Chiếc điều hòa cá nhân này của Sony là tất cả những gì bạn cần để sống sót qua mùa hè nóng nực

Chiếc điều hòa cá nhân này của Sony là tất cả những gì bạn cần để sống sót qua mùa hè nóng nực

Những gì bạn muốn biết về 5G

Những gì bạn muốn biết về 5G

5G thay đổi tương lai của bạn như thế nào?

5G thay đổi tương lai của bạn như thế nào?

Bàn về tầm nhìn và các trụ cột của công nghệ thông tin di động 6G
04/03/2022
Chip xử lý A15 Bionic của Apple có gì mới
15/09/2021
Sex Education mùa 3 được Netflix công chiếu vào 17/9
14/09/2021
iPhone 13 không thay đổi nhiều về ngoại hình, camera được nâng cấp mạnh
13/09/2021
Cách xem trực tiếp sự kiện ra mắt iPhone 13 và Apple Watch 7
10/09/2021
VNEID của Bộ Công an khác các ứng dụng đang được vận hành?
10/09/2021
'Cái tôi' thời 4.0 và tính hai mặt của mạng xã hội
04/09/2021
'Muôn màu' cảm xúc của trẻ trong ngày khai giảng online
24/08/2021
Chủ tịch Chu Ngọc Anh giải toả 'ách tắc' về Giấy đi đường cho người dân Thủ đô
10/08/2021
Hàng loạt Macbook M1 tự dưng vỡ màn hình, Apple có đồng ý bảo hành?
02/08/2021
6 bộ phim hay nhất để xem trên VieON
29/01/2021
Bắc Ninh: Không ký kết triển khai dự án Owifi 5G với CSE Singapore
27/06/2020
Bị World Bank cấm dự thầu 7 năm, công ty Sao Bắc Đẩu thừa nhận sai sót
27/06/2020
Wefinex - Mô hình hoạt động đa cấp "đội lốt" đầu tài chính trên mạng internet
10/06/2020
Khai trừ MISA khỏi Câu lạc bộ Chữ ký số và Giao dịch điện tử Việt Nam
27/05/2020
Chuyển đổi số - Nên hiểu như thế nào cho đúng
25/05/2020
Chống thất thu thuế là thách thức lớn đối với nền kinh tế số
29/04/2020
Cách chuyển tập tin sang máy tính mới
10/11/2019
VNPT, MobiFone, VTC sẽ hoàn thành cổ phần hóa trước năm 2021
20/08/2019
5G thay đổi tương lai của bạn như thế nào?
26/07/2019
Nhận diện hành vi lừa đảo trên không gian mạng
25/07/2019
Truyền hình OTT - Hướng đi mới của các “nhà Đài”
24/07/2019