Làm sao Apple biết emoji nào được dùng nhiều nhất mà không đọc tin nhắn người dùng?

Mặt vừa khóc vừa cười và trái tim là 2 biểu tượng cảm xúc emojis được dùng nhiều nhất, theo báo cáo cách đây không lâu của Apple. Vậy làm sao họ biết được thông tin thống kê này? Có phải họ đã theo dõi những gì mà người dùng chat? Câu trả là lời là bằng một kỹ thuật phân tích big data thông minh, Apple vừa có thể thu được số liệu hữu ích, vừa có thể đảm bảo quyền riêng tư của từng người dùng.
Chi tiết hơn, họ đã dùng một kỹ thuật khoa học máy tính mang tên Differential Privacy. Một cách đơn giản thì cách làm ở đây là thêm một số thông tin gây nhiễu để làm tối nghĩa dữ liệu trên một chiếc điện thoại của người dùng, nhưng sau đó, gói dự liệu đã bị gây nhiễu của người này sẽ được kết hợp với dữ liệu trải qua xử lý tương tự của người khác, từ đó khi quan sát trên cấp độ vĩ mô, Apple vẫn có thể hiểu được dữ liệu họ muốn lấy nhưng không hề đọc thông tin của từng cá nhân người dùng.

Và trường hợp của Apple chỉ là một thí dụ cho việc áp dụng Differential Privacy nhằm lấy dữ liệu thống kê một cách tinh tế.

Thí dụ như bạn muốn tiến hành một cuộc khảo sát trước khi bầu lớp trưởng nhằm xác định xem có bao nhiêu người bầu cho ứng cử viên A và B. Khi đó, bạn sẽ gọi những người đi bầu tới, yêu cầu họ bỏ biếu và ghi chép lại đầy đủ trong một cuốn sổ. Tuy nhiên, nếu bảng ghi chép này bị lộ hoặc đánh cắp thì danh sách toàn bộ những người bỏ phiếu cùng lựa chọn của họ sẽ bị lộ. Do đó, với cách làm này thì bạn dù có đạt được mục đích khảo sát nhưng đồng thời lại tạo ra nguy cơ tính riêng tư của nhiều người khác bị xâm hại.

Bây giờ, hãy nghĩ nếu như người tổ chức khảo sát gọi những người tham gia bầu chọn tới và hỏi họ một câu hỏi khác với việc hỏi thẳng là sẽ chọn ai làm lớp trước. Thí dụ như người tổ chức sẽ yêu cầu người bầu chọn tung đồng xu. Nếu mặt ngửa thì người đi bầu sẽ được yêu cầu nói thật rằng họ sẽ chọn ai làm lớp trưởng. Nếu mặt sấp, họ sẽ được yêu cầu chọn ngẫu nhiên trong số 2 ứng cử viên lớp trưởng và nói tên 1 người. Nói cách khác, đồng xu sấp đồng nghĩa với việc người bầu chọn sẽ chọn A và B theo tỷ lệ 50 - 50. Cuối cùng, cách làm này sẽ giúp người tổ chức cuộc bình chọn sẽ nghe được lựa chọn thật của người bầu chọn với tỷ lệ 75%, 25% còn lại là nghe được lời nói dối. Trong thí dụ này, việc đưa đồng xu vào chính là một cách gây nhiễu dữ liệu gốc và chính người tổ chức cũng không biết được câu trả lời họ nghe là đúng hay sai, chỉ biết được tỷ lệ phần trăm.

Do đó, cho dù bảng ghi chép kết quả sau cuộc bình chọn lớp trưởng bị lộ ra ngoài thì thông tin cá nhân của mỗi người tham gia bầu chọn vẫn được bảo vệ. Nguyên nhân là do người ta không xác định được ai bỏ phiếu cho ai, mỗi người đều có khả năng trả lời không đáng tin nên người lén đọc dữ liệu cũng không xác định được cái họ đọc chính xác hay không. Tuy nhiên, đối với người tiến hành khảo sát thì họ có thể tính được con số trung bình kết quả bầu chọn bởi chính họ mới là người biết được cách gây nhiễu dữ liệu. Nói cách khác, khi nhìn trên giác độ vĩ mô thì có thể thu được thông tin cần thiết, nhưng khi quan sát vi mô thì không khả dĩ.

 Và đây cũng chính là cách mà Apple đã áp dụng để xác định được biểu tượng cảm xúc nào phổ biến nhất mà vẫn đảm bảo thông tin người dùng. Họ cho biết: “Ý tưởng này bắt nguồn từ việc xác định một cách cẩn thận quy mô của dữ liệu nhiễu để đủ bảo vệ dữ liệu người dùng. Một khi càng có nhiều người tham gia đóng góp vào khối dữ liệu chung, yếu tố nhiễu sẽ được trung bình hóa và thông tin có nghĩa bắt đầu xuất hiện.” Apple cho biết thêm rằng khi người dùng chấp nhận chia sẻ loại dữ liệu này với họ, yếu tố gây nhiễu được thêm vào dữ liệu trên điện thoại, sau đó một mẫu mã hóa ngẫu nhiên sẽ được chuyển tới máy chủ của Apple. Tuy nhiên trong đó không có chứa thông tin nhận diện thiết bị và thời gian tạo sự kiện. Còn nếu người dùng không tin vào cách làm này, họ vẫn có thể tắt nó bằng cách vào Settings -> Privacy -> Analytics, sau đó tắt mục Share iPhone Analytics là xong.

Bên cạnh việc xác định biểu tượng cảm xúc nào được dùng nhiều nhất hay bảo vệ những người bầu chọn lớp trưởng thì Differential Privacy còn là một công cụ quan trọng để giải quyết các vấn đề chuyên môn phức tạp khác. Điển hình như nó có thể được dùng để xác định tỷ lệ mắc ung thư trong một quần thể dân cư nhất định dù không xác định được cụ thể ai mắc bệnh. Nói cách khác, Differential Privacy là công cụ để thống kê được một đặc điểm của cả một tập hợp nào đó mà không phải là đặc điểm của từng phần tử.

Tham khảo Popsci, Ảnh Fortune

TIN LIÊN QUAN

Sự quan tâm của Apple tới quyền riêng tư làm khó chính nỗ lực trí tuệ nhân tạo của họ

Gần như công ty Internet nào thời buổi này cũng làm như thế, và thông tin của bạn càng được sử dụng nhiều hơn khi Google, Facebook sử dụng các hệ thống trí tuệ nhân tạo để phân tích, gợi ý, tìm kiếm thông tin cho bạn xem.

3 emoji được sử dụng nhiều nhất tại Việt Nam

Theo thông kê của Google, thống trị đế chế emoji là biểu tượng “Cười ra nước mắt”. Đây là emoji được sử dụng nhiều nhất trên cả bàn phím Google, Facebook và Twitter trong nhiều năm liên tiếp. Thậm chí, emoji này còn được thêm vào Từ điển Oxford vào

Apple phát hành iOS 11.1 Beta 3, cải thiện về hiệu năng và thêm hàng trăm emoji mới cho iPhone, iPad

Một tuần sau khi phát hành bản cập nhật thử nghiệm iOS 11.1 Beta 2 thì rạng sáng nay, Apple tiếp tục tung ra phiên bản kế tiếp là iOS 11.1 Beta 3 nhằm cải thiện về hiệu năng, sửa các lỗi còn tồn đọng và đem đến hàng trăm emoji mới cho thiết bị

Apple ra mắt mẫu đồng hồ Apple Watch Series 3 kết nối mạng Lte

Đêm 12/9 theo giờ Việt Nam, cùng với việc ra mắt iPhone mới, Apple đã chính thức cho ra mắt mẫu đồng hồ thông minh Apple Watch Series 3 dùng mạng dữ liệu cao Lte.

Dữ liệu iCloud của bạn trên thực tế có thể đang được lưu trữ trên các server của Google

Mặc dù mang cái tên hoàn toàn 'Apple' nhưng iCloud trên thực tế lại không tồn tại trên những server của Apple mà được 'gửi' ở các server thuê lại từ các công ty lớn khác như Google. Thế nhưng điều này không có nghĩa rằng mọi dữ liệu iCloud của bạn

Vụ quyền riêng tư: Facebook lại đổi giọng, ủng hộ Apple

Dù ban đầu phản ứng khá gay gắt, làm hẳn clip quảng cáo lên án Apple nhưng Mark Zuckerberg giờ lại đổi giọng, nói hành động của Apple có thể đem lại lợi ích cho Facebook.

Apple chính thức gửi đến các nhà phát triển bản beta đầu tiên của iOS 12.1

Theo trang Cultomac, vẫn như thông lệ Apple sẽ gửi đến các nhà phát triển phiên bản cập nhật iOS 12.1 beta 1 để kiểm tra trước khi tung ra bản Public dành cho tất cả người dùng. Nếu bạn đã đăng kí chương trình dùng thử dành cho các nhà phát triển

THỦ THUẬT HAY

Cách đổi DNS Google 8.8.8.8 8.8.4.4

Nghĩa là DNS sẽ dịch một tên miền thành địa chỉ IP để nhận dạng trên hệ thống mạng DNS hiện nay được áp dụng rất nhiều đặc biệt trong việc tăng tốc độ mạng truy cập Internet hoặc truy cập vào trang web bị chặn như

Thiết lập lại dung lượng Internet trên Windows 10

Tuy việc sử dụng dữ liệu Internet trên PC không phổ biến như điện thoại di động nhưng không có nghĩa là bạn không cần quan tâm đến điều đó. Dưới đây, chúng tôi sẽ hướng dẫn bạn cách thiết lập lại dữ liệu trong Windows

Đây là cách sử dụng Widget trên Windows 11 dành riêng cho bạn

Trong Windows 11, hệ thống Widget đã được làm mới hoàn toàn. Bạn có thể truy cập, theo dõi rất nhiều loại thông tin khác nhau trên một khu vực duy nhất.

7 môi trường Desktop dành cho người dùng Linux

Không có một môi trường Desktop nào được coi là chính thức cho Linux và cũng không giống như hệ điều Windows, người dùng Linux có quyền lựa chọn giữa nhiều môi trường Desktop khác nhau, tất cả đều mang những phong cách

Đây là tuyệt chiêu khắc phục lỗi TikTok âm thanh không khả dụng, bạn đã biết chưa?

Trong số các lỗi thường gặp mà bất kì người dùng nào cũng có thể gặp phải, lỗi TikTok âm thanh không khả dụng luôn nằm trong top được tìm kiếm cách khắc phục nhiều nhất vì lỗi này xảy ra thì người dùng sẽ không thể

ĐÁNH GIÁ NHANH

Trên tay iPhone 13: Thay đổi nhỏ trong thiết kế, pin lớn hơn

Trong thời gian chờ đợi iPhone 13 chính thức bán ra và có mặt tại Việt Nam, bạn hãy cùng mình trên tay iPhone 13 và khám phá những điểm hấp dẫn trên chiếc flagship mới này của Apple nhé. iPhone 13 là bản tiêu chuẩn với

Đánh giá Toyota Avanza 2018 1.5AT 7 chỗ – chật hẹp và yếu hay không?

Với mức giá 593 triệu đồng, nhưng vẫn cung cấp 7 chỗ ngồi, Toyota Avanza thực hiện nhiệm vụ lấp vào khoảng trống bên dưới mẫu xe đàn anh Fortuner. Cũng giống như chiếc xe Mitsubishi Xpander vừa ra mắt, đây sẽ là lựa

Top 5 dòng Laptop tốt nhất do người dùng bình chọn năm 2021

Dưới đây là 5 dòng Laptop được người dùng đánh giá đang mua nhất đầu năm 2021. Với số lượng đơn hàng vượt trội so với các dòng máy tính Laop khác. Nào hãy cùng TCN điểm mặt 5 chiếc Laptop đó nhé./