Як диференційована конфіденційність може захистити ваші дані? Марко Верх/Flickr, CC BY 

Технологічні компанії можуть використовувати різну конфіденційність для збору та обміну сукупними даними про звички користувачів, зберігаючи при цьому конфіденційність особистості.

Не секрет, що великі технологічні компанії, такі як Facebook, Google, Apple та Amazon, все більше проникають у нашу особисту та соціальну взаємодію, щоб збирати величезну кількість даних про нас щодня. Водночас порушення конфіденційності в кіберпросторі регулярно виходять на перші сторінки новин.

Тож як слід захищати конфіденційність у світі, де дані збираються та діляться зі збільшенням швидкості та винахідливості?

Диференціальна конфіденційність - це нова модель кібербезпеки, яка, як стверджують прихильники, може захистити особисті дані набагато краще, ніж традиційні методи.

Математика, на якій вона ґрунтується, була розроблена 10 років тому, і цей метод був прийнятий Apple та Google в останні роки.


Innersele підписатися графіка


Що таке диференціальна конфіденційність?

Диференційована конфіденційність дозволяє технологічним компаніям збирати та ділитися сукупною інформацією про звички користувачів, зберігаючи при цьому конфіденційність окремих користувачів.

Наприклад, скажімо, ви хотіли показати найпопулярніші маршрути, якими люди йдуть, проходячи парком. Ви відстежуєте маршрути 100 людей, які регулярно прогулюються парком, і чи йдуть вони стежкою чи травою.

Але замість того, щоб повідомляти конкретних людей, які проходять кожен маршрут, ви ділитеся сукупними даними, зібраними за певний час. Люди, які переглядають ваші результати, можуть знати, що 60 із 100 людей вважають за краще скористатися короткою травою, але не 60.

Навіщо нам це потрібно?

Багато урядів світу мають сувору політику щодо того, як технологічні компанії збирають та обмінюються даними користувачів. Компанії, які не дотримуються правил, можуть загрожувати великими штрафами. А. Бельгійський суд нещодавно розпорядився про Facebook припинити збір даних про звички перегляду користувачів на зовнішніх веб -сайтах або загрожувати штраф у розмірі 250,000 XNUMX євро на день.

Для багатьох компаній, особливо транснаціональних компаній, що працюють у різних юрисдикціях, це залишає їх у делікатному становищі щодо збирання та використання даних клієнтів.

З одного боку, цим компаніям потрібні дані користувачів, щоб вони могли надавати високоякісні послуги, що приносять користь користувачам, наприклад персональні рекомендації. З іншого боку, їм може загрожувати стягнення, якщо вони збирають занадто багато даних користувачів або намагаються перемістити дані з однієї юрисдикції в іншу.

Традиційні засоби захисту конфіденційності, такі як криптографія, не можуть вирішити цю дилему, оскільки вони взагалі перешкоджають технологічним компаніям отримувати доступ до даних. А анонімність знижує цінність даних - алгоритм не може надавати вам персоналізованих рекомендацій, якщо він не знає, які у вас звички.

Як це працює?

Продовжимо приклад пішохідних маршрутів через парк. Якщо ви знаєте особи тих, хто був включений у дослідження, але не знаєте, хто яким маршрутом пройшов, то можна припустити, що конфіденційність захищена. Але це може бути не так.

Скажімо, хтось, хто переглядає ваші дані, хоче з’ясувати, чи воліє Боб ходити по траві чи по доріжці. Вони отримали довідкову інформацію про інших 99 осіб, які брали участь у дослідженні, що свідчить про те, що 40 людей вважають за краще йти по доріжці, а 59 - по траві. Тому вони можуть зробити висновок, що Боб, який є 100 -ю людиною в базі даних, - це 60 -та особа, яка вважає за краще ходити по траві.

Цей тип атаки називається диференційованою атакою, і від неї досить важко захиститися, оскільки ви не можете контролювати, скільки знань хтось може отримати. Диференціальна конфіденційність спрямована на захист від такого типу атак.

Хтось, що виводить ваш пішохідний маршрут, може здатися не надто серйозним, але якщо ви заміните пішохідні маршрути результатами тесту на ВІЛ, то побачите, що існує потенціал серйозного вторгнення в конфіденційність.

Диференційна модель конфіденційності гарантує, що навіть якщо хтось має повну інформацію про 99 із 100 осіб у наборі даних, він все одно не може вивести інформацію про кінцеву особу.

Основним механізмом досягнення цього є додавання випадкових шумів до сукупних даних. У прикладі шляху можна сказати, що кількість людей, які вважають за краще переходити траву, 59 або 61, а не точна кількість 60. Неточне число може зберегти конфіденційність Боба, але це мало вплине на візерунок : близько 60% людей вважають за краще використовувати короткий шлях.

Шум ретельно продуманий. Коли Apple використовувала різну конфіденційність у iOS 10, це додало шуму окремим введенням користувачів. Це означає, що він може відстежувати, наприклад, найчастіше використовувані смайли, але використання смайликів будь -якого окремого користувача маскується.

Синтія Дворк, винахідник диференціальної конфіденційності, запропонував чудові математичні докази того, скільки шуму достатньо, щоб досягти вимоги диференціальної конфіденційності.

У чому його практичне застосування?

Диференційована конфіденційність може бути застосована до всього, починаючи від систем рекомендацій, закінчуючи службами місцезнаходження та соціальними мережами. Apple використовує різну конфіденційність збирати анонімну інформацію про використання з таких пристроїв, як iPhone, iPad та Mac. Метод зручний для користувачів, і юридично відкрито.

Диференційована конфіденційність також дозволить такій компанії, як Amazon, отримати доступ до ваших персональних уподобань щодо покупок, приховуючи конфіденційну інформацію про ваш історичний список покупок. Facebook може використовувати його для збору поведінкових даних для цільової реклами, не порушуючи політики конфіденційності країни.

Як його можна використовувати в майбутньому?

Різні країни мають різну політику конфіденційності, і зараз конфіденційні документи потрібно перевіряти вручну, перш ніж вони переїдуть з однієї країни в іншу. Це займає багато часу і коштує дорого.

Нещодавно команда з Дейкін університет розробила диференційовану технологію конфіденційності для автоматизації процесів конфіденційності в спільнотах хмарного спільного доступу в різних країнах.

БесідаВони пропонують використовувати математичні формули для моделювання законів про конфіденційність кожної країни, які можна було б перевести на “проміжне програмне забезпечення” (програмне забезпечення) для забезпечення відповідності даних. Застосування різної конфіденційності таким чином може захистити конфіденційність користувачів і усунути головний біль обміну даними для технологічних компаній.

про автора

Тяньцин Чжу, викладач кібербезпеки, факультет наук, інженерії та навколишнього середовища, Дейкін університет

Ця стаття була спочатку опублікована на Бесіда. Читати оригінал статті.

Суміжні книги

at InnerSelf Market і Amazon