EzPC: próba Microsoftu, aby poprawić bezpieczeństwo danych w walidacji modelu AI

Ci, którzy pracowali w dziedzinie nauki o danych, wiedzą, że opracowanie modelu sztucznej inteligencji (AI) zazwyczaj obejmuje trzy etapy wysokiego poziomu: szkolenie, walidację i testowanie. Podczas testowania dokładności modelu przy wyborze zestawu testowego do dostrajania hiperparametrów zwykle bierze się pod uwagę wiele kwestii. Organizacje mają tendencję do wykorzystywania niektórych swoich rzeczywistych danych do walidacji w celu dokładnej oceny modeli, ale oczywiście istnieje wiele obaw związanych z bezpieczeństwem i prywatnością, szczególnie w przypadku informacji umożliwiających identyfikację osób (PII).

Jeśli Twój model jest opracowywany przez firmę zewnętrzną, zasadniczo masz dwie możliwości. Albo firma udostępni Ci swój model — co może narazić ich własność intelektualną — albo udostępnisz im swoje prawdziwe dane, co stanowi zagrożenie dla Twojej prywatności i może prowadzić do nadmiernego dopasowania modelu do rzeczywistych danych. Dokonując tych trudnych wyborów, należy pokonać wiele przeszkód prawnych. Tak więc, chociaż organizacje chcą jak najszybciej wdrożyć sztuczną inteligencję, napotykają wyzwania, gdy mają do czynienia z danymi, niezależnie od tego, czy proces tworzenia modelu ma charakter wewnętrzny, czy zewnętrzny.

Aby rozwiązać ten problem, Microsoft pracuje nad nowym frameworkiem o nazwie EzPC , co oznacza „Easy Secure Multi-party Computation”. Zasadniczo EzPC opiera się na Secure Multiparty Computing (MPC). MPC umożliwia wielu stronom wspólne obliczanie funkcji przy użyciu kryptografii bez ujawniania sobie nawzajem swoich danych.

Chociaż MPC istnieje od wielu lat, okazało się, że jest trudne do wdrożenia ze względu na wyzwania związane z jego skalowalnością i wydajnością w wielu funkcjach. EzPC rozwiązuje te problemy, wykorzystując MPC jako element konstrukcyjny i umożliwiając programistom, nie tylko ekspertom kryptograficznym, rozszerzenie jego możliwości. Według Microsoftu:

EzPC opiera się na dwóch innowacjach. Po pierwsze, modułowy kompilator o nazwie CrypTFlow pobiera jako dane wejściowe kod TensorFlow lub Open Neural Network Exchange (ONNX) do wnioskowania ML i automatycznie generuje kod podobny do C, który można następnie skompilować do różnych protokołów MPC. Ten kompilator obsługuje MPC i jest zoptymalizowany pod kątem wydajności i skalowalności protokołów MPC. Drugą innowacją jest zestaw wydajnych protokołów kryptograficznych do bezpiecznego przetwarzania złożonych funkcji uczenia maszynowego.

Microsoft chwalił się, że EzPC zapewniło „pierwszą w historii bezpieczną walidację modelu AI klasy produkcyjnej” w testach z naukowcami z Uniwersytetu Stanforda, udowadniając, że nie trzeba wymieniać danych, aby przeprowadzić walidację. Chociaż model EzPC firmy Microsoft wymagał 15 minut na bezpieczne wnioskowanie z elementem walidacji – który jest 3000 razy dłuższy niż normalne wnioskowanie – na „dwóch standardowych maszynach wirtualnych w chmurze”, firma twierdzi, że nie ma to znaczenia, ponieważ paralelizm obliczeniowy może rozwiązać ten problem. problem. Zgodnie z obecną metodologią, w ciągu pięciu dni wywnioskowano ponad 500 obrazów w zestawie walidacyjnym, przy całkowitym koszcie mniejszym niż 100 USD. Microsoft twierdzi, że mógłby ukończyć dane wyjściowe dla całego zestawu w 15 minut, gdyby wszystkie dane były przetwarzane równolegle. Możesz zapoznać się z ustaleniami w artykule opublikowanym tutaj .

W związku z tym Microsoft zachęca do korzystania z EzPC, podkreślając jego podstawę w MPC. Organizacje korzystające z EzPC będą również w stanie ominąć przeszkody prawne, zapewniając, że model AI jest dokładnie oceniany przed zastosowaniem go w środowiskach produkcyjnych. EzPC to framework open source, który można znaleźć na GitHub tutaj . Możesz także śledzić najnowsze osiągnięcia w tej inicjatywie tutaj i przeczytać artykuły naukowe na ten temat tutaj .

Dodaj komentarz Anuluj pisanie odpowiedzi