Sztuczna inteligencja zmieniła rzeczywistość. Choć oczywiście nie w sposób, jaki prorokowali twórcy SF – zamiast świadomych maszyn mamy praktyczne narzędzia znajdujące zastosowanie w wielu dziedzinach życia. Ba! Odkąd dane uważa się za podstawę funkcjonowania globalnej cywilizacji, wydajne działanie biznesu, handlu czy bankowości przestało być możliwe bez sztucznej inteligencji zdolnej przetworzyć ogrom informacji. Należy jednak pamiętać, że AI oraz bazy danych nie są odporne na błędy, które możemy popełnić przy ich tworzeniu i użytkowaniu. Ceną popełnienia tych błędów może być wyciek danych i utrata prywatności. Przez to nadrzędnym problemem staje się dziś kwestia zabezpieczenia informacji oraz tego, komu je powierzamy.

Metadane a profilowanie, czyli krótko o anonimowości

Dziś dla wielu przedsiębiorców warunkiem koniecznym do zachowania konkurencyjności jest posiadanie informacji na temat swoich klientów. Firmy interesują dane, które pozwalają w szczególności na dostosowanie swojej oferty do potrzeb konsumenta. W ostatnich latach obserwujemy więc dynamiczny rozwój technologii dających takie możliwości. Doskonałym przykładem są rozwiązania wypracowane na polu wizji komputerowej (ang. computer visionCV). Sztuczna inteligencja wykorzystująca obraz z kamer potrafi dziś między innymi rozpoznawać płeć, oszacować wiek, trafnie odczytać emocje na twarzach lub na podstawie tablicy rejestracyjnej określić skąd przyjeżdża samochód. Możliwości narzędzi opartych na wizji komputerowej są ogromne i wiele branży na czele z przemysłem, czy handlem detalicznym słusznie upatruje w nich szansy na rozwój. Nie piszemy o integracji z social media z premedytacją - zasługują na osobny tekst. Profilowanie można jednak przeprowadzić na podstawie jedynie zachowania na danej stronie bądź aplikacji. O samym profilowaniu wspominamy zaś nie bez powodu. Wielu osobom może się ono kojarzyć z inwigilacją rodem z filmów sensacyjnych, a wątpliwości dotyczą głównie tego, czy AI jest w stanie wyekstrahować dane umożliwiające identyfikację konkretnych osób. Aby rozwiać obawy, zacząć trzeba od zrozumienia, jakiego rodzaju informacje zasilają wymienione technologie. Mowa o metadanych.

Możliwości narzędzi opartych na wizji komputerowej są ogromne i wiele branży na czele z przemysłem, czy handlem detalicznym słusznie upatruje w nich szansy na rozwój.

Czym są? Mówiąc najprościej, to informacje o informacjach. Istotę pojęcia wytłumaczyć można na przykładzie zwykłej rozmowy telefonicznej. Danymi nazwalibyśmy treść rozmowy, zaś metadane to długość połączenia, jego koszt, wybrany numer itp. Oczywiście nawet w takim wypadku można mówić o ryzyku pogwałcenia zasad etyki. Ktoś, kto analizując bilingi rozmów zauważy, że często dzwoniliśmy do immunologa, może wysnuwać konkretny wniosek na temat naszego stanu zdrowia. Wracając jednak do zagadnienia profilowania klienta nie można nie zauważyć, że uzyskiwane informacje dają jedynie bardzo ogólną wiedzę istotną wyłącznie z punktu widzenia działań marketingowych. Przykładowo, AI korzystające z CV przeanalizuje dane wizualne, by stwierdzić, że klientami sklepu odzieżowego są w większości młode osoby w nieformalnym stroju, lecz ich jednostkowa tożsamość nie będzie identyfikowana. Profil jest opisem, a nie personalną informacją przypisaną do konkretnego człowieka. Nawet w przypadku wycieku takich metadanych (co przy odpowiednim zabezpieczeniu jest trudne), ujawnione zostaną najwyżej informacje o charakterze statystycznym, lub określające większą grupę klientów.

 

 

Zatem w przypadku stosowanych przez nas rozwiązań CV i narzędzi analitycznych już od początku projektowania tworzone były tak aby zminimalizować możliwość jakiejkolwiek inwigilacji czy śledzenia. Ponadto nasze narzędzia nie przetwarzają materiału wejściowego dłużej, niż jest to konieczne dla uzyskania metadanych, co w praktyce oznacza, że  informacje pozwalające na czyjąś jednoznaczną identyfikację nie są zapisywane. W bazie pojawiają się tylko metadane i od tego momentu możemy zacząć przyglądać się bliżej kwestii ich bezpiecznego przechowywania.

Chmury i serwery – jak uniknąć zagrożeń?

W 2019 roku doszło do wycieku danych Capital One, jednego z amerykańskich gigantów bankowych. Atak hakerów zagroził bezpieczeństwu informacji ponad 106 milionów posiadaczy kart kredytowych Capital One. Skala tego zdarzenia udowadnia, że wyciek danych to problem, który może dotyczyć nawet największych rynkowych graczy. Wyniki późniejszego śledztwa w sprawie wskazują na kluczową kwestię całego zagadnienia przechowywania danych – zabezpieczeń. Capital One dopuściło się zaniedbań już poziomie konfiguracji środowiska chmurowego, co czyniło ich system podatnym na ataki.

 

Czynnika ludzkiego nie da się oczywiście w pełni wyeliminować. Pozostaje więc minimalizowanie ryzyka, a tu zasadniczą sprawą jest wybór sposobu magazynowania danych i dostosowania zabezpieczeń. Opcje są dwie: własne serwery (możemy je uznać za rozwiązanie „tradycyjne”), oraz technologie chmurowe, którym powinniśmy się przyjrzeć w pierwszej kolejności, bowiem to one na przestrzeni kilku lat zrewolucjonizowały sposób przechowywania informacji. Faktem jest, że chmury publiczne ułatwiają dostęp do zasobów. Ten model ma jednak swoje ograniczenia, a zagrożenie ze strony cyberprzestępczości nie jest jedynym ryzykiem. Firmy korzystające z aplikacji chmurowych nie muszą utrzymywać własnej, często drogiej infrastruktury. Powierzają jednak pieczę nad danymi firmom, których działania w praktyce nie da się kontrolować. Przykładowo, korzystając z chmury którejś z wielkich firm z siedzibą z USA, musimy się liczyć z tym, że dostępu do naszych zasobów mogą zażądać tamtejsze agencje bezpieczeństwa, jednocześnie zakazując usługodawcy informowania nas o tym. Oczywiście świadomość opisanego ryzyka nie musi pociągać za sobą decyzji o rezygnacji z chmury publicznej. Należy jednak możliwie dokładnie weryfikować dostawców i znać wagę danych, które przechowujemy.

 

 

Choć przechowywanie w chmurze staje się coraz powszechniejsze, korzystanie z nich nie jest koniecznym wymogiem. Popularnym rozwiązaniem w wielu przedsiębiorstwach wciąż są serwery fizycznie znajdujące się w siedzibie firmy. Mimo mniejszej skalowalności, dają one pełną kontrolę nad przechowywaniem i ochroną danych. Odpowiednie zabezpieczenie praktycznie uniemożliwia niepowołanym osobom dostęp do działających na serwerze narzędzi i przetwarzanych przez nie danych. Stanowi to niewątpliwą zaletę tego rozwiązania, gdyż znacznie zmniejsza ryzyko wystąpienia niepożądanych zdarzeń, wymaga jednak wiedzy i doświadczenia ze strony administracji takich serwerów, a to wiąże się z konkretnym kosztem. Podobnie jednak jak w przypadku chmury, zagrożeń całkowicie nie da się wyeliminować. W obu przypadkach konieczne jest więc wprowadzenie praktyk takich jak na przykład haszowanie haseł, które minimalizują ewentualne szkody po wycieku.

Odpowiednie zabezpieczenie praktycznie uniemożliwia niepowołanym osobom dostęp do działających na serwerze narzędzi i przetwarzanych przez nie danych.

 

Niezależnie zaś od tego, na jaki sposób przechowywania informacji zdecyduje się klient, w przypadku współpracy z Numlabs może liczyć na wsparcie i fachowe doradztwo w zakresie dostosowania zabezpieczeń. Jako specjalistom zależy nam bowiem nie tylko na sprawnym działaniu naszych rozwiązań, ale i ochronie efektów ich pracy. Wiemy zatem, na co należy zwracać szczególną uwagę podczas konfigurowania zabezpieczeń. Ponadto możemy opierać się na infrastrukturze już wykorzystywanej przez klienta. Także i w tym przypadku będziemy w stanie wskazać, jakie kroki należy podjąć dla uniknięcia wycieku danych czy ataków.

Podsumowanie

Bezpieczeństwo i prywatność to bardzo obszerny temat, którego nie da się wyczerpać w jednym krótkim tekście, lecz w kontekście potrzeb i wymagań naszych klientów sprowadza się on głównie do zagadnienia metadanych oraz sposobu ich wykorzystania i przechowywania. Podkreślamy zatem raz jeszcze, że zanonimizowane dane użyte w procesie profilowania nawet w przypadku wycieku praktycznie nie dają możliwości naruszenia niczyjej prywatności. Zasadniczą rolę w kwestii baz danych pełni zaś odpowiedzialne podejście do ewentualnych zagrożeń i korzystanie z usług specjalistów. W Numlabs wychodzimy z założenia, że bezpieczeństwo powinno być integralną częścią każdego projektu. Dlatego oprócz czuwania nad jakością naszych produktów, staramy się służyć wiedzą dotyczącą bezpieczeństwa.