“Federated Learning accelerates model development while protecting privacy.”

Data Science and Machine Learning Trends You Can’t Ignore, September 2021​

Federated Learning: A managed process for combining models trained separately on separate data sets that can be used for sharing intelligence between devices, systems, or firms to overcome privacy, bandwidth, or computational limits.“

Five Key Advances Will Upgrade AI To Version 2.0 For Enterprises, February 2021​

While Federated Learning is a nascent technology, it is highly promising and can enable companies to realize transformative strategic business benefits. ​"FL is expected to make significant strides forward and transform enterprise business outcomes responsibly.”

Ritu Jyoti, group vice president, Artificial Intelligence Research at IDC.​

“Federated Learning: AI's new weapon to ensure privacy.

A little-known AI method can train on your health data without threatening your privacy, March 2019​

“Federated Learning allows AI algorithms to travel and train on distributed data that is retained by contributors. This technique has been used to train machine-learning algorithms to detect cancer in images that are retained in the databases of various hospital systems without revealing sensitive patient data.

The New Tech Tools in Data Sharing, March 2021​

Ikaskuntza
federatua

Ikaskuntza federatua Ikaskuntza automatikoko paradigma bat da, eta sistema edo nodo ezberdinetan banatutako datuekin (adibidez, telefonoetan, ospitaleetan edo bankuetan kokatutako datuak) ereduak trebatzeko aukera ematen du, datuen pribatutasuna bermatuz.

Hori lortzen da nodo bakoitzean tokian tokiko ereduak trebatzen (adibidez, ospitale bakoitzean, banku bakoitzean edo telefono mugikor bakoitzean) eta ereduaren parametro eguneratuak soilik partekatuz eta modu seguruan bateratuz eredu global hobea eraikitzeko (datuak ez dira inoiz irteten). nodoa eta, beraz, ez da inoiz partekatzen).

Urte askotako ikerketaren ondoren, Sherpa.ai-k datuen pribatutasunari buruzko ikaskuntza-plataformarik aurreratuena garatu du, pribatutasuna hobetzeko teknologia osagarriak barneratuz (adibidez, pribatutasun diferentziala, enkriptazio homomorfoa, zati anitzeko konputazio segurua).

IRTENBIDE TRADIZIONALA

federated learning profile picture
  • Pribatutasuna urratzeko arrisku handiagoa.
  • Ez du araudia betetzen.
  • Datuen kontrola galtzen da zerbitzaritik irtetean.
  • Eraso azalera handia.

SHERPA.AI FEDERATU IKASKUNTZA-IRTENBIDEA

federated learning profile picture
  • Lankidetza-ereduen potentziala maximizatzen du datu pribatuak partekatu gabe.
  • Privacy by design.
  • Araugintza betetzea: datuak ez dira inoiz inplikatutako alderdien zerbitzaritik irteten.
  • Pribatutasun-urraketa arriskua murriztea. Eraso-azalera murrizten da.
  • Ereduak nola entrenatzen diren eta datuak nola erabiltzen diren buruzko gardentasuna.

NOIZ ERABILTZEN DIO IKASKUNTZA FEDERATUAK EREDUKO PRESTAKUNTZATIK?

Ikaskuntza federatua eten egiten du datuen pribatutasuna derrigorrezkoa den kasuetan, datuak partekatu behar ez direlako.

Datuek informazio konfidentziala edo sentikorra dutenean hala nola, osasun-informazioa babestua, finantza-erregistroak edo pertsona identifikatzen duen beste edozein informazio pribatu.

Datuak ezin direnean erabili edo partekatu araudia betetzeagatik oso araututako industrietan mugatuta baitago, hala nola finantza-zerbitzuetan edo osasun-zerbitzuetan.

Hala ere, eskuragarri dauden datuak hobeto erabiltzeak eragin handia izango luke prozesuak hobetzeko edo gaixotasun arraroak bezalako erronka garrantzitsuak konpontzeko.

Erakunde ezberdinek euren datuak partekatu gabe aprobetxatu nahi dituztenean.

Esaterako, bi erakunde lehiakor arazo komun bat konpon lezakete lankidetza-prestakuntza-eredu baten bidez, baina ez daude jabedun datuak elkarren artean partekatzeko prest lehia-arrazoiengatik. Ikaskuntza federatuak eredu kolaboratiboan trebatzea ahalbidetzen du, datuak partekatu gabe.

FEDERATED LEARNING GENERATIONS

schema of federated learning generations

DATU HETEROGENEOTAN TREBATZEKO ERRONKA

Ikaskuntza Federatu Horizontalean datuak homogeneoak dira. Horrek esan nahi du nodo desberdinetako datu multzoek ezaugarri berdinak (zutabeak) dituztela baina laginetan desberdinak direla. Beraz, eredu bat alderdien artean partekatu daiteke eta elkarlanean trebatzen da.

Mundu errealeko eszenatoki gehienetan, hori ez da horrela; izan ere, nodo ezberdinek normalean datu heterogeneoak edukiko lituzkete, hau da, datuek ezaugarrietan desberdinak izaten dituzte.

Horrek esan nahi du ezin dela eredu bera erabili eta teknika berriak garatu behar direla.Sherpa.ai-k datu heterogeneoekin prestakuntza ahalbidetu dezake bere plataforman Ikaskuntza Federatua Bertikala eta Ikasketa Federatua Transferitzea

IKASKUNTZA PARADIGMA FEDERATUAK

FOR HOMOGENEOUS DATA
FOR HETEROGENEOUS DATA

IKASKUNTZA FEDERATU HORIZONTALA​

schema of horizontal federated learning

Ikasketa federatu horizontala agertoki horietan sartzen da, non datu-multzoak ezaugarri-espazio bera partekatzen duten (zutabe-mota bera) baina laginetan desberdinak (errenkada desberdinak).

Ikaskuntza federatu horizontalak datu homogeneoak soilik onartzen ditu, hau da, ezaugarri berdinak dituzten datuak.

Adib. Nodo ezberdinek ezaugarri berdinak dituzte (zutabeak) baina desberdinak dira laginetan. Eredu bera erabil daiteke bi nodoetarako

Use cases: Gaixotasunen diagnostikoa.

KASKUNTZA FEDERATU BERTIKALA​

schema of vertical federated learning

Ikaskuntza federatu bertikala aplikatzen da bi alderdiek erabiltzaile gainjarri dituzten laginak dituztenean, baina ezaugarri komun mugatuak dituztenean.
Ikaskuntza federatu bertikalak datu heterogeneoak onartzen ditu, non nodo ezberdinek erabiltzaile komunak dituzten datu multzoak dituzten, baina ezaugarri desberdinak. Datu heterogeneoekin, ezin da eredu bera erabili eta teknika berriak garatu behar dira.

Use cases: eremu bereko bi enpresa mota ezberdinek erabiltzaile berdinak izan ditzakete; hala ere, bakoitzaren datuen ezaugarriak desberdinak dira. Adibidez, banku batek kreditu-erregistroak izango lituzke telekomunikazio-enpresa batek arakatze-historia izango luke.

IKASKUNTZA TRANSFERENTZIA FEDERATUA​

schema of federated transfer learning

Transferentzien ikaskuntza federatua aplikatzen da bi alderdik edo gehiagok lagin gainjarri dituztenean erabiltzaile mugatuekin eta ezaugarri komun mugatuekin.

Sistemak erabiltzaile arruntengandik ikas dezake datu-multzo batean eta ezagutzak transferi ditzake bezero berriei aplikatzeko.

Use cases: bi aseguru-konpainiek iruzurra hautematea hobetu dezakete ikaskuntza federatuaren bidez trebatzeko ereduak eginez, eta, horrela, bi konpainiek iragarpen-algoritmo oso zehatza izango lukete, baina ez lituzkete beren negozio-datuak beste alderdiarekin partekatuko.

schema of federated coming soon
COMING SOON

TWO-LAYER PRIVACY AND SECURITY SYSTEM

  • Data is never shared, only learnings
    • Learnings/model parameters are protected through different Privacy-Enhancing Technologies like Homomorphic Encryption, Secure Multiparty Computation or Differential Privacy
    • Sherpa.ai applies PETS to parameters and since the quantities to be encrypted are more compact than full data, this leads to reduction of:
    • Communications
    • Computational cost in the operations on encrypted data
    • Carbon footprint
two layers

DATA IS NEVER SHARED
FEDERATED LEARNING

Federated Learning is not enough. Therefore Sherpa.ai has developed a platform that incorporates complementary Privacy-Enhancing Technologies (Differential Privacy, Secure Multi-party Computation or Homomorphic Encryption among others) to ensure robustness of the platform.

Sherpa.ai's platform has revolutionary potential for heavily regulated sectors like Healthcare or Financial Services, where privacy as well as regulatory compliance are essential. By adding complementary technologies to ensure privacy is maintained, Sherpa.ai unlocks new scenarios of development and collaboration between organizations.

PARAMETERS ARE PROTECTED
PRIVACY-ENCHANCING TECNOLOGIES (PETs)

Federated Learning is not enough. Therefore Sherpa.ai has developed a platform that incorporates complementary Privacy-Enhancing Technologies (Differential Privacy, Secure Multi-party Computation or Homomorphic Encryption among others) to ensure robustness of the platform.

Sherpa.ai's platform has revolutionary potential for heavily regulated sectors like Healthcare or Financial Services, where privacy as well as regulatory compliance are essential. By adding complementary technologies to ensure privacy is maintained, Sherpa.ai unlocks new scenarios of development and collaboration between organizations.

PRIBATUTASUNA ZAINTZEKO TEKNOLOGIAK
(PETs)

Ikaskuntza federatua ez da nahikoa. Horregatik, Sherpa.aik pribatutasuna hobetzeko teknologia osagarriak (pribatutasun diferentziala, alderdi anitzeko konputazio segurua edo enkriptazio homomorfoa, besteak beste) barne hartzen dituen plataforma garatu du, plataformaren sendotasuna bermatzeko.

Sherpa.ai-ren plataformak jokoak aldatzeko ahalmena du oso araututa dauden industrietarako, hala nola osasun-zerbitzuak edo finantza-zerbitzuak, non pribatutasuna eta betetzea ezinbestekoak diren. Pribatutasuna bermatzeko teknologia osagarriak gehituz, Sherpa.aik erakundeen arteko garapen eta lankidetzarako eszenatoki berriak irekitzen ditu.

Pribatutasun diferentziala datuen agregazioak emateko teknika estatistiko bat da, datu-erregistro indibidualen ihesak saihestuz. Teknika honek bermatzen du tokiko parametroen komunikazioan parte hartzen duten eragile gaiztoek ezin dutela informazio hori datu-iturrietara itzuli, datuen pribatutasun-geruza gehigarri bat gehituz.

PRIBATUTASUN DIFERENTZIA GUZTIAREN GAINEKO

Datuen mailan pribatutasun diferentziala da inplementaziorik ohikoena eta mugatzaileena. Ez du zehaztasunaren eta pribatutasunaren arteko oreka ona ematen, eta horrek ereduen prestakuntza oso konplexua egiten du, ezinezkoa ez bada.

Sherpa.ai-ren pribatutasun-ikuspegi diferentzialak zehaztasunaren eta pribatutasunaren arteko punta-puntako konpromiso enpirikoa eskaintzen du. Pribatutasun Diferentziala erabiliz, jatorrizko informazioa zarata kontrolatu eta moldagarriarekin ezkutatuz daturik ezin dela lortu ziurtatzen dugu, algoritmo iragarlearen errendimendua mantenduz. Horrek aktore gaiztoek bezeroen datuak lortzea, jarraipena edo ondorioztatzea eragozten dute, baita alderantzizko ingeniaritza tekniken bidez ere.

diferencial-privacy
GAINERATU MAILAN

Sherpa.ai-k bakarrik gehitu dezake zarata agregazio mailan ereduaren zehaztasuna murriztu gabe.

MODELO PARAMETRO MAILAN

Zarata parametro mailan gehi daiteke, agregazio mailan zarata deuseztatze partziala sortuz. Sherpa.ai-ren sentsibilitatea kalkulatzeko mekanismo aurreratuak datuen tokiko azterketa zehatza dakar, aplikatu beharreko zarata maila optimoa doitzeko.

DATU MAILAN

Ezarpen ohikoena eta mugatzaileena. Ez du zehaztasunaren eta pribatutasunaren arteko oreka ona eskaintzen, ereduen prestakuntza oso konplexua edo ezinezkoa bihurtzen du eta datuen izaera kaltetzen du.

A challenge in the standard Vertical Federated Learning is to reduce the huge number of communications in a distributed scenario

Blind Learning is a fundamental functionality for Federated Learning for heterogeneous data, achieved through the generation of fake targets:

Fake target generation obeys two principles:

  • Different fake targets are generated for each example (to enhance privacy);
  • There must be a general rule (working not only on available examples) to map a fake target to the corresponding real label (to let the trained model generalize well).

With Blind Learning the number of communications are reduced by over 99%, with the following benefits:

  • Lower costs
  • Lower risk of data breaches which massively improves security and privacy
  • Lower energy consumption and carbon footprint

Enkriptatze homomorfoa enkriptazio-eskema klase zehatz bat da, erabiltzaileei datuen gaineko eragiketa batzuk egiteko aukera ematen diena datuak enkriptatutako egoeran dauden bitartean.

Homomorfoa aljebra aurreratuko terminoa da, testu arruntaren eta datu enkriptatuen arteko egitura zaintzeko erlazioari buruz hitz egiten duena. Datu/testu zifratuaren konputazioaren emaitzak datu/testu argiaren berdinak direnez, funtzio hauek homomorfismotzat har daitezke.

Sherpa.ai-ren enkriptazio homomorfoarekin, hodeian kalkulu batzuk egin daitezke datuak erabiliz, baina pribatua mantenduz. HE erabiliz, zure datuen enkriptatutako bertsioa hodeira bidal dezakezu, bertan kalkulua egin eta gero deszifratu dezakezun emaitza enkriptatua berreskura dezakezu. Urrats hauek guztiek ez dute bezeroak konektatuta egon behar. (HE onura). Beraz, HEri buruzko ideia nagusiak hauek dira: Parametroen agregazioan erabiltzen da. Abantaila nagusiak dira agregazio hau enkriptatutako parametroak erabiliz egiten dela eta komunikazio kopurua oso txikia dela beste defentsa teknikekin alderatuta.

hemomorphic-encryption

Secure Multi-Party Computation (SMPC) kriptografiaren azpiesparru bat da, alderdiek beren sarreretan funtzio bat elkarrekin kalkulatzeko metodoak sortzeko helburuarekin, sarrera horiek pribatuak mantenduz.

Zeregin kriptografiko tradizionalen ez bezala, non kriptografiak komunikazioaren edo biltegiratzearen segurtasuna eta osotasuna bermatzen baitu eta aurkaria parte-hartzaileen sistematik kanpo dagoen (igorlearen eta hartzailearen espioi bat), eredu honetako kriptografiak parte-hartzaileen pribatutasuna babesten du elkarrengandik, askoz zailagoa da parte-hartzaileak usteltzea.

Sherpa.ai-k iturri ezberdinetako datuen konputazioa banatzen duen protokolo kriptografiko bat garatu du, inork besteen datuak ikusi ezin dituela ziurtatzeko, hirugarren batengan fidatu beharrik gabe.

Hori eginez gero, zure konpainiaren datu sentikorrak babestuta daudela ziurtatzen duzu, datu horietatik beharrezko informazio guztia eskuratzeko duzun gaitasuna kaltetu gabe.

schema of differential privacy

Datu multzoak hainbat erakundetan banatzen direnean, dagozkien entitateak identifikatzea arazo bihurtzen da.

Punta-puntako teknika kriptografikoak erabiliz, datu multzo horien sinkronizazioa eta identifikazioa posible da pribatutasuna babesten eta trebatutako ereduen zehaztasuna mantenduz.

Private Set Intersection (PSI) zati guztietako laginen elkargunea zehazten du. Lerrokatzen ditu enkriptatutako/zifratutako identifikatzaileak alderatuz (adibidez, izen-abizenak, nortasun agiriaren zenbakia... edo hainbat identifikatzaileren konbinazioa). Gure puntako teknologia, n-gramen bereizketan oinarrituta, identifikatzaileetako akats tipografikoak gaindi ditzake. Hala ere, PSIk elkarguneen identifikatzaileak ikusarazten ditu alderdi guztientzat, eta hori arazoa izan daiteke kasu batzuetan. PSI-k mundu errealeko eszenatoki gehienetan debekatuta dagoen elkargune-kidetasuna agerian uzten du.

Private Set Union (PSU) alderdi bakoitzak informazio sentikorra beretzat gordetzeko aukera ematen dio. PSUk ez ditu elkarguneko kideen berri ematen.

Zero-Knowledge Proof (ZKP) informazio zehatza beste alderdi bati egiaztatzea ahalbidetzen duen enkriptazio metodo bat da, informazioa bera agerian utzi gabe.

ZKP datu-multzo pribatuen elkargunearen (PSI) inferentzia erasoen aurkako defentsan aplikatzen da. PSI-rekin, bi erakundek enkriptatutako datuen elkargunea kalkulatu dezakete, partekatu gabe. Ez da edukirik agertzen elkargunearen parte diren elementuak izan ezik.

BESTE TEKNOLOGIA INTEGRATU BATZUK

Sherpa.ai-k datu alboratuaren arazoa modu pertsonalizatuan jorratzen du eta bezero bakoitzaren berezitasunera ezin hobeto egokitzen da ikaskuntza globala gorde eta ezagutza norbanako bakoitzari egokitzen dioten teknika berritzaileak erabiliz. Hau ikasketa txanda bakoitzean gailuaren galera-funtzioak dinamikoki aldatuz lortzen da, ondoriozko eredua edozein erabiltzailerekin alboratuta egon dadin.

two silhouettes of men faced; the man on the left has thumbs up and the man of the right has thumbs down

Datu sintetikoak datuen pribatutasuna babesteko modu gisa balio du. Askotan, benetako datuek erabiltzailearen informazio pribatua eta sentikorra dute, libreki partekatu ezin dena. Pribatutasun hori gordetzeko, ikuspegi desberdinak hartzen dira, eta askotan datuen hutsunea eragiten dute, informazio eta erabilgarritasun orokorra galtzea eragiten dutenak.

Sherpa.ai-ren teknologiak datu sintetiko aurreratuen sorkuntza erabiltzen du segurtasun hutsuneak ezabatzeko, hala nola kidetasuna. Irtenbide ez-konbentzional honekin, metodo estandarrak erabiltzetik aldentzeko gaitasuna lortzen duzu, komunikazio-kostuak asko murriztuz, aurreikuspen-ereduaren zehaztasuna urritu gabe. Honek azpiko egitura lortzeko eta jatorrizko datuen banaketa estatistiko berdina bistaratzeko gaitasuna sortzen du, gauza errealetik bereiztezina izan daitezen.

schema of synthetic data generation;  on the left side, a representation of the data of two different parties and its synthetic data created and on the right side, a three dimensional representation of the variables client, features and samples

KONTRAKO ERASOEN
AURKAKO DEFENTSAK

Irtenbide teknikoak garatu dira AI-ren ahultasun espezifikoak konpontzeko entrenamendu-datu multzoa manipulatzen saiatzen diren erasoak prebenitzeko eta kontrolatzeko, ereduak errore bat eragiteko diseinatutako sarrerak edo ereduaren hutsegiteak.

Ikasketa eredu federatuak, saihesten ez badira, iragarpen okerrak ematen engainatu daitezke eta nahi den emaitza eman dezakete. Emaitza okerra lortzeko sarrera bat modu zehatz batean diseinatzeko prozesua aurkako erasoa da. Eraso hauek prestakuntza-datuetatik informazioa ondorioztatzea dute helburu.

Irtenbide teknikoak garatu dira AI-ren ahultasun espezifikoak konpontzeko entrenamendu-datu multzoa manipulatzen saiatzen diren erasoak prebenitzeko eta kontrolatzeko, ereduak errore bat eragiteko diseinatutako sarrerak edo ereduaren hutsegiteak.

Defentsa bat asegarria den egiaztatzeko modurik onena eraso mota ezberdinekin probatzea da. Hori dela eta, eraso sorta zabala diseinatu da ereduak guztiz pribatuak direla egiaztatzeko.

schema of defense against data attacks

Kideen inferentzia erasoek pribatutasunaren babesari kalte egiten dioten filtrazioak sortzen dituzte. Sherpa.ai-k Pribatutasun Diferentzialaren ahalmenari esker, datuen identitatea babesteko gai diren defentsa ereduak garatu dira. Hori dela eta, ezabatu egin dira ikaskuntza-eredu bat entrenatzeko erabilitako datuen jabea noren jabea den inferentzia erasoak.

Uneoro antolaketa-eskakizunak betez eta datuen pribatutasuna bermatuz, indarrean dagoen legediaren arabera..

schema of defense against membership inference attacks

Pozoitze-erasoek prestakuntza-eredu globala arriskuan jartzea dute helburu. Hemen, erabiltzaile gaiztoek prestakuntza-datu faltsuak injektatzen dituzte ikasitako eredua hondatzeko helburuarekin, eta, horrela, ereduaren errendimenduan eta zehaztasunean eragingo dute.

Bizantziar erasoek ereduaren errendimenduari kalte egiten diote, oro har, eta kaltetu egiten dute akastuna izan arte. Hori dela eta, funtsezkoa da ikaskuntza eredu federatuak akats horiei erresistenteak egitea, non datuak kapritxoz jokatzen duten.

Sherpa.ai-ren mekanismo aurreratuekin, eredu federatuaren defentsa bermatzen da ereduaren errendimendua murriztea helburu duten eraso maltzurren aurka. Beraz, babesa portaera anormala duten bezeroen identifikazioan oinarritzen da, agregazio-prozesuan parte hartu ez dezaten.

schema of defense against byzantine attacks

Eraso hauen helburua eredu globalari bigarren mailako zeregin bat ezkutuan sartzea da. Horrek bezero aurkariek bikoitza erasotzea eragiten du, eta, beraz, ikaskuntza-ereduaren eguneraketak desberdinak dira eguneratzeetatik bezero ez-maltzurrenetara.

Atzeko ateko erasoak gainditzeko gai diren aurrekaririk gabeko algoritmoak ezarri dira. Teknologia honekin, bere modeloen errendimendua eta segurtasuna areagotzea lortzen da.

schema of defense against backdoor attacks

QUOTES
FROM OUR TEAM

Sherpa.ai-ren datu pribatutasuna duen Inteligentzia Artifizialaren plataformarako algoritmoen ezarpenean maila gorenetara iritsi gara, matematika aplikatuko metodologia aurreratuenekin

profile picture of enrique zuazua

Enrique Zuazua, Ph.D.

Senior Associate Researcher in Algorithms of Sherpa.ai

  • Chair Professor at FAU (Germany)
  • Alexander von Humboldt Award
  • Matematika aplikatuetan munduko onenatzat hartuta

Sherpa adimen artifizialeko irtenbideak eraikitzeko modua gidatzen ari da, erabiltzailearen pribatutasuna modu guztietan zainduz

profile picture of tom gruber

Tom Gruber

Chief AI Strategy Officer at Sherpa.ai

  • Co-founder and CTO of Siri
  • Head of Siri Advanced Development Group at Apple

NOLA KONPARATZEN DA
SHERPA.AI BESTE IRTENBIDEEKIN?

Sherpa.ai lehiakide diren beste teknologia batzuekin alderatzen da. Taula bat osatu dugu Sherpa.ai merkatuko beste irtenbide batzuekin nola alderatzen den ulertzen laguntzeko.

how does screenshot

JARRI HARREMANETAN SHERPA.AI-REKIN

Izan zaitez lehena AI Pribatutasuna zaintzean

Kontaktua
sherpa keynote