Q&A

Maahanmuuttajien osaamiskeskuksen analytiikka-/tekoälytutkimus

Teknologian tutkimuskeskus VTT tutkii vuosina 2021−2024, kuinka espoolaiset maahanmuuttajat ovat käyttäneet erilaisia julkisia palveluja.

Vastaamme ohessa kysymyksiin, joiden uskomme askarruttavan erityisesti tutkimuksen kohderyhmää eli maahanmuuttajataustaisia espoolaisia.

1. Miksi analysoitte ihmisten yksityisiä henkilötietoja?

Emme analysoi henkilötietoja. Kaikki henkilötiedot, kuten nimi, henkilötunnus ja osoite, salataan jo siinä vaiheessa, kun tietoja haetaan viranomaisten rekistereistä. Nämä salatut tiedot siirretään tutkimusympäristöön ja yhdistetään isoon tietomassaan. Tutkijat analysoivat vain tuota isoa tietomassaa.

Siten yksittäisiä henkilöitä ei pysty tunnistamaan analysoitavasta tiedosta missään vaiheessa. Viranomaisilla, kuten Espoon kaupungilla, Omnian osaamiskeskuksella tai Kelalla, ei ole pääsyä tutkimustietoon. Emme siis ole rakentamassa ”tarkkailusysteemiä”, josta voisimme katsoa yksittäisten asiakkaiden tietoja. VTT huolehtii tietoturvasta ja yksityisyydensuojasta äärimmäisen tarkasti.

Tutkimuksen tavoitteena on auttaa viranomaisia tunnistamaan paremmin, millaisia tukipalveluja maahanmuuttajat tarvitsevat eri elämänvaiheissa siihen, että he työllistyisivät ja kotoutuisivat nykyistä paremmin. Suurten tietomassojen analysoinnissa tekoäly on tehokas ja tietoturvallinen apu. Pelkästään ihmistyönä tällainen tutkimus ei olisi mahdollista.

2. Miksi haluatte tutkia juuri maahanmuuttajien kotoutumista ja kotouttamispalveluja?

Tutkimuksella on tärkeä yhteiskunnallinen tavoite: parantaa maahanmuuttajien kotoutumista Suomeen. Haluamme lisätä ymmärrystä siitä, miten maahanmuuttajille suunnatut palvelut toimivat ja miten niitä pitäisi kehittää.

Kotouttamistyötä tekevät useat eri viranomaiset. Kotouttaminen on virallisesti kuntien vastuulla, mutta kunnan sisällä sen toteuttamiseen osallistuvat useat eri ammattialat. Lisäksi joillakin valtion viranomaisilla ja järjestöillä on oma roolinsa. Jos halutaan tietää, miten kotouttaminen toimii, on kerättävä tietoa useista organisaatioista.

Toivomme, että saamme tutkimuksesta lisäymmärrystä esimerkiksi sille, millaista koulutusta maahanmuuttajat tarvitsevat eri vaiheissa kotoutumistaan. Haluamme oppia ymmärtämään, miten erilaisten asiakasryhmien kouluttautumista ja työllistymistä voidaan tukea aiempaa yksilöllisemmin. Kun ihmiset saadaan kotoutettua hyvin, he myös työllistyvät nopeammin, mikä tuottaa hyvinvointia sekä yksilöille että yhteiskunnalle.

3. Miten huolehditte tietoturvasta?

Kaikki tietojenkäsittely tehdään äärimmäisen tietoturvallisesti. Henkilötiedot säilyvät salassa. Se on taattu parhailla olemassa olevilla mekanismeilla. Yksittäistä henkilöä ei pysty tunnistamaan tutkittavasta datasta missään vaiheessa.

Henkilötiedot (nimi, henkilötunnus, osoite ym.) salataan jo tiedonhakuvaiheessa, eli ennen kuin tietoja siirretään tutkimusympäristöön. Tutkimusympäristö tarkoittaa paikkaa, jossa henkilötiedoista siivottua dataa tutkitaan.

Espoon kaupunki, Omnia ja Tilastokeskus huolehtivat datan siirrosta ympäristöön ja käyttävät siihen salattuja tiedonsiirtoyhteyksiä.

Dataa tutkitaan Tilastokeskuksen äärimmäisen tietoturvallisessa Fiona-ympäristössä. Sinne pääsevät vain nimetyt tutkijat. Kaikista datan katselu- ja käsittelykerroista tallentuu käyttäjäkohtainen merkintä. Tilastokeskus seuraa näitä jatkuvasti, ja epäilyttäviin merkintöihin puututaan välittömästi, matalalla kynnyksellä.

Lisäksi VTT ja Tilastokeskus tarkastavat datasta saadut tulokset ennen kuin niitä tuodaan ulos Fiona-ympäristöstä. Tutkimusdata ei poistu ympäristöstä missään vaiheessa, eikä tutkijoilla ole lupaa käyttää analytiikassa muuta ympäristöä kuin Fionaa.

4. Kenen tietoja tutkimuksessa käytetään?

Tutkimuksessa muodostetaan kaksi ryhmää:

  1. Omnian maahanmuuttajien osaamiskeskuksen asiakkaat
  2. Espoossa asuvat maahanmuuttajat, jotka eivät ole olleet osaamiskeskuksen asiakkaita.

Vertailuryhmään valitaan henkilöitä siten, että heidän taustamuuttujansa ovat samanlaiset kuin osaamiskeskuksen asiakkaiden ryhmällä. Tämä tarkoittaa, että kahden ryhmän asiakkailla esimerkiksi samoja oleskeluluvan perusteita ja samankaltaista työttömyyshistoriaa ja että he ovat hyödyntäneet samanlaisia julkisia palveluja.

Maahanmuuttajien osaamiskeskuksen vuosittaiseksi asiakasmääräksi on arvioitu noin 600 henkilöä. Viiden vuoden tutkimusaikana syntyisi siten noin 3 000 henkilön tutkittava ryhmä. Ryhmään kuuluu maahanmuuttajataustaisia TE-toimiston asiakkaita, joiden koulutustausta ja työhistoria on moninaista ja joilla on ollut vaikeuksia työllistymisessä.

Vertailuryhmäksi kerätään samansuuruinen näytejoukko (noin 3 000 henkilöä). Siten tutkimuksessa yhdistetään kaikkiaan noin 6 000 henkilön tietoja.

5. Mitä tietoja tutkimuksessa kerätään?

Tutkimuksessa yhdistetään seuraavia asiakastietoja maahanmuuttajataustaisista espoolaisista:

  • taustamuuttujia, kuten ikä, sukupuoli, siviilisääty ja perheen lasten lukumäärä
  • koulutus ja osaaminen (yleinen ja työvoimakoulutus)
  • tulot, verot ja etuudet
  • tiedot palvelu- ja työttömyyshistoriasta (mm. työkokeilut, harjoittelut ja työhallinnon asiakkuuden alkaminen, työnhaku, työllistyminen, työllistäjä, työhistoria, työkunto)
  • toimeentulotuki (myös harkinnanvarainen toimeentulotuki), kuntoutuspalvelut tai erityiskustannuskorvattavat lääkkeet
  • mahdollisesti oleskeluluvan tai -oikeuden peruste yleisellä tasolla (työ, opiskelu, perhe, kansainvälinen suojelu, muu peruste) – vuoden 2021 aikana selviää, saadaanko tutkimukseen yhdistettyä nämä tiedot
  • Omnian opiskelijarekisterin / Maahanmuuttajien osaamiskeskuksen tiedot mm. motivaatiosta kouluttautumiseen ja työllistymiseen, perhesuhteista ja sosiaalisista verkostoista
  • tiedot Espoon kaupungin sosiaali- ja terveyspalvelujen käytöstä (käyntien ja diagnoosien lukumäärät, ei käyntien syitä)

6. Miltä ajalta keräätte tietoja ja kuinka kauan säilytätte tietoja?

Dataa kerätään neljästi vuodessa, viiden vuoden ajan.  Ensimmäisellä kerralla kerätään henkilöiden taustahistoria vuodesta 2009 alkaen ja dataa kerätään vuoteen 2024 asti.

Data tuhotaan 5 vuoden kuluttua projektin päättymisen jälkeen, eli vuonna 2029.

7. Miltä aikaväliltä tietoja kerätään?

Tutkimuksessa kerätään tietoja aikaväliltä tammikuu 2009–joulukuu 2024. Maahanmuuttajien osaamiskeskus on ollut toiminnassa vuoden 2019 alusta, joten sen toiminnasta saadaan dataa vuosilta 2019–2024, mutta taustamuuttujia kerätään vuodesta 2009 alkaen.

8. Mistä tiedän, ovatko minun tietoni / asiakkaani tiedot mukana kokeilussa?

Jos olet osaamiskeskuksen asiakas, silloin tietosi ovat mukana, koska dataa kerätään kaikilta osaamiskeskuksen asiakkailta. Kaikki tutkittava data on peräisin asioinnista osaamiskeskuksessa tai muissa viranomaispalveluissa. Mitään tietoja ei siis kerätä pelkästään tutkimusta varten, vaan tutkimus tehdään muutenkin kerättävien tietojen pohjalta.

Sitä, kuulutko vertailuryhmään vai et, ei voida jäljittää, koska tutkimusaineistosta ei voida tunnistaa yksittäisiä henkilöitä. Jos kuitenkin tiedät, että olet asunut Espoossa ja asioinut esim. Kelan, Veron, työhallinnon tai Espoon kaupungin palveluissa vuonna 2009 tai sen jälkeen, on mahdollista, että tietosi ovat mukana. Vuoden 2021 aikana selviää, saadaanko tutkimukseen yhdistettyä myös oleskeluluvan yleistä perustetta koskeva tieto Maahanmuuttovirastosta (työ, opiskelu, perhe, kansainvälinen suojelu, muu peruste).

Ks. myös vastaus kysymyksiin 4 ja 5.

9. Voinko kieltää tietojeni käyttämisen tutkimukseen?

Et voi. Vaikutusten arviointi toteutetaan rekisteritutkimuksena. Tämä tarkoittaa, että tutkimus perustuu vain tietoihin, joita on kerätty ja tullaan keräämään normaalien palvelujen yhteydessä. Tutkittaville ei tehdä erityisiä kyselyitä tai haastatteluja tutkimusta varten.

Tutkimus ei vaikuta mitenkään tutkittavien saamiin palveluihin tai etuuksiin. Tutkittavat saavat samat palvelut ja etuudet, jotka he saisivat, vaikka eivät olisi tutkittavina.

10. Mitä vaikutuksia tutkimuksella on tutkittaviin?

Yksittäisiin tutkittaviin tutkimuksella ei ole vaikutusta.

11. Miten saan tietää, mitä tietoja minusta on tallennettu tutkimuksessa mukana oleviin järjestelmiin? Voinko tehdä esim. tietopyynnön itseäni koskevista tiedoista?

Tutkimusryhmä käsittelee tutkimuksessa mukana olevien henkilörekisterien tietoja pseudonymisoituna eli salattuna, ilman tunnisteita. Tämä tarkoittaa, että eri rekistereistä kerättyjä tietoja ei voi eritellä, koska tunnistetietoja (nimi, henkilötunnus jne.) ei ole enää mukana.

Kukin tutkimukseen tietoja luovuttanut viranomainen pitää rekisteriä omista asiakastiedoistaan. Siksi pyyntö pitää kohdistaa jokaiselle rekisterinpitäjälle eli palveluja tarjoavalle viranomaiselle erikseen. Voit pyytää mukana olevien järjestelmien henkilötietosi samalla tavoin kuin henkilötiedot muutenkin pyydetään.

  • Voit pyytää omia tietojasi omakätisesti allekirjoitetulla rekisteritietojen tarkastuspyynnöllä, jonka toimitat kyseisen viranomaisen kirjaamoon.
  • Tarkat ohjeet tietopyyntöön saat kultakin viranomaiselta erikseen.