Stilometric AI

Nettikiusaamista ehkäisevät tekoälypohjaiset palvelut ovat nyt suljetussa betatestivaiheessa. Lue tiedote ja lähetä tiedustelu, mikäli haluat saada pääsyn palveluihin ensimmäisten joukossa.

Tiedote: 28.5.2024

Anonyymin nettikiusaamisen torjunta sekä tekijöiden tunnistaminen tekoälyn avulla 

Puhuin viime vuonna, että olen rakentamassa ohjelmistoa, jolla voidaan luotettavasti tunnistaa netissä anonyymit kiusaajat, jotka tuntuvat ottavan kohteekseen melkeinpä kenet tahansa.

Poliisilla ja yhteiskunnalla ei ole riittäviä resursseja nettikiusaamisen estämiseksi, jolloin asiat jäävät usein vahvasti kiusaamisen uhrien kontolle. Usein asiat, joita kirjoitetaan, ovat niin raskaita, että moni uhri valitsee ummistaa silmänsä ja joutuu alistumaan kiusaamiselle.

Kiusaamisen taakka on monille liian raskas kantaa ja se vaikuttaa negatiivisesti mielenterveyteen, toimeentuloon sekä arjessa jaksamiseen. Tämä näkyy yleisen pahoinvoinnin lisääntymisenä kaikissa yhteiskuntaluokissa.

Olen nyt saanut valmiiksi kaksi erillistä ohjelmistoa, joiden tarkoituksena on suitsia nettikirjoittamisen järkyttävää kulttuuria sekä helpottaa syyllisten saamista vastuuseen kirjoitteluistaan ja vähintäänkin madaltaa kynnystä puuttua nettikiusaamiseen.

Harvalla ihmisellä, olkoon sitten kuinka tahansa paksunahkainen, on voimavaroja, aikaa tai henkistä resilienssiä kestää vaikkapa tietoon tulleiden kirjoitusten juridinen arviointi ja analysointi, sekä sen jälkeen rikosilmoituksen jättäminen poliisille, perusteluineen sekä tarvittavine aineistoineen.

Asian ei kuitenkaan tarvitse olla näin

Ensimmäinen ohjelmisto, joka on nyt edennyt suljettuun betavaiheeseen, on tekoälyyn pohjautuva palvelu, joka mahdollistaa netissä olevien anonyymien kirjoittajien profiloinnin ja näiden profiilien vertaamisen luotettavasti tiedossa olevaan materiaaliin tunnetuilta kirjoittajilta.

Havaintojen ja tutkimusten perusteella, monesti netissä anonyymisti kirjoittavat henkilöt ovat valitettavasti kirjoitusten kohteiden lähellä olevia ihmisiä. (Liite 1, tutkimusdataa nettikiusaamisesta)

Miten ohjelmisto toimii?

Kehittämäni ohjelmistopalvelu muodostaa kirjoittajien kirjoitustyyleistä erittäin tarkan sormenjäljen. Tämä sormenjälki perustuu kirjoitusten erilaisiin stilometrisiin ja kielellisiin piirteisiin, joita voidaan mallintaa matemaattisesti. Piirteet voivat olla leksikaalisia, syntaktisia, semanttisia ja pragmaattisia. Näiden piirteiden avulla voidaan saavuttaa noin 85–90% tarkkuus kirjoittajan tunnistamisessa jo tällä hetkellä. 

Ohjelmisto käyttää toiminnassaan Open AI:n uusinta tekoälyversiota, joka mahdollistaa suurienkin tietomäärien läpikäynnin sekä mallinnuksen nopeasti ja tehokkaasti. Tekoälypalvelut, kuten GPT, tuo merkittäviä hyötyjä tällaisessa analyysissä, sillä se pystyy havaitsemaan monimutkaisia kielellisiä kaavoja ja stilometrisia piirteitä, jotka voivat jäädä ihmiseltä huomaamatta.

Tekoälyn kehityksen jatkuva vauhti ja sen tarkkuuden parantuminen lupaavat tälle tulevaisuudessa entistä parempia tuloksia. Uudet mallit ja algoritmit mahdollistavat yhä tarkemman analyysin, ja näin ohjelmistomme pystyy tulevaisuudessa entistäkin luotettavammin tunnistamaan kirjoittajien sormenjälkiä ja vähentämään nettikiusaamista.

Muita käyttösovelluksia 

Tämän lisäksi ohjelmisto voi tunnistaa ja luokitella eri anonyymipalstoille "työkseen" kirjoittavat samat kirjoittajat, jotka syyllistyvät usein selkeisiin kunnianloukkauksiin sekä välillä jopa uhkauksiin, joihin uhrit eivät uskalla tai jaksa reagoida voimavarojen loppuessa. Ohjelmisto voi niin halutessaan tunnistaa nettitrolleja laajemminkin, kuten esimerkiksi trollitehtaiden levittämää disinformaatiota samalta lähteeltä tai kirjoittajalta.

Palvelun avulla voidaan tunnistaa erittäin luotettavasti esimerkiksi opiskelujen yhteydessä mahdollinen tekoälyn väärinkäyttö koulutehtävien, kuten esseiden sekä tutkielmien tekemisessä.

Toisin sanoen palvelun avulla voidaan tunnistaa, että onko teksti opiskelijan itse tekemä vai onko teksti esimerkiksi tekoälyn käsialaa.

Miten palvelua käytetään? 

Yksityishenkilö voi käyttää esimerkiksi koetun oman kiusaamisen selvittämiseksi tietolähteenä vaikkapa sähköposteja tai puhelimeen saatuja teksti- tai muita viestejä kaikista eri viestisovelluksista, jotka ovat tulleet yksittäiseltä henkilöltä. Mitä enemmän ohjelmistoon syöttää viestejä käyttäjää kohden, sitä tarkempi sormenjälki yksittäisestä ihmisestä saadaan. Ohjelmisto huomioi tuloksissaan myös erilaisten emojien käytön ja niihin liittyvät kaavamaisuudet. Viestit voidaan luokitella myös tunnetilojen mukaisesti, sillä tunnetilat ja konteksti, jossa viestit on kirjoitettu, vaikuttavat myös kirjoitustyyleihin ja tapoihin.

Missä palvelua voi kokeilla?

Ohjelmisto on tällä hetkellä suljetussa betatestivaiheessa ja uusia käyttäjiä palvelulle otetaan vain rajoitetusti ja tapauskohtaisesti. Mikäli palvelun koekäyttö kiinnostaa sinua, voit täyttää asiaan liittyvän lomakkeen tästä ja tutkimme palvelun soveltuvuutta tapaukseesi.

Palvelun hintoja ei ole vielä julkaistu, ne julkaistaan betatestivaiheen päätyttyä.

Mikäli sinut kutsutaan palvelun koekäyttäjäksi, kutsu on vapaaehtoinen, eikä velvoita palvelun käyttöön tai tilaukseen.


Netissä tapahtuvien kunnianloukkausten tunnistaminen ja rikosilmoitusten tekemisen kynnyksen madaltaminen

Toisen palvelun tarkoitus on helpottaa kunnianloukkausten rajojen ylittävien anonyymien kirjoitusten selvittelyä. Tämä palvelu käy läpi käyttäjän määrittelemät sivustot, poimii sieltä automaattisesti talteen halutun viestisisällön julkisine tunnistetietoineen. 

Ohjelmisto käyttää uusinta Chat GPT-4o -mallia siten, että se tunnistaa käyttäjän määrittelemistä sivustoista yksittäisiin henkilöihin kohdistuvat potentiaalisesti kunnianloukkauksen kriteeristön täyttävät kirjoitukset.

Ohjelmisto analysoi kirjoitukset, osoittaa ne kohdat, joita voidaan pitää kunnianloukkauksena, kirjoittaa valmiiksi juridisen perusteen sekä ottaa talteen loukkauksen ajankohdan, sijainnin sekä kaikki relevantit tiedot, joita tarvitaan esimerkiksi rikosilmoitusta varten. Ohjelmisto tekee automaattisesti PDF-tiedoston, joka voidaan tämän jälkeen helposti toimittaa sähköisesti esimerkiksi poliisille rikosilmoitusta varten.

Miksi palvelua tarvitaan ja kenelle se soveltuu?

Palvelun käyttäminen mahdollistaa, että itse uhrin ei ole välttämätöntä tutkia, perustella ja käydä läpi kaikkia kirjoitettuja asioita, vaan nyt rikosilmoituksen voi tehdä turvallisesti ja voimavaroja säästävällä tavalla tekoälyn avulla automatisoidusti.

Nettikiusaaminen on tällä hetkellä valtava ongelma, ja ilman apuvoimia harva ihminen kestää lukea itsestään kertovia haukkumisia tai jopa uhkauksia. Ohjelmisto mahdollistaakin uhrien paremman oikeusturvan sekä henkisen hyvinvoinnin, koska koko prosessin voi nyt luotettavasti automatisoida siten, että uhrin ei itse tarvitse lisätä kärsimystään lukemalla kirjoituksia itsestään.

Mikäli tiedät tai haluat selvitää, onko sinusta kirjoitettu kunnianloukkauksen kriteeristön ylittäviä tekstejä, palvelu sopii tällöin sinulle asian selvittelyssä, voimavaroja säästäen.

Miten palvelua pääsee käyttämään?

Ohjelmisto on tällä hetkellä suljetussa betatestivaiheessa ja uusia käyttäjiä palvelulle otetaan vain rajoitetusti ja tapauskohtaisesti. Mikäli palvelun käyttö kiinnostaa sinua, voit täyttää asiaan liittyvän lomakkeen tästä ja ilmoitamme, kun paikkoja vapautuu. 

Palvelun hintoja ei ole vielä julkaistu, ne julkaistaan betatestivaiheen päätyttyä.

Mikäli sinut kutsutaan palvelun koekäyttäjäksi, kutsu on vapaaehtoinen, eikä velvoita palvelun käyttöön tai tilaukseen.


Lisätiedot ja ohjelmistopalvelun käyttöön liittyvät pyynnöt sekä tiedustelut:

SAMI MINKKINEN

[email protected] 

 

Yleistä tietoa ohjelmiston tietosuojasta ja anonyymiudesta sekä tietojen säilyttämisestä

Anonyymien kirjoittajien tunnistamiseen tarkoitettu ohjelmisto toimii vain tapauskohtaisesti, eikä tallenna mitään tietoja tietokantoihin tai muualle pysyvästi, vaan kaikki tiedot poistuvat automaattisesti, kun ohjelmisto on saanut analyysin valmiiksi. Kaikki Open AI rajapintaan lähetettävä tieto ei sisällä henkilö- tai muita tietoja, vaan ainoastaan vektoroitua numeerista dataa analyysia varten, jota ei voi yhdistää mihinkään.

Esimerkiksi: Mikäli palvelussa halutaan käyttää viestejä yksittäisiltä ihmisiltä, palveluun ei koskaan tallenneta viesteihin liittyvän kirjoittajan nimeä tai henkilötietoja, vaan palvelun käyttäjät tietävät ainoastaan itse, että mistä / keneltä haluttu viesti, josta sormenjälki analysoidaan on, esimerkiksi viestit henkilöltä Matti Meikäläinen -> muunnetaan muotoon Henkilö A.

Tämän jälkeen järjestelmä käy läpi halutun ja kirjoitetun materiaalin ja vertaa tätä Henkilön A sormenjälkeen ja raportoi tulokset vastaavasti. Näin ollen Henkilön A todellinen identiteetti on vain sen henkilön tiedossa, joka haluaa ko. tekstin analyysin. 

Ohjelmistot eivät muodosta tai kerää rekisteritietoja käyttäjistä siten, että ne olisivat ohjelmiston puolella yhdistettävissä erillisiin käyttäjätietoihin, jotka olisivat GDPR:n alaisuudessa tai että niistä muodostuisi henkilötietorekisteriä.