Case: yrityksen sivujen kopio ilmestyi outoon .com-osoitteeseen

Kuvittele tilanne. Löydät yllättäen yrityksesi verkkosivut tuntemattomasta .com -osoitteesta. Sivuilla näkyvät sinun ja muun henkilöstön kuvat sekä yhteystiedot – sillä erotuksella, että sähköpostiosoitteenne domain on vaihdettu.

Asiakkaamme LVI Kurikka Oy koki syksyllä tällaisen yllätyksen. Miksi ja mitä tilanteessa voi tehdä?

Tapahtumat ensin. Lvikurikka.fi-sivuston kopio löytyi 30.9. yllättäen erikoisesta osoitteesta: lamispei.com.

Tuttu näkymä: vasemmalla aito versio, oikealla kopio. Vain url-osoite erona.

 

Kuka ja miksi?

Nopeasti selvisi, että LVI Kurikalla tai kumppaniverkostolla ei ollut tekemistä asian kanssa. Edes oletusta mahdollisesta tekijästä ei löytynyt. Kopion oli julkaissut tuntematon taho.

LVI Kurikan ansioksi on sanottava, että asiaan suhtauduttiin heillä erittäin rauhallisesti. Hämmästystä tapahtunut tietenkin herätti, myös meillä.

Onhan valesivustoja tehty maailmalla esim. pankkien ja verkkokauppojen osalta, mutta tämä tapaus tuntui mystiseltä. Miksi? Mikä on motiivi?

Lvikurikka.fi on yrityssivusto, johon ei vaadita kirjautumista esim. pankkitunnuksilla lukuun ottamatta sivuston osana olevaa verkkokauppaa, jossa yksi maksuvaihto on pankkimaksu.

Kopiosivusto oli kuitenkin julkaistu siten, että juuri verkkokauppa puuttui siitä. Kopioija ei siis kalastellut pankkitunnuksia ainakaan verkkokaupan avulla.

Entä mahdollinen halu aiheuttaa LVI Kurikka Oy:lle haittaa Google-näkyvyydessä ja muiden hakukoneiden listauksissa? Voisiko kopiosivusto voisi nousta kilpailemaan alkuperäisen kanssa Googlen rankingissa ja mahdollisesti pudottaa alkuperäisen sijoituksia – ainakin aiheuttaa sekaannusta.

Kaukaa haettua. Google arvostaa vanhoja, pitkään toimineita domain-nimiä ja sivustoja. Lvikurikka.fi rekisteröitiin helmikuussa 2011, kopiossa käytetty lamispei.com viime heinäkuussa.

Kopiosisällöt eivät myöskään tapaa menestyä Googlen ja muiden hakukoneiden rankingissa, vaan niiden listautuminen pyritään estämään.

Lamispei.com-sivusto kyllä löytyi Googlesta ko. domainilla haettaessa, mutta se ei tilannetta testatessamme se ei noussut rankingissa Googlen ensimmäisen 100:n hakutuloksen joukkoon palvelukohtaisilla avainsanoilla.

Tietojen kalastelua?

Entä sitten yhteystietojen muutokset? Kaikkien sivuilla näkyvien LVI Kurikan ammattilaisten sähköpostiosoitteiden domain-osa oli muutettu siten, että etunimi.sukunimi@lvikurikka.fi näkyi kopiosivustolla muodossa etunimi.sukunimi@lamispei.com. Lisäksi yhteydenottolomakkeet oli julkaistu osana kopiota.

Ehkä joku asiakas saattaisi täyttää tietonsa lomakkeelle tai lähettää sähköpostia väärään osoitteeseen huomaamatta domainin muutosta.
Mutta sivuston pitäisi ensin löytyä.

Aika kaukaa haettu skenaario tämäkin, ajatellen laajemman vahingonteon mahdollisuutta.

Mikä siis on voinut olla kopioijan motiivi? Onko motiivina jokin muu mahdollinen hyöty, haitan aiheuttaminen tai pohjustus jollekin tulevalle toimenpiteelle?

Pohtimiseen ei käytetty liikaa aikaa, vaan asiassa edettiin tekemällä se, mitä oli tehtävissä.

Mitä kopiosivuston poistamiseksi voi tehdä?

Sivuston kopiointi ja uudelleen julkaisu on laitonta, sehän on selvä. Vähintään tekijänoikeuksia rikotaan.

Suomen lakien mukaan. Niistä ei tässä tapauksessa ollut iloa. Nyt oltiin kansainvälisillä vesillä. Keinoja oli rajatusti, oljenkorsia sentään jokunen.

Kopiosivuston tekijän tietoja ei tietenkään löytynyt, ja reklamointi ko. taholle olisi joka tapauksessa ollut mitä todennäköisimmin ajanhukkaa.

Oljenkorsi 1, webhotellin palveluntarjoaja

Lamispei.com-sivusto oli sijoitettu kansainvälisenä toimijana esittäytyvän 3NT.com -yrityksen palvelimelle. Operaattorilla olisi mahdollisesti intressi välttää laittomien palveluiden ylläpitoa esimerkiksi mahdollisen mainehaitan ehkäisemiseksi.

3NT.comin sivustolta löytyikin tarkoitukseen sopiva kanava eli abuse@3nt.com -sähköpostiosoite. Lähestyimme operaattoria tietojenkalastelu-lähtökohdalla, sillä suomenkielisen sisällön tekijänoikeudet olisivat varmasti liian hankalaksi koettava aihe kansainväliselle toimijalle.

Tietojenkalastelu sen sijaan on ymmärrettävä uhka, jota operaattori tuskin haluaa mahdollistaa. Sehän liittyi sivuston kopioon mail-domainien väärentämisen ja yhteydenottolomakkeiden julkaisun osalta.

Lähestyimme operaattoria kalastelukulmalla: ”The copied website collects customer information on your server.”

Oljenkorsi 2, Google

Googlen valituskanava rajaa aiheet vain kolmeen pääluokkaan: Spam, Malmware ja Phishing.

Phishing eli tietojenkalastelu soveltui tässäkin tapauksessa parhaiten valituksen aiheeksi. Googlen yksi intressi on säilyttää hakutulokset relevantteina ja välttää haitallisten tietojen listausta hakutuloksiin.

Klikkailimme läpi Googlen valitusvalikon ja kirjoitimme tapauskuvauksen.

Oljenkorsi 3. Kyberturvallisuuskeskus

Traficomin Kyberturvallisuuskeskus on suomalainen toimija, mutta keskus antaa suosituksia myös kansainvälisistä tapauksista. Kysyimme keskuksen näkemystä – mitä asialle voisi tehdä? Saimme vastauksen pienellä viiveellä 17.10.

Kyberturvallisuuskeskus listasi kuusi keinoa, joista yhteydenotto verkkosivujen omistajaan oli jo hyllytetty ja yhteydenotto palveluntarjoajaan tehty.

Keskuksen lisävinkit olivat nämä:

  • Yhteydenotto verkkotunnuksen rekisteröintitahoon ja pyyntö sulkea verkkotunnus tai siirtää sen omistajuus itselle.
  • Kansainvälisten verkkotunnusten (esim. .com ja .net) osalta ICANN-järjestön määrittelemä UDRP-pyyntö loukkaavan domainnimen poistosta (lisätietoja osoitteesta https://www.icann.org/resources/pages/help/dndr/udrp-en).
  • Oikeusteitse verkkotunnuksen sulku- tai siirtomääräys (huomautuksella: tässä on merkittäviä eroja eri verkkotunnusten ja maiden välillä, ja prosessi voi olla raskas).
  • Keskus suositteli myös rikosilmoituksen tekemistä poliisille, jos asiassa epäillään rikosta.

Käänne: Sivusto poistui verkosta

Jatkotoimiin saakka ei ehditty, sillä Lamispei.com-verkkosivut katosivat verkosta pian Kyberturvallisuuskeskuksen vastauksen jälkeen. Myös domainin rekisteröinti oli loppunut.

Oliko poistuminen reklamaatioidemme ansiota? Emme ole saaneet vastausta operaattorilta, saati Googlelta. Domain löytyi vielä jonkin aikaa kopiosivuston katoamisen jälkeen Google-hausta.

Todennäköisesti sivuston poistaja oli operaattori tai tekijä itse. Se oletus, mutta faktat ovat yhä pimennossa. Sivuston kopioijaa ja julkaisijaa, syytä toimenpiteelle tai syytä kopiosivujen sulkemiselle ei tiedetä vieläkään.

Pitääkö yrityksen olla huolissaan?

Onko kyse alkavasta trendistä, jossa ns. tavallisiakin suomenkielisiä yrityssivustoja kopioidaan ja julkaistaan eri sijainnissa?

Tuskin. Voisi ajatella, että toimenpiteeseen ryhtyvä hakee hyötyä itselleen, sillä operaatio aiheuttaa vaivannäköä ja kustannuksia ainakin domain-nimen rekisteröinnin ja webhotellin osalta. Ainakaan meille mahdollinen hyöty ei selvinnyt.

Fakta tietenkin on, että kaiken mikä näkyy Internetissä, voi kopioida ja julkaista uudelleen.

Entä kuinka helppoa verkkosivuston kopiointi ja julkaisu ilman palvelimen tai julkaisujärjestelmän tunnuksia ja täysin toimivana on, jos lisäksi tarpeena on muokata sisältöä, kuten LVI Kurikan sivuston tapauksessa sähköpostiosoitteita?

Nämä keinot eivät kuulu valikoimiimme, joten on kysyttävä asiaa viisaammalta…korjaan suuremman tietovaraston omaavalta taholta.

Näin vastaa ChatGPT

ChatGPT jatkaa (suora siteeraus):

1. Kopioidaan julkinen verkkosivusto ulkoisesti

Tämä vaihe voidaan pitkälti automatisoida seuraavilla työkaluilla:
• Website Copierit: Esimerkiksi HTTrack tai SiteSucker, jotka kopioivat verkkosivuston HTML-, CSS-, JS- ja mediadataa paikallisesti.
• Scraping Frameworkit: Kuten BeautifulSoup Pythonille tai Scrapy, jotka tarjoavat joustavuutta sisällön käsittelyyn ja tallennukseen.

Automatisointi: HTTrackin tai Scrapy-skriptin voi konfiguroida automatisoimaan latauksen, mutta rajoitteina ovat dynaamiset sivut (esim. AJAX tai API-pohjaiset datakutsut), joiden täydellinen kopiointi vaatii lisätyökaluja tai koodin.
________________________________________

2. Julkaistaan se uudelleen eri palvelimella, uuden domainin alla

Tämä vaihe sisältää seuraavat tehtävät:
• Palvelimen ja domainin asetukset: Uuden palvelimen konfigurointi ja domainin osoitus palvelimelle.
o Automatisointi: Tämä voidaan tehdä osittain automatisoiduilla deploy-työkaluilla, kuten Dockerilla, Nginxillä, tai palveluiden kuten Netlify tai Vercel avulla.

• Sivuston tiedostojen siirto:
o Käyttämällä FTP:tä, SCP:tä tai sovelluspohjaista tiedostonsiirtoa (esim. FileZilla).
o Automatisointi: Tiedostonsiirrot voidaan skriptata CLI-työkaluilla (esim. rsync).
Haasteet: Jos alkuperäinen sivusto käyttää palvelinpuolen toiminnallisuuksia (PHP, tietokannat), ne on rakennettava uudelleen.
________________________________________

3. Muokataan sivuston sisältöä

• Staattiset sivustot (HTML/CSS/JS):
o Sisällön muokkaaminen onnistuu käyttämällä tekstieditoreja tai ohjelmallisesti esim. Pythonin avulla (regex-muokkaukset tai Jinja-templaatit).
o Automatisointi: Säännölliset tekstimuokkaukset voidaan ohjelmoida skripteillä.

• Dynaamiset sivustot (CMS kuten WordPress):
o Jos alkuperäinen sivusto oli CMS-pohjainen, sen muokkaaminen voi vaatia vastaavan CMS:n asennuksen uudelle palvelimelle.
o Automatisointi: Dynaamisten järjestelmien sisältö on tyypillisesti vaikeampi siirtää ilman CMS:n tukea. Järjestelmät kuten WP All Import voivat auttaa.
________________________________________

Automatisointitaso

Osittain automatisoitavissa:
1. Verkkosivun kopiointi ulkoisesti voidaan tehdä automatisoidusti edellä mainituilla työkaluilla.
2. Sivuston uudelleenjulkaisu voidaan automatisoida skriptien tai CI/CD-putken avulla.
3. Sisällön muokkaus on osittain automatisoitavissa, mutta vaatii erityisratkaisuja riippuen siitä, miten sisältö on organisoitu.

Täysin automatisoitu prosessi:

Kaikkien vaiheiden täydellinen automatisointi vaatisi räätälöidyn ratkaisun, jossa skriptit, AI-pohjaiset työkalut ja palvelimen hallintasovellukset toimivat yhteen saumattomasti.
________________________________________

Vaihtoehtoiset sovellukset ja työkalut

1. Scrapy – tehokas sisällön keräykseen ja muokkaukseen.
2. AWS/Google Cloud – automatisoidut deployment pipeline -työkalut.
3. Puppeteer (Node.js) – dynaamisten verkkosivujen kopiointiin.
4. Contentful/Strapi – sisältömuokkausten hallinta headless-CMS:n kautta.

Riippuen projektin luonteesta, työkalut voidaan yhdistää automatisoiduksi prosessiksi.

Jaa kirjoitus:

Chatbot