AI- ja ML-uutisia suomeksi

Ei-Google-hakukoneet estetty näyttämästä viimeaikaisia Reddit-tuloksia

Redditin viimeaikaiset keskustelut eivät enää näy Googlea lukuisten hakukoneiden tuloksissa. Tämä puuttuminen johtuu Redditin sisältöpolitiikan päivityksistä, jotka kieltävät sivuston tietojen keräämisen ilman Redditin sääntöjen noudattamista, mikä kielii Redditin sisällön käytön tekoälyn koulutuksessa ilman Redditin erillistä lupaa. Kuten 404 Media raportoi, käyttämällä hakusanaa "site:reddit.com" ei-Google-hakukoneissa, kuten Bingissä, DuckDuckGossa ja Mojeekissa, ei tuota lähes ollen Redditin tuloksia viimeksi viikosta. Ars Technica suoritti hakut näillä ja muilla hakukoneilla ja vahvistaa nämä havainnot. Brave esimerkiksi näyttää joitakin Redditin tuloksia ajoittain (esimerkkejä tässä ja tässä), mutta ei niinkään kuin Google näyttää, kun käytetään samaa hakusanaa. Kagi on erikseen mainittava, mikä on maksullinen hakukone, joka maksaa Googlen hakemalle indeksille ja näyttää yhä Redditin viimeaikaisia tuloksia. Kuten 404 Media huomautti, Redditin Robotin Poissulkemisprotokolla (robots.txt-tiedosto) estää botit keräämästä sivustoa. Protokolla toteaa myös, "Reddit uskoo avoimeen internetiin, mutta ei julkisen sisällön väärinkäyttöön." Reddit on hyväksynyt scraperit Internet Archivelta ja joistakin tutkimuspainotteisista tahoista.
favicon
arstechnica.com
Non-Google search engines blocked from showing recent Reddit results
Create attached notes ...