AI 및 ML 뉴스

구글이 아닌 검색 엔진에서 최근 Reddit 결과 표시 차단

Reddit에서 최근의 토론은 구글이 아닌 검색 엔진에서 더 이상 표시되지 않습니다. 이러한 부재는 Reddit의 콘텐츠 정책 업데이트의 결과입니다. 이 업데이트에서는 Reddit 사이트를 크롤링하는 것이 금지되며, Reddit의 규칙에 동의하지 않는 경우 Reddit 콘텐츠를 AI 훈련에 사용하는 것이 금지됩니다. 404 Media에 따르면 Bing, DuckDuckGo, Mojeek와 같은 구글이 아닌 검색 엔진에서 "site:reddit.com"를 사용하면 지난 주에 Reddit 결과가 거의 또는 전혀 표시되지 않습니다. Ars Technica는 이러한 검색 엔진에서 검색을 수행하여 결과를 확인할 수 있습니다. 예를 들어, Brave는 때때로 Reddit 결과를 표시할 수 있습니다(예: 여기와 여기). 그러나 동일한 쿼리를 사용하여 Google에서 표시되는 Reddit 결과와는遠く 뒤떨어집니다. 특히 Kagi는 구글의 검색 색인 일부를 지불하는 유료 엔진으로 최근 Reddit 결과를 표시합니다. 404 Media는 Reddit의 로봇 배제 프로토콜(robots.txt 파일)이 봇이 사이트를 스크래핑하는 것을 차단하고 있음을 지적했습니다. 프로토콜은 또한 "Reddit은 개방된 인터넷을 믿지만 공공 콘텐츠의 남용은 믿지 않습니다."라고 언급합니다. Reddit은 인터넷 아카이브와 일부 연구 중심 엔티티의 스크래퍼를 승인했습니다.
favicon
arstechnica.com
Non-Google search engines blocked from showing recent Reddit results
Create attached notes ...