RSS 통계 모델링, 인과 추론 및 사회 과학 노트

RSS 통계 모델링, 인과 추론 및 사회 과학

statmodeling.stat.columbia.edu는 컬럼비아 대학교의 통계학과 정치학 교수인 앤드루 겔만의 개인 웹사이트입니다. 이 사이트는 겔만의 통계, 데이터 분석 및 관련 분야에 대한 생각을 담은 블로그처럼 보입니다. 사이트의 디자인은 콘텐츠 위주로 간단하고 직접적입니다. 사이트에는 통계 모델링에 대한 기술적인 논의부터 정치와 데이터의 교차점에 이르는 다양한 주제에 대한 기사들이 포함되어 있습니다. 기사들은 최근의 연구 논문에 대한 겔만의 생각을 담고 있으며, 외부 소스 및 추가 읽을거리에 대한 링크도 포함되어 있습니다. 사이트의 주요 기능 중 하나는 활발한 댓글 섹션입니다. 여기에는 겔만과 다른 독자들과의 토론 및 논쟁이 진행되는 등 다양한 사용자들이 참여하고 있습니다. 댓글들은 논의되는 주제에 대한 추가적인 맥락과 관점을 제공합니다. 전체적으로, 이 사이트는 통계 및 데이터 분석 분야의 전문가와 연구자들을 대상으로 하지만, 데이터 기반 사고 및 분석에 관심이 있는 독자들도 접근할 수 있습니다.

노트 스레드

엘모어 레너드.

레너드의 서부 작가로서의 명성이 높아짐에 따라, [디트로이트에 본사를 둔 광고 대행사] 캠벨-에월드는 레너드를 그들의 트럭 부서와 연결하는 것이 적절하다고 판단하여, 본질적으로 서부 소설과 유사하게 읽힐 거친 남성적인 인구 통계를 겨냥한 카피를 작성했습니다. “트럭 광고는 제가...

R이 통계상을 수상했다.

Elena Belogolovsky는 다음과 같이 씁니다: 2026년 Rousseeuw 통계학상 수상에 R Core Team에게 축하를 전합니다. R은 창의적이고 개방적인 통계 분석 및 그래픽을 수많은 통계학자와 응용 연구자들에게 접근 가능하게 만들었습니다. 또한 이는 ...의 중심이 되어 왔습니다.

뉴욕 닉스와 보정된 확률 예측의 마틴게일 속성 (시뮬레이션 및 R 코드 포함)

이 긴 게시물은 네 가지 주제를 다룹니다: 1. 닉스가 5경기 만에 NBA 타이틀을 획득하기 위한 놀라운 역전승 시리즈; 2. 확률 예측의 마틴게일 속성; 3. 시뮬레이션으로부터 배우는 예시; 4. 우리가 (때때로) …
CdXz5zHNQW_rhI88N6aag.png

지구 관측, 데이터 과학, AI를 활용한 빈곤 추정 분야 스웨덴 박사과정 학생 모집

아델 다우드(Adel Daoud)가 작성: 저는 Chalmers의 제 그룹인 AI and Global Development Lab (www.aidevlab.org)의 박사 과정 채용 공고를 배포하는 데 도움을 요청하기 위해 글을 씁니다. 해당 직책은 빈곤 추정을 위한 지구 관측, 데이터 과학 및 AI 분야이며, …

자본주의: 마지막 다리에 서 있는가, 아니면 젖을 짤 만큼 건강한가?

In The Strange Death of Tory England이라는, 명문장으로 가득한 책에서 제프리 휘트크로프트는 이렇게 썼다. 노동 운동이 자본주의 체제가 마지막 다리에 서 있는지, 그리고 단지 마지막의 ... 만이 필요한지 확신하지 못했던 것처럼...

인간 지능이든 인공 지능이든 상관없이 모든 지능은 상관관계 데이터에서 구조를 추출해야 한다는 말이 어느 정도 사실인가?

누군가가 저에게 이 기사, “Does AI already have human-level intelligence?”를 알려주었습니다. 전체 내용을 읽으려면 클릭하시면 됩니다. 스포일러 경고: 그들의 대답은 '그렇다'입니다. 기사의 주요 논점에 대해 할 말이 많지 않습니다. 그것은...

재즈와 양자 역학: 결국 드미트리는 그것들이 어느 정도 비슷하다는 것을 깨달았다.

드미트리 티모츠코가 일반 상대성 이론을 설명하는 존 베이즈의 이 글을 제게 알려주었습니다. 저는 이것이 매우 중요한 내용 같지만, 제 뇌의 그 부분은 양자 역학에 혼란스러워하는 데 전부 쏟고 있다고 답했습니다. 저는…

다층 회귀 및 사후 계층화를 이용한 연속 규범화에서 비대표성 조정.

Klazien de Vries, Marieke E. Timmerman, Anja F. Ernst, and Casper J. Albers는 다음과 같이 씁니다: 심리 검사 규준화에서 규준 표본의 배경 변수 비대표성은 규준 점수 추정치에 편향을 초래할 수 있습니다. 대표성은 어렵기 때문에...

"데이터 분석가의 인과관계 가이드"

Theiss Bendixen과 Benjamin Grant Purzycki가 이 책을 썼습니다. 그는 다음과 같이 씁니다. 웹사이트에는 다음이 있습니다. – 책에 사용된 모든 데이터 및 코드 – 무료 샘플 챕터 – 보너스 자료 이것들은 인과 추론에 대한 방법들과는 정확히 같지는 않습니다. …

잠재적 공동 블로거에게 보낸 메시지에서

저는 이메일을 보냈습니다: 독자분들이 당신의 게시물을 높이 평가할 것이라고 확신합니다. 제 게시물이 아닌 거의 모든 게시물을 독자분들이 높이 평가한다고 생각합니다. 만약 제가 고객 만족도 조사를 할 수 있다면, 제 게시물이 아닌 게시물에 대한 평균 승인율이 더 높을 것으로 예상합니다...

설문 통계: MRP 워크플로우에 LOCO-CV를 포함해야 할까요?

내일(6월 10일) 마감: Alexandre Andorra가 Aki, Richard, Andrew와 함께 신간 Bayesian Workflow에 대해 진행한 인터뷰에 참여하세요. 저는 사람들이 MRP 모델 평가에 대해 질문해주기를 바랍니다. 우리는 다음과 같은 것을 보았습니다: 개별 수준의 Loss(y_i, yhat_i)는 ...에 좋지 않을 수 있습니다.
CdXz5zHNQW_EOVXTt5s4d.png

유죄 판결을 받은 범죄자의 이름을 따서 교도소 이름을 짓는 것

배경은 다음과 같습니다. 줄리아니 시장은 당시 현역으로 활동 중이던 케릭의 이름을 맨해튼 구치소, 비공식적으로 '톰스'로 알려진 로어 맨해튼 중앙 구치소에 붙이는 이례적인 조치를 취했습니다. 당시 줄리아니 시장의 경찰국장이었던 케릭은 이전에 복무했습니다...

스타인 방법, 학습 및 추론 - 또는 - 수렴을 모니터링하고 체인을 얇게 만드는 방법

이 게시물은 Bob이 작성했습니다. 저는 점수(로그 밀도 함수의 기울기)와 그것이 수렴 모니터링에 어떻게 사용될 수 있는지에 대해 많이 생각해 왔습니다. 우리는 점수의 기댓값이 0이라는 것을 알고 있습니다. Stein은 일반화했습니다…

베이지안 워크플로우에 팟캐스트가 곧 올라갑니다! 경연과 함께!

Alexandre Andorra가 방금 출간된 저희 책, Bayesian Workflow에 대해 Aki, Richard, 그리고 저를 인터뷰할 예정입니다. 그리고 콘테스트도 있습니다! Alexandre입니다: 🥁청취자 한 분은 자신의 실제 워크플로우 문제를 녹음 방송에 가져와 세 분과 함께...

현대판 에드먼드 윌슨 역의 스콧 알렉산더

에드먼드 윌슨은 20세기 중반의 문학 비평가이자 전반적인 지적 권위자였습니다. 그는 뉴 리퍼블릭(New Republic)과 뉴요커(New Yorker)와 같은 적당한 발행 부수의 잡지에 글을 썼고, 영향력 있는 여러 권의 책도 저술했습니다. 저는 그와 그와 같은 사람들에게 부분적으로 관심이 있습니다...

AI 생성 텍스트를 감지하는 것이 언제 가치가 있을까요?

제시카입니다. AI 텍스트 탐지기는 우리의 관심을 받을 만한 텍스트가 무엇인지 판정하는 데 더 큰 역할을 하게 될 것입니다. AI가 생성한 것으로 보이는 단편 소설이 커먼웰스 재단 단편 소설상을 수상한 놀라운 사례가 있었는데, 이는...

회귀 모형에서의 상호작용과 예측 변수들 간의 상관관계는 어떤 관계가 있습니까?

회귀 모형에서의 상호작용과 예측 변수들 간의 상관관계 사이의 혼동을 자주 보았습니다. 간단하게 하기 위해, 모델 y = b0 + b1*x1 + b2*x2 + b3*x1*x2 + error를 고려하고, 예측 변수들이 부호가 지정되었다고 가정해 봅시다...

몽키 케이지 블로그의 오래된 게시물, 이스라엘과 하마스에 관한 것도 있습니다.

수십 년 전 조지 워싱턴 대학교의 정치학자들이 몽키 케이지(Monkey Cage)라고 불리는 블로그를 시작했습니다. 그들은 저에게 기고를 요청했습니다. 2008년이었죠. 저는 한동안 몽키 케이지에 대해 생각하지 않았습니다. …
CdXz5zHNQW_MD315CrfIi.png

피상적인 반이성적 인본주의에 반대하여

제시카는 이렇게 씁니다: 현실 세계의 결정은 복잡하다는 이유로 의사 결정 이론을 비난하는 사람들에게 정말 지쳤습니다. 의사 결정 이론이 그렇게 심각하게 결함이 있다면, 비평가들이 평가하고… 시도하기 위해 어떤 대안적인 방법을 조언하는지 알고 싶습니다.

역학자 Donna Spiegelman은 다음과 같이 말합니다: SUTVA는 "대부분의 경우 타당한 인과 추정 및 추론에 대부분 필요하지 않다"

Donna Spiegelman은 최근 미국 인과 추론 학회에서 발표한 이 프레젠테이션을 공유합니다. 저는 그녀의 말이 마음에 듭니다. 안정적인 치료값 가정의 두 가지 부분은 다음과 같습니다. 1. 단위 간 간섭 없음. Spiegelman이 말했듯이, …
CdXz5zHNQW_VGO6qP1FT4.png

설문조사 통계: 여전히 사람들입니다

1년 하고도 하루 전, Survey Statistics 블로그 시리즈는 “사람이야말로 설문 통계(그리고 그 무엇이든)를 위대하게 만드는 것이다”라는 글로 시작되었습니다. 지난 주말, 우리는 Andrew Gelman의 60세 생일 워크숍에서 멋진 사람들을 축하할 수 있었습니다. …
CdXz5zHNQW_o4KkvxkYNS.png

이 쓰레기 설문조사에 대해 뭐라고 하든, 적어도 하이퍼루프나 UFO가 외계 우주인이라는 주장 같은 다른 과장된 주장들보다 더 그럴듯하다!

팔코는 이 가짜 뉴스 기사의 분석을 지적합니다. 가짜 설문 조사에서 헤드라인으로 이어지는 과정은 몇 년 전 월스트리트 저널의 믿기 쉬운 기사를 떠올리게 합니다. 하지만, 네, 존경받는 뉴스 출처들이 계속해서 터무니없는 사기에 넘어가는 것은 마치...

놈의 면도날과 "의도하지 않은 결과"라는 개념이 과대평가되었다고 생각하는 이유

저는 Noem’s Razor(“악의로 충분히 설명될 수 있는 것을 어리석음으로 돌리지 말라”)에 대해 더 생각하고 있었는데, 이는 2008년에 제가 논의했던 원칙인 “의도하지 않은 결과”가 사실은 의도된 것이었다는 것을 떠올리게 했습니다. …

"합리적으로 격동적인 기대"

"Kent Osband가 다음과 같이 썼습니다: 약 15년 전 귀하께서 제가 쓴 "합리적 난기류(rational turbulence)"에 관한 글을 친절하게 링크해 주셨습니다. 최근 이와 유사한 많은 연구를 "Rationally Turbulent"라는 짧은 책으로 요약했음을 알려드리고 싶습니다..."

지나치게 영리한 정치학 냉소주의에 반대합니다.

정치학에는 정치에서의 즉각적인 해결책에 대한 회의론이 오랫동안 존재해 왔습니다. 예를 들어, 임기 제한은 좋아 보이지만 입법부를 약화시키고 유권자의 선택권을 줄입니다. 정글 예비선거는 공정해 보이지만 진정성 없는 투표를 조장합니다. 선거 운동…

통계 워크플로우에 대한 새로운 기사 15개!

아키, 리처드, 리지, 그리고 저는 Philosophical Transactions of the Royal Society에 통계 워크플로우에 대한 특별호를 함께 만들었습니다. '로열'이라는 단어가 예전만큼 인상적이지는 않겠지만, 그래도 그렇습니다. 통계와 데이터 분석은...
CdXz5zHNQW_vOyCPOaOBS.png

카파 동물원: 데이비드 유뱅크스의 온라인 모노그래프, 레이팅 모델에 관한 것

David Eubanks가 작성: 제 사이트는 kappazoo.com이며, 아직 작업 중입니다. 새로운 goodness-of-fit 코드가 완성된 후에 이메일을 보내고 싶었지만, 당신이 여름 워크숍을 하고 있다는 것을 보았습니다 (Andrew의 블로그에서) [편집자: …

과학자들이 정말로 냉철한 관찰자로서, 비합리적인 헌신 없이 아이디어를 전달한다면 어떨까? 여기를 보라, AI가 말한다.

제시카입니다. 우리는 과학이 주로 과학적 방법론을 통해 진행된다고 이상화하는 경향이 있습니다. 과학자들은 조사 대상에 대해 건전한 수준의 거리감과 중립성을 가지고 접근하며, 증거가 있을 때만 확신하게 됩니다. 하지만...

아니요, 베이즈는 피트 시장을 좋아하지 않습니다. (선거 가능성을 추정하기 위해 암시적 베팅 시장 확률을 사용하는 것의 함정.)

이것은 2019년의 것이지만, 예측 시장에 대한 최근의 관심도를 고려할 때 다시 게시할 가치가 있습니다. 이야기는 경제학자 그렉 맨큐의 게시물로 시작됩니다. 그는 이렇게 썼습니다: 도널드 트럼프를 이길 가장 좋은 기회를 가진 사람은 누구인가? 힌트는 ...에서 찾을 수 있습니다.
CdXz5zHNQW_A9r0bN3K9W.jpeg

"스킬 게임"에 얼마나 많은 스킬이 있을까요? 많지는 않을 것입니다.

몇 년 전 저희는 포커에서의 운 대 실력, 그리고 스포츠에서의 운 대 실력에 대해 게시했습니다. 팔코가 이 충격적인 뉴스 기사를 알려주면서 이와 관련된 새로운 것이 나왔습니다. "그것들은 슬롯머신처럼 보입니다. 그것들은..."

"10년의 사건"

에린 서머스의 '텐 이어 어페어'를 방금 다 읽었습니다. 이 책은 훌륭했고, 할리 버틀러의 '바날 나이트메어'와 샐리 루니의 소설들을 떠올리게 했습니다. 밀레니얼 세대와 그들의 친구, 배우자들에 대한 이야기로, …

기계에 작은 생각을 부여하는 것에 대한 변론으로서의 '인간도 불완전한 보고자다'

제시카입니다. 지난 게시물에서 기계에 사고와 추론과 같은 인간의 심리적 개념을 부여해야 하는 '필요성'과 이를 과대 해석할 때 발생하는 문제들 사이의 긴장감에 대해 이야기하면서, 저는 간략하게 하나의 방어 논리를 언급했습니다...

현재와 냉전 초기 반체제 탄압의 차이점

먼저, 유사점은 다음과 같습니다. 1. 정부 행위자들이 반대 의견을 억압하기 위해 민간인과 공무원 모두를 직접적으로 위협하고 있습니다. 2. 표현의 자유에 대한 공격은 주목할 만하지만 여전히 매우 드뭅니다. 이 나라의 대부분의 사람들은 여전히 말할 수 있습니다...

읽지 않은 출처를 인용하지 말고, 문헌에서 무언가를 보도한다고 주장하는 사람들을 신뢰하지 마십시오.

Peter Dorman은 다음과 같이 씁니다. 아직 보지 못하셨다면, 롤링 스톤에 실린 최근 기사를 확인해 보세요. 끝부분의 핵심 문단입니다: 캘리포니아 대학교 샌디에이고의 철학 교수이자 철학 협회 회장인 Craig Callender는...

올 여름 뉴욕에서 열리는 Modern Modeling Methods (M3)의 풀데이 Stan 튜토리얼 (2026년 6월 22일)

이 게시물은 Stan 개발자인 Bob Mitzi Morris와 Bob Carpenter가 작성한 것으로, 이번 여름 심리측정학자들을 대상으로 Stan과 베이지안 데이터 분석에 대한 튜토리얼을 발표할 예정입니다. Modern Modeling Methods Conference (M3), Fordham University Lincoln Center Campus, …

AI 슬롭(slop)이 포함된 논문의 저자를 금지하려는 Arxiv의 제안된 정책에 대해 어떻게 생각하십니까?

Tim First가 다음과 같이 씁니다: 논문에 AI 사용으로 인한 오류가 포함될 경우 저자가 1년간 금지된다는 새로운 arXiv 정책에 대한 당신의 생각을 알고 싶습니다. 제 (정보가 부족한) 생각은 다음과 같습니다: 1. arXiv는 행동하고 있습니다...

조사 통계: GREG

저는 방금 앤드류와 MrPlew 논문의 저자들인 라이언 지오르다노, 에린 하트만, 아비 펠러와 이야기를 나눴습니다. 여기서 소화해야 할 내용이 훨씬 더 많습니다! 이 논문은 북극곰과 제가… 하는 동안 나왔습니다.
CdXz5zHNQW_caitMQwRcy.jpeg

제임스 헤더스는 370만 달러 미만으로 와일리의 문제를 해결할 것입니다 (즉, 2,553,739개의 자메이카 비프 패티, 뉴어크 공항에서의 47,064끼의 위스키에 절은 식사, 또는 그레이 데이비스, 그로버 노퀴스트, 그리고 랍비가 참여하는 컨퍼런스 초대 218회에 해당하는 금액입니다).

데이터 깡패는 다음에서 인용합니다: 2023년 4월 Wiley 부사장(EVP)의 게시물: 2022년 9월, Wiley는 대규모로 운영되는 페이퍼밀 활동을 식별하고 즉시 업계에 알렸습니다. 구체적으로, 우리는 사기성 외부...
CdXz5zHNQW_X3x0ZjdHE5.jpeg

MrPlew: 다수준 회귀 및 사후층화에 대한 지역적으로 동등한 가중치

Ryan Giordano, Alice Cima, Jared Murray, Erin Hartman, 그리고 Avi Feller는 다음과 같이 씁니다: 다수준 회귀 및 사후 층화(MrP)는 비확률 표본 조사에서 모집단 수량을 추정하는 데 있어 핵심적인 방법이 되었으며, 전통적인 조사 보정 가중치에 대한 주요 모델 기반 대안입니다...

내일 조나의 세미나: “베이지안 워크플로우와 그것을 형성하는 소프트웨어”

이분은 레오입니다. 조나 게브리(스탠 개발자, 앤드류의 협력자 등)가 5월 한 달 동안 이탈리아 트리에스테 대학교에서 저희와 함께 방문 교수로서 지내고 있습니다. 내일 5월 19일, 데 피네티 룸에서...

If Books Could Kill 팟캐스트

우리가 논의했듯이, If Books Could Kill 팟캐스트는 몇 가지 문제가 있습니다. 특히 때로는 자신들의 전제에 대해 너무 관대하고, 때로는 특정 정치적 맥락에 맞추기 위해 너무 애쓰는 것처럼 보인다는 점입니다. 하지만...

통계학에서 왜 사각형이 어디에나 있습니까 (예: 정규 밀도, 분산, 최소 제곱 등)?

1990년대 초반 기본 통계를 처음 배울 때 카네기 멜런의 동료들에게 똑같은 질문을 했던 기억이 나는데, 그들이 최근 AskStatistics 서브레딧에서 찾은 답변과 같은 종류의 답변을 주었습니다. …