Modélisation statistique RSS, ... Note

Modélisation statistique RSS, Inférence causale et Sciences sociales

Le site web statmodeling.stat.columbia.edu est le site personnel d'Andrew Gelman, professeur de statistiques et de science politique à l'Université Columbia. Le site apparaît être un blog qui présente les réflexions de Gelman sur divers sujets en statistiques, analyse de données et domaines connexes. Le site a une conception simple et directe, mettant l'accent sur le contenu plutôt que sur des visuels éclatants. Le site comprend des articles sur une gamme de sujets, allant de discussions techniques sur la modélisation statistique à des commentaires sur les événements actuels et l'intersection de la politique et des données. Les articles comprennent souvent les réflexions de Gelman sur des articles de recherche récents, et incluent des liens vers des sources externes et des lectures supplémentaires. L'un des principaux aspects du site est sa section de commentaires, qui semble être très active, avec de nombreux utilisateurs engagés dans des discussions et des débats avec Gelman et d'autres lecteurs. Les commentaires sont souvent éclairants et apportent un contexte et des perspectives supplémentaires sur les sujets discutés. Dans l'ensemble, le site semble être destiné aux professionnels et aux chercheurs dans le domaine de la statistique et de l'analyse de données, mais il apparaît également accessible aux lecteurs intéressés par la pensée et l'analyse basées sur les données.

Fil de notes

Statistiques d’enquête : MRPW

Maintenant que je retourne régulièrement à Playroom, il était impossible d'échapper à l'écoute de MRPW (régression multiniveau et post-stratification avec pondérations), voir le projet d'article d'Andrew Gelman, Yajuan Si et Brady T. West. Voici leur configuration : Supposons que nous ayons…
CdXz5zHNQW_lWfDLEe1ZS.jpeg

Syndrome de Stockholm

Conformément à notre tendance récente de billets à thème suédois (et un autre devrait apparaître demain ; Richard et les étudiants en Statistiques 6101 savent déjà de quoi il sera question), j'ai quelques réflexions sur le syndrome de Stockholm, à l'occasion d'un ...

StanCon 2026 à Uppsala, Suède

StanCon 2026 aura lieu à Uppsala, en Suède, du 17 au 21 août 2026. La conférence rassemble des chercheurs et des praticiens passionnés par l'inférence bayésienne et la programmation probabiliste dans l'une des villes universitaires les plus historiques et dynamiques de Suède. Les participants…

« L'homme impossible » : la biographie de Roger Penrose par Patchen Barss

Roger Penrose, né en 1931 et toujours en vie au moment de la rédaction de ces lignes, a contribué plusieurs choses impressionnantes à notre culture. Dans un ordre d'importance décroissante, celles-ci comprennent : 1. Une reconfiguration de la théorie physique de la relativité générale…
CdXz5zHNQW_RlgT4LviYd.png

Voilà ce que vous obtiendrez avec un diplôme en études de cannabis

John "not E.T." Williams écrit : Le chanvre est très présent dans ma partie de la Californie (l'université locale propose un diplôme en études sur le cannabis - https://www.humboldt.edu/academics/programs/cannabis-studies-ba), donc l'industrie est bien couverte par les médias locaux. D'une manière ou d'une autre, cela m'a conduit au ...

7 raisons d'utiliser l'inférence bayésienne !

Je ne dis pas que vous devriez utiliser l'inférence bayésienne pour tous vos problèmes. Je donne simplement sept raisons différentes pour utiliser l'inférence bayésienne, c'est-à-dire sept scénarios différents où l'inférence bayésienne est utile : 1. L'analyse de décision. Vous pouvez connecter votre postérieur...

Columbia met à jour les fausses statistiques de U.S. News : ils ont payé 9 millions de dollars et refusent toujours, bizarrement, d'admettre qu'ils ont mal déclaré les données, même si tout le monde sait qu'ils ont mal déclaré les données.

The Spectator, le journal étudiant de Columbia, est plutôt bon. Ils ont publié cet article l'autre jour : Columbia a déposé un règlement préliminaire devant un tribunal fédéral de Manhattan de 9 millions de dollars pour un recours collectif proposé concernant des informations prétendument erronées dans U.S. News…

Distributions a priori pour les coefficients de régression

Beaucoup plus peut être dit (et a été dit) sur le sujet, mais j'ai pensé qu'il pourrait être utile de partager quelques liens rapides : – Distributions a priori pour les modèles rstanarm – Régression bayésienne utilisant une distribution a priori sur l'ajustement du modèle : Le…

Aki recherche un doctorant pour développer un flux de travail bayésien.

Je (Aki) recherche un doctorant avec une expérience en bayésien pour travailler sur le flux de travail bayésien et la validation croisée (voir ma liste de publications pour mes travaux récents) à l'Université Aalto, en Finlande (le pays le plus heureux du monde). Vous collaborerez également avec Andrew…

Statistiques d'enquête : difficultés avec les poids équivalents

En juin, nous avons parcouru un menu proposant 3 saveurs de poids (poids d'enquête, poids de fréquence, poids de précision) et 3 sous-saveurs de poids d'enquête : poids de probabilité inverse de réponse : W = 1/Ehat[R | X]. Basé sur un modèle de réponse R (par exemple, régression logistique). …
CdXz5zHNQW_qucBoKJGXs.jpeg

Demande de conseil inhabituelle

Celui-ci est arrivé par email : Cher Professeur, j'espère que ce message vous trouve bien. Je vous contacte pour savoir si vous seriez intéressé par la réalisation d'une analyse statistique pour un jeu de cartes de type casino que j'ai créé. Je suis…

Ajouter du bruit aux données pour réduire le surapprentissage... Comment ça marche ?

Jonathan Falk écrit : Je viens de lire un article à propos de cet article dans lequel des chercheurs ont obtenu de meilleures performances hors échantillon en faisant passer leur algorithme d'apprentissage automatique par un ordinateur quantique bruyant. Personne ne sait vraiment pourquoi c'est le cas, ou…

C'est horrible qu'ils aspirent de jeunes chercheurs dans ce vortex. C'est GIGO et Gresham jusqu'au bout.

Je suis tombé sur ce post de 2022. Le vrai problème de cette méta-analyse sur le « nudge » n'est pas qu'elle inclut 12 articles d'escrocs notoires, mais plutôt le principe « garbage in, garbage out » (GIGO). J'ai pensé qu'il valait la peine de partager sa conclusion : Ceci…

Statistiques d'enquête : au-delà de l'équilibrage

La présentation d'Andrew aujourd'hui sur l'histoire des sondages politiques comprend : 19. Élections hors année et équilibrage des partis. Bafumi et al. (2010) décrivent l'équilibrage comme : l'électorat renforce son soutien au parti sortant à mi-mandat par désir d'équilibre dans...
CdXz5zHNQW_XxXeFm4BsY.jpeg

Séminaire en coulisses sur les sciences sociales ce vendredi 3 octobre.

Séverine Toussaert et Vatsal Khandelwal écrivent : Nous co-animons le Séminaire Behind-the-Scenes, une série de séminaires en ligne présentant des recherches en sciences sociales (au sens large) : bts-seminar.net. Chaque session combine une présentation de recherche traditionnelle avec des prévisions interactives et un débriefing sincère sur…

Coin jeu de la théorie des jeux : Eric Adams a-t-il bien joué son jeu ? (C'est un peu comme le Crime de l'Orient-Express, c'est un peu comme L'Arnaque.)

Un commentateur nous a signalé qu'Eric Adams vient d'abandonner la course à la mairie de New York à environ cinq semaines des élections. Le commentateur a écrit : Je me demande combien Trump lui a offert, ou si Trump l'a menacé…

«Science des données véridique (véritable)» : Une autre façon d'envisager le flux de travail statistique

Bin Yu écrit : La science des données véridique (VDS) est un nouveau paradigme pour la science des données par la synthèse et l'expansion créatives et fondées des meilleures pratiques et idées en apprentissage automatique et en statistiques. Elle a été développée au cours de la dernière décennie…

En musique, en littérature et en écriture technique, la relation entre la structure à grande échelle et l'action locale

Comme nous l'avons déjà discuté, j'ai détesté le livre du philosophe Jerrold Levinson, « Music in the Moment ». (Désolé, Dmitri !) Levinson écrit que la musique est intrinsèquement « dans l'instant » d'une manière que l'art visuel n'est pas, car la musique est perçue dans le temps, alors que vous...

Les Dodgers recrutent

Brendan Cooley écrit : Je suis analyste chez les Los Angeles Dodgers. Nous recherchons des statisticiens bayésiens en herbe et des spécialistes du deep learning intéressés par un stage chez nous l'été prochain. Nous avons un faible pour jax et…

Sur les mauvaises propriétés statistiques de la procédure méta-analytique de la P-courbe

Richard Morey écrit : Mon collègue Clint Davis-Stober et moi avons un nouvel article dans JASA sur les tests méta-analytiques forensiques de la « courbe P » de Simonsohn et al., qui sont censés aider à identifier la « valeur probante », le « manque de valeur probante » et la « dissymétrie à gauche » dans…

Statistiques de l'enquête : Semaine de l'ours gras

Joyeuse Semaine de l'Ours Gras à tous ceux qui la célèbrent. L'année dernière, j'ai créé un dessin animé intitulé "Les Ours de Basu", adapté de l'exemple des éléphants de Basu (1971), une leçon sur l'utilisation d'informations auxiliaires en statistiques d'enquête. J'ai été inspiré par Brendan Leonard, …
CdXz5zHNQW_X1FJMgy4bA.png

Monty Hall et la modélisation générative : dessiner l'arbre est l'étape la plus importante

Nous avons eu une discussion l'autre jour sur la facilité avec laquelle on peut résoudre le problème de Monty Hall et diverses autres énigmes de probabilité déroutantes en traçant simplement l'arbre, et cela a conduit à un échange intéressant dans les commentaires. …
CdXz5zHNQW_SG6zZeP3fd.png

Lorsque l'on réfléchit à l'inférence causale, les modèles mécanistes ou de processus sont importants. Je pense que l'association de "causal" avec les modèles en boîte noire conduit à de nombreux problèmes.

Le professeur d'informatique de l'université Columbia, Elias Bareinboim, cite un nouveau manuel qu'il a développé, Causal Artificial Intelligence. Il cite également un article récent avec Drago Plecko, On the Structural Basis of Conditional Ignorability, qui revisite le lien entre…

Nombres de conditionnement pour HMC et l'entonnoir

Ce post est de Bob. Retour sur du calcul statistique technique. Nombres de conditionnement pour les marches aléatoires. La notion habituelle de nombre de conditionnement est le rapport de la plus grande à la plus petite valeur propre du Hessien négatif. Les grandes valeurs propres correspondent à…
CdXz5zHNQW_06a3ovsnzQ.png

Pourquoi la probabilité n'existe probablement pas (mais il est utile d'agir comme si elle existait)

Dans l'article susmentionné, David Spiegelhalter écrit : « Les tentatives de chiffrer le hasard et l'incertitude nous conduisent dans le domaine mathématique des probabilités, qui est aujourd'hui utilisé avec confiance dans de nombreux domaines. … Et pourtant, toute… »

Les Marlins de Miami embauchent.

Ce message est de Daniel. Bryant Davis des Marlins de Miami m'a transmis une offre d'emploi. Ils recherchent quelqu'un de bayésien pour les rejoindre ! Les départements de recherche sur le baseball et de solutions de baseball des Marlins de Miami recherchent des scientifiques des données débutants et seniors…

Hé, Nature magazine ! La réputation est une voie à double sens.

Kevin Gray m'a signalé cette broutille de science poubelle, banale et quotidienne, « Association entre le temps d'écran passé à regarder de courtes vidéos au coucher et l'hypertension artérielle essentielle chez les jeunes et les personnes d'âge moyen : une étude transversale ». J'ai entendu une fois que les médecins…
CdXz5zHNQW_y4pPAH0gla.png

Statistiques de l'enquête : l'échantillonnage aléatoire ne part pas.

En juillet, nous sommes entrés dans un nouveau paradigme : le fait de répondre à une enquête (R) peut dépendre du résultat (Y), même après avoir contrôlé les covariables (X). Ceci est appelé Non-Réponse Non-Aléatoire (MNAR), par opposition à la Non-Réponse Aléatoire (MAR). …
CdXz5zHNQW_CSq1Y6bvix.jpeg

La saison de recrutement des postdocs et des embauches permanentes en statistiques et en apprentissage automatique est officiellement ouverte à Flatiron

Ce message est de Bob. Le Center for Computational Mathematics du Flatiron Institute, où je suis basé, cherche à embaucher des postdocs et des chercheurs permanents. Voici les offres d'emploi. Flatiron Research Fellow (91 000 $) Research Scientist (130 000 $–215 000 $) La retraite et…

Princeton Consumer Research rapporte un taux de réussite de 93,94 %. . . pas tout à fait aussi bon que Harvard, qui vous amène à "statistiquement indiscernable de 100 %" !

Alan Goldhammer écrit : Je regarde récemment un de mes vieux favoris des années 1970, « The Rockford Files », sur Amazon. Certains épisodes ont des publicités et une pour Clean Skin Club, un fournisseur de serviettes jetables pour le nettoyage de la peau du visage, a attiré…

Helen DeWitt dit : « la programmation occupe une place similaire à celle de l'alphabétisation dans l'Angleterre médiévale. »

Je n'arrive pas à me décider à mettre DeWitt dans la blogroll, étant donné qu'elle n'a publié qu'un seul article au cours des deux dernières années... mais il se trouve que j'ai remarqué ce nouveau billet, où elle écrit : In the Middle...