Quartet d'Anscombe

Quatre conjunts de dades amb els mateixos descriptors estadístics però clarament diferents

El quartet d'Anscombe comprèn quatre conjunts de dades que tenen les mateixes propietats estadístiques (mitjana, variància, etc.), però que són evidentment diferents quan s'inspeccionen visualment les seves gràfiques.

Cada conjunt està compost per 11 punts en el pla (x,y) i van ser creats per l'estadístic F. J. Anscombe. El quartet és una demostració de la importància de realitzar una inspecció visual de les dades abans d'analitzar-les.[1]

Pels quatre conjunts de dades es compleix:

PropietatValor
Mitjana de cadascuna de les variables x9.0
Variància de cadascuna de les variables x11.0
Mitjana de cadascuna de les variables y7.5
Variància de cadascuna de les variables y4.12
Correlació entre cadascuna de les variables x i y0.816
Recta de regressió

El primer gràfic (a dalt a l'esquerra) mostra el que sembla una relació lineal típica, corresponent a dues variables correlacionades, cumplint amb la suposició de normalitat. El segon gràfic (a dalt a la dreta) no està distribuït normalment, tot i que s'observa una relació entre les dades, no lineal, sent en aquest cas el coeficient de correlació de Pearson irrellevant. A la tercera gràfica (a baix a l'esquerra) la distribució és lineal excepte per la presencia d'un punt que fa canviar la recta de regressió i disminuir el coeficient de correlació del valor 1 a 0.816. Finalment, la quarta gràfica (a baix a la dreta) és un altre exemple de com un valor atípic és suficient per a obtenir una correlació elevada entre dues variables fins i tot quan la relació no és lineal.

Quartet d'Anscombe
IIIIIIIV
xyxyxyxy
10.08.0410.09.1410.07.468.06.58
8.06.958.08.148.06.778.05.76
13.07.5813.08.7413.012.748.07.71
9.08.819.08.779.07.118.08.84
11.08.3311.09.2611.07.818.08.47
14.09.9614.08.1014.08.848.07.04
6.07.246.06.136.06.088.05.25
4.04.264.03.104.05.3919.012.50
12.010.8412.09.1312.08.158.05.56
7.04.827.07.267.06.428.07.91
5.05.685.04.745.05.738.06.89

Edward Tufte va usar el quartet en la primera pàgina del primer capítol del seu llibre The Visual Display of Quantitative Information, per a emfatitzar la importància de mirar les dades abans d'analitzar-les.[2]

Referències

🔥 Top keywords: PortadaMarc Cucurella i SasetaLamine YamalNico WilliamsRodrigo Hernández CascanteCarlos Alcaraz GarfiaViquipèdia:ContacteDaniel Olmo CarvajalShannen DohertyLuis de la Fuente CastilloRobin Le NormandEspecial:CercaÁlvaro Borja Morata MartínCampionat d'Europa de futbolAymeric LaporteMikel Oyarzabal UgarteÀgata Roca i MaragallFabián Ruiz PeñaÀ Punt FMThe Parallax ViewNovak ĐokovićIñaki WilliamsDonald TrumpSelecció de futbol d'EspanyaMare de Déu del CarmeOques GrassesLuke PerryEspecial:Canvis recentsCopa del Món de FutbolBandera de MataróPet Shop BoysDaniel Carvajal RamosGrand Slam (tennis)Llista de topònims de la Sagrada Família i el Fort PiencLlista de topònims de l'Esquerra de l'Eixample i Sant AntoniLlista de topònims de la Dreta de l'EixampleUnai Simón MendibilByViruZzHarry Kane