Conjunt de dades

és una col·lecció de dades.

Un conjunt de dades és una col·lecció de dades. En el cas de les dades tabulars, un conjunt de dades correspon a una o més taules de base de dades, on cada columna d'una taula representa una variable determinada i cada fila correspon a un registre determinat del conjunt de dades en qüestió. El conjunt de dades enumera els valors de cadascuna de les variables, com per exemple l'alçada i el pes d'un objecte, per a cada membre del conjunt de dades. Els conjunts de dades també poden consistir en una col·lecció de documents o fitxers.[2]

Diversos gràfics del conjunt de dades multivariant del conjunt de dades de flors d' iris introduït per Ronald Fisher (1936).[1]

En la disciplina de dades obertes, el conjunt de dades és la unitat per mesurar la informació alliberada en un dipòsit públic de dades obertes. El portal europeu data.europa.eu agrupa més d'un milió de conjunts de dades.[3] Alguns altres problemes (fonts de dades en temps real,[4] conjunts de dades no relacionals, etc.) augmenten la dificultat per arribar a un consens al respecte.[4]

Diverses característiques defineixen l'estructura i les propietats d'un conjunt de dades. Aquests inclouen el nombre i els tipus d'atributs o variables, i diverses mesures estadístiques aplicables als mateixos, com ara la desviació estàndard i la curtosi.Jan M. Żytkow, Jan Rauch. Principles of data mining and knowledge discovery, 2000. ISBN 978-3-540-66490-1.  Principis de mineria de dades i descobriment de coneixement . ISBN 978-3-540-66490-1.[5]

En les estadístiques, els conjunts de dades solen provenir d'observacions reals obtingudes mitjançant el mostreig d'una població estadística, i cada fila correspon a les observacions sobre un element d'aquesta població. Els conjunts de dades també es poden generar mitjançant algorismes amb el propòsit de provar certs tipus de programari. Alguns programes moderns d'anàlisi estadística com SPSS encara presenten les seves dades de la manera clàssica de conjunt de dades. Si les dades falten o són sospitoses, es pot utilitzar un mètode d'imputació per completar un conjunt de dades.[6]

Diversos conjunts de dades clàssics s'han utilitzat àmpliament a la literatura estadística:

Referències

🔥 Top keywords: PortadaMarc Cucurella i SasetaLamine YamalNico WilliamsRodrigo Hernández CascanteCarlos Alcaraz GarfiaViquipèdia:ContacteDaniel Olmo CarvajalShannen DohertyLuis de la Fuente CastilloRobin Le NormandEspecial:CercaÁlvaro Borja Morata MartínCampionat d'Europa de futbolAymeric LaporteMikel Oyarzabal UgarteÀgata Roca i MaragallFabián Ruiz PeñaÀ Punt FMThe Parallax ViewNovak ĐokovićIñaki WilliamsDonald TrumpSelecció de futbol d'EspanyaMare de Déu del CarmeOques GrassesLuke PerryEspecial:Canvis recentsCopa del Món de FutbolBandera de MataróPet Shop BoysDaniel Carvajal RamosGrand Slam (tennis)Llista de topònims de la Sagrada Família i el Fort PiencLlista de topònims de l'Esquerra de l'Eixample i Sant AntoniLlista de topònims de la Dreta de l'EixampleUnai Simón MendibilByViruZzHarry Kane