Zbiór danych: Różnice pomiędzy wersjami

Usunięte 2398 bajtów ,  14 lat temu
nico
(Anulowanie wersji użytkownika 83.25.143.149 do wersji użytkownika 83.5.251.68. Zgłoś nieprawidłowy rewert. (6611))
(nico)
'''Zbiór danych''' stat
'''Zbiór danych''' jest kolekcją [[dane|danych]] [[statystyka|statystycznych]] zwykle ujętych w formie stabelaryzowanej.
 
Najczęściej kolumny odpowiadają obserwowanym [[cecha statystyczna|cechom statystycznym]] a każdy wiersz opisuje jedną [[obserwacja statystyczna|obserwację]] z [[próba statystyczna|próby]]. Wartości komórek macierzy opisują realizacje danych [[zmienna losowa|zmiennych]] w kolejnych obserwacjach.
 
Szczególnym przypadkiem jest też [[macierz kontyngencji]] ([[tablica wielodzielcza]]) w której wiersze odpowiadają etykietom jednej [[zmienna nominalna|zmiennej nominalnej]], kolumny etykietom drugiej zmiennej, a wartości macierzy odpowiadają liczności w próbie obserwacji o danych wartościach tych dwóch zmiennych.
 
Historycznie, termin powstał w świecie komputerów [[IBM]] [[mainframe]], gdzie miał dobrze zdefiniowane znaczenie, bliskie współczesnym [[plik]]om. Dzisiaj w świecie komputerów najbliższym pojęciem jest [[tabela (bazy danych)|tabela]] w [[baza danych|bazie danych]].
 
Kolumny reprezentujące zmienne na skali [[skala interwałowa|interwałowej]] lub [[skala przedziałowa|przedziałowej]] zawierają [[liczby rzeczywiste]]. Kolumny opisujące zmienne na skali [[skala nominalna|nominalnej]] i [[skala porządkowa|porządkowej]] mogą również być liczbami, ale także np. etykietami tekstowymi.
 
Ponadto w może w dowolnej komórce wystąpić [[brakujące dane|brak danych]], który musi być w jakiś sposób możliwy do odróżnienia. Niekiedy rezerwuje się dla niego specjalną wartość liczbową i znakową.
 
W [[statystyka|statystyce]] zbiory danych zwykle stanowią wyniki obserwacji pewnej [[próba statystyczna|próby statystycznej]]. W statystyce teoretycznej niekiedy tworzy się zbiory danych sztucznie (np. w celu sprawdzenia jak dana metoda statystyczna reaguje na różne rozkłady w [[populacja statystyczna|populacji]]). Istnieją też zaawansowane metody obliczania [[istotność statystyczna|istotności statystycznej]], które wymagają usuwania lub powielania obserwacji w zbiorze (np. [[bootstrap (statystyka)|bootstrap]], [[walidacja krzyżowa]]).
 
Chociaż termin "zbiór danych" sugeruje związek ze [[zbiór|zbiorami]] w sensie matematycznej [[teoria mnogości|teorii mnogości]], jednak analogia ta nie sięga daleko. Elementy zbioru danych mogą się powtarzać, w przeciwieństwie do elementów matematycznych zbiorów.
 
== Klasyczne zbiory danych ==
Anonimowy użytkownik