Statistika Dasar
STATISTIKA DASAR
Statistik dan Statistika
Statistika ialah ilmu pengetahuan
(cabang matematika terapan) yang mempelajari teknik pengumpulan, penyajian,
pengolahan, penganalisaan data, dan penarikan kesimpulan yang benar. Hasil
analisis dan pengolahan suatu data disebut statistik. Statistik ini menunjukkan
karakteristik data, misalnya rata-rata, median, modus dan lain sebagainya.
Macam-macam Statistika
Statistika dalam pengertian
sebagai ilmu dibedakan menjadi dua:
1. Statistika deskriptif, yaitu ilmu
pengetahuan yang mempelajari teknik mengorganisasikan (mengumpulkan, menyusun) dan meringkas (menyajikan data
dalam bentuk kurva atau diagram, serta mengolah dan menganalisis) data sebagaimana
adanya tanpa menarik kesimpulan atau generalisasi. Hasil dari mengolah dan menganalisis data disebut
statistik, misalnya rata-rata, median, modus, dan lain sebagainya.
2. Statistika Inferensial
(Induktif), yaitu ilmu pengetahuan yang mempelajari teknik penarikan kesimpulan
atau generalisasi dari statistika deskriptif. Statistika inferensial bertujuan menyajikan, menganalisa data dari suatu
kelompok (sampel) untuk ditarik kesimpulan-kesimpulan,
prinsip-prinsip tertentu yang berlaku bagi kelompok yang lebih besar
(populasi).
Statistika inferensial
merupakan langkah akhir dari tugas statistika karena dalam setiap penelitian, kesimpulan inilah yang
diinginkan. Statistika inferensial harus berdasar pada statistika deskriptif,
sehingga kedua-duanya harus ditempuh secara benar agar kita mendapatkan
kegunaan maksimal dari statistika. Statistika inferensial terdiri dari statistik parametrik dan
non-parametrik.
Populasi dan Sampel
Dalam statistika,
biasanya kita ingin mempelajari populasi. Anda dapat menganggap suatu populasi sebagai seluruh koleksi orang, hal, atau objek yang diteliti. Untuk mempelajari populasi yang lebih besar, kita memilih sampel. Ide sampling
adalah untuk memilih bagian (atau
subset) dari populasi yang lebih besar dan meneliti bagian tersebut (sampel)
untuk mendapatkan informasi tentang populasi. Data
adalah hasil sampling dari suatu populasi . Datum adalah satuan data terkecil.
Tipe Data
Tipe data terdiri dari tipe kualitatif dan tipe
kuantitatif.
Tipe data kualitatif adalah tipe data yang paling
sederhana, biasanya tidak berbentuk numerik. Tipe data kualitatif terdiri dari
data nominal dan data ordinal.
Data yang
dibuat dengan memberikan angka pada kategori yang berbeda dimana “angka”
tersebut tidak memiliki arti seperti angka pada umumnya disebut data nominal.
Contoh data nominal misalnya kategori laki-laki dan
perempuan yang disimbolkan dengan angka 0 dan 1. “Angka” tersebut hanya
mewakili kategori dan tidak memilik arti seperti angka pada umumnya.
Data yang
dibuat dengan memberikan angka pada kategori-kategori dimana urutannya memiliki
arti disebut data ordinal.
Contoh data ordinal misalnya ketika kita memberikan
angka pada sampel seperti pendapatan yang diklasifikasikan dengan 1=rendah,
2=sedang, 3=tinggi. Angka-angka tersebut hanya memiliki arti 1 lebih rendah
dari 2, dan 2 lebih rendah dari 3 atau sebaliknya, 3 lebih tinggi dari 2, dan 2
lebih tinggi dari 1, bukan pendapatan
sedang adalah 2 kali pendapatan rendah atau pendapatan tinggi adalah 3 kali
pendapatan rendah. Data ordinal yang
sering digunakan dalam penelitian adalah skala Likert. Contoh skala
Likert: 1= sangat setuju, 2=setuju,
3=antara setuju dan tidak, 4=tidak setuju, 5=sangat tidak setuju.
Tipe data kuantitatif adalah tipe data yang berisi
data numerik. Tipe data ini terdiri dari dua kategori yaitu diskret dan
kontinu. Data diskret diperoleh dengan cara mencacah (menghitung) biasanya
adalah bilangan bulat positif. Data kontinu diperoleh dengan cara mengukur,
nilainya berupa bilangan real.
Karena dibutuhkan banyak waktu dan uang untuk meneliti seluruh populasi, sampling (pengambilan
sampel/contoh) adalah teknik yang sangat praktis. Jika
Anda ingin menghitung nilai rata-rata keseluruhan di sekolah Anda, akan
masuk akal untuk memilih sampel dari siswa
yang menghadiri sekolah. Data yang dikumpulkan dari sampel akan menjadi nilai
rata-rata siswa . Dalam pemilihan presiden,
sampel jajak pendapat dari
1.000 sampai 2.000 orang diambil. Jajak pendapat seharusnya mewakili pandangan dari orang
di seluruh negeri.
Dari data sampel, kita dapat menghitung statistik. Statistik adalah angka yang merupakan properti/karakteristik dari sampel. Sebagai
contoh, jika kita mempertimbangkan satu kelas matematika untuk menjadi sampel dari populasi semua kelas matematika, maka rata-rata
jumlah poin yang diterima oleh siswa di satu kelas matematika tersebut di akhir semester adalah contoh dari statistik. Statistik adalah
estimasi parameter populasi. Parameter adalah angka
yang merupakan properti/karakteristik dari
populasi. Karena kami menganggap semua
kelas matematika untuk menjadi populasi, maka rata-rata jumlah poin
yang diterima per siswa atas semua kelas matematika adalah contoh dari parameter.
Salah satu masalah utama dalam bidang statistik adalah seberapa akurat statistik mengestimasi parameter. Keakuratan sangat tergantung pada seberapa baik sampel mewakili populasi. Sampel harus berisi karakteristik populasi untuk menjadi sampel
yang representatif. Kita tertarik, baik pada
statistik sampel maupun pada parameter
populasi dalam statistika inferensial.
Sebuah variabel, dinotasikan dengan huruf besar seperti X dan Y, merupakan karakteristik yang diamati untuk setiap orang atau benda di dalam populasi. Variabel dapat berupa numerik
atau kategoris. Variabel numerik mengambil
nilai-nilai seperti berat dalam pound dan waktu dalam jam. Variabel kategoris menempatkan orang atau benda dalam kategori. Jika kita
misalkan X sama dengan jumlah poin yang diterima oleh satu mahasiswa
matematika pada akhir semester, maka X
adalah variabel numerik. Jika kita misalkan Y adalah afiliasi partai seseorang seperti Demokrat, Golkar, dll, maka Y adalah variabel kategoris. Data adalah nilai sebenarnya dari variabel. Mereka mungkin berupa nomor atau berupa kata-kata. Datum adalah nilai tunggal dari data.
adalah variabel numerik. Jika kita misalkan Y adalah afiliasi partai seseorang seperti Demokrat, Golkar, dll, maka Y adalah variabel kategoris. Data adalah nilai sebenarnya dari variabel. Mereka mungkin berupa nomor atau berupa kata-kata. Datum adalah nilai tunggal dari data.
Sensus dan
sampling
Sensus, kadangkala juga disebut cacah jiwa adalah
sebuah proses mendapatkan informasi tentang anggota sebuah populasi (tidak
hanya populasi manusia). Sensus digunakan untuk demokrasi (pemilu), pengumpulan pajak, juga digunakan dalam ekonomi.
Sensus adalah cara pengumpulan data yang dilakukan melalui pencacahan semua unit populasi untuk memperoleh karakteristik suatu populasi pada saat tertentu. Di Indonesia, sensus dilaksanakan sekurang-kurangnya 10 (sepuluh) tahun sekali yang meliputi:
- Sensus Penduduk, yang dilaksanakan pada tahun berakhiran angka 0 (nol);
- Sensus Pertanian, yang dilaksanakan pada tahun berakhiran angka 3 (tiga);
- Sensus Ekonomi, yang dilaksanakan pada tahun berakhiran angka 6 (enam).
Manfaat sensus
Pencacahan dalam sensus penduduk dilaksanakan untuk
mengumpulkan karakteristik pokok dan rinci terhadap seluruh penduduk baik yang
bertempat tinggal tetap maupun yang tidak mempunyai tempat tinggal tetap (tuna
wisma, anak buah kapal Indonesia, manusia/ orang perahu, dan suku terasing).
Karakteristik pokok dan rinci tersebut mencakup karakteristik tentang penduduk,
perumahan dan lingkungannya, dan karakteristik lain yang termasuk dalam lingkup
standar bidang kependudukan. Sensus penduduk terakhir dilaksanakan pada tahun
2010, dengan desain untuk
pencacahan lengkap terhadap perumahan (12 karakteristik) dan penduduk (15
karakteristik).
Pencacahan dalam sensus pertanian dilaksanakan untuk
mengumpulkan karakteristik pokok dan rinci terhadap seluruh petani, perusahaan
pertanian, dan pengukuran obyek kegiatan statistik pertanian. Karakteristik
pokok dan rinci tersebut mencakup karakteristik petani, tanah, tanaman, kegiatan
usaha di bidang pertanian, serta karakteristik lain yang termasuk dalam lingkup
statistik dasar bidang pertanian.
Pencacahan dalam sensus ekonomi dilaksanakan untuk
mengumpulkan karakteristik pokok dan rinci terhadap seluruh perusahaan dan
kegiatan usaha di bidang ekonomi (kecuali pertanian) di seluruh wilayah
Indonesia baik yang diusahakan secara permanen maupun tidak permanen termasuk
pertambangan dan penggalian, industri pengolahan, listrik, gas dan air bersih,
bangunan dan keuangan, persewaan dan jasa perusahaan, dan industri jasa. Karakteristik produksi,
pemakaian bahan baku, serta karakteristik lain yang termasuk dalam lingkup
statistik dasar bidang ekonomi.
Kelembagaan
Badan yang mengurusi sensus adalah
badan pusat statistik atau yang lebih dikenal dengan (BPS). BPS merupakan
satu-satunya badan resmi yang dibentuk pemerintah negara republik Indonesia
untuk bertugas sebagai surveier data-data mengenai
penduduk.
Aturan Pembulatan
Bilangan
Dalam kehidupan sehari-hari kita juga sering ketemu dengan bilangan-bilangan
pecahan yang memiliki angka desimal, dan bilangan dibelakang koma bisa saja
tidak sama antara satu bilangan dengan bilangan lainnya, untuk itu diperlukan
aturan dalam statistik untuk membulatkan bilangan. Demikian aturan pembulatan
bilangan dalam statistik :
Aturan
1,
Jika angka terkiri dari angka yang harus dihilangkan kurang dari 5,
maka angka terkanan dari angka yang mendahuluinya tetap (tidak berubah)
Contoh :
50,15 ton dibulatkan menjadi 50
ton (15 dihilangkan)
(Angka yang akan dihilangkan 15, angka yang mendahuluinya 0, karena 1
(angka terkiri dari 15) kurang dari 5 maka angka 15 dihilangkan dan
angka 0 tetap).
Aturan
2, Jika angka terkiri dari angka yang harus dihilangkan
lebih dari 5
atau angka 5 diikuti oleh angka-angka bukan nol semua, maka angka
terkanan
dari angka yang mendahuluinya bertambah dengan satu.
Contoh :
50,15002 menit dibulatkan hingga persepuluhan menit terdekat menjadi
50,2
Aturan
3, Jika angka terkiri dari angka yang harus dihilangkan
sama dengan 5 atau
angka 5 diikuti oleh angka-angka nol semua, maka angka terkanan dari
angka yang
mendahuluinya tetap jika angka tsb genap, dan bertambah satu jika angka
tsb ganjil.
Contoh : 14,35 gram dibulatkan persepuluhan gram terdekat menjadi 14,4
gram.
(Angka yang akan dihilangkan 5,
angka yang mendahuluinya 3 (ganjil) maka angka
5 dihilangkan, angka 3 ditambah 1, jadi hasil pembulatannya 14,4)
Contoh : 24.5000 cm dibulatkan hingga satuan cm menjadi 24 cm.
(Angka yang akan dihilangkan 5, angka yang mendahuluinya 4 (genap)
maka angka 5 dihilangkan, angka 4 tetap, jadi hasil pembulatannya 24)
Macam-macam Tabel
Tabel baris-kolom, tabel kontingensi, dan tabel distribusi frekuensi.
Tabel baris
kolom adalah Semua tabel terdiri
dari beberapa baris dan kolom, maka selain tabel baris kolom, yaitu tabel
kontingensi dan tabel distribusi frekuensi juga termasuk pada tabel baris
kolom. Tabel yang lebih tepat disebut tabel baris kolom ini adalah tabel-tabel yang
dibuat selain dari tabel kontingensi dan distribusi frekuensi yaitu tabel yang terdiri
dari baris dan kolom yang mempunyai ciri tidak terdiri dari faktor-faktor yang
terdiri dari beberapa kategori dan bukan merupakan data kuantitatif yang dibuat
menjadi beberapa kelompok.
Contoh:
Misalkan ada data pembelian bahan baku pembuatan produk yang dilakukan oleh perusahaan Z dari tahun 2000-2002. Bahan baku produk tersebut terdiri dari bahan A, B, C dan D yang mempunyai harga berbeda dan setiap tahunnya berubah disesuaikan dengan harga pasar. Pada tahun 2000 perusahaan Z membeli bahan baku A, B, C dan D sebanyak 1083 unit, 1108 unit, 1093 unit dan 1118 unit dengan harga Rp 10.002.344, Rp. 10.000.814, Rp 10.000.914 dan Rp 10.001.914. Tahun 2001 baku A, B, C dan D sebanyak 1127 unit, 1094 unit, 1137 unit dan 1104 unit dengan harga Rp 10.003.078, Rp. 10.000.805, Rp 10.000.905dan Rp 10.001.905. Tahun 2002 baku A, B, C dan D sebanyak 1110 unit, 1130 unit, 1120 unit dan 1140 unit dengan harga Rp 10.002.904, Rp. 10.000.920, Rp 10.001.020dan Rp 10.002.020.
Dengan melihat data yang terurai secara naskah tersebut maka kita akan kebinggungan untuk menggali informasi dari data pembelian bahan baku yang dilakukan oleh perusahaan Z tersebut. Oleh karena itu, kita buat tabel baris kolomnnya.
Tabel kontingensi merupakan bagian dari tabel baris kolom, akan tetapi tabel
ini mempunyai ciri khusus, yaitu untuk menyajikan
data yang terdiri atas dua faktor atau dua variabel, faktor yang satu terdiri
atas b kategori dan lainnya terdiri atas k kategori, dapat dibuat daftar kontingensi berukuran b x k dengan b
menyatakan baris dan k menyatakan kolom.
Contoh:
Misalkan data karyawan perusahaan Z pada tahun 2007. yang disebut karyawan di sini adalah orang yang bekerja di perusahaan Z dari level terendah sampai level manajemen yang semuanya berjumlah 336.416 orang berasal dari lulusan SMA, Diploma 3 dan Strata -1 yang terdiri dari laki-laki dan perempuan. Karyawan laki-laki dengan tingkat pendidikan SMA sebanyak 104.758, D-3 sebanyak 51.459 dan S-1 sebayak 12.116. karyawan perempuan dengan tingkat pendidikan SMA sebanyak 102.795, D-3 sebayak 54.032 dan S-1 sebanyak 11.256.
Untuk menyajikan data yang terurai dalam naskah di atas, sangat cocok apabila kita menggunakan tabel kontingensi. Dimana yang menjadi faktor baris adalah jenis kelamin dengan 2 kategori yaitu pria dan perempuan dan faktor kolom adalah tingkat pendidikan dengan kategori SMA, D3, dan S-1. dengan melihat bayaknya kategori setiap factor maka untuk kasus ini, tabel yang akan kita buat adalah tabel kontingensi 2x3 yaitu dua baris tiga kolom. Dengan kasus yang berbeda tabel kontengensi yang kita buat dapat saja 4x3 atau 4x4 dan sebagainya.
Tabel distribusi frekuensi merupakan bagian
dari tabel baris kolom, akan tetapi tabel ini mempunyai ciri khusus, yaitu untuk menyajikan
data yang terdiri atas satu faktor atau satu variabel, faktor tersebut terdiri atas beberapa kategori yang salah satu kategorinya adalah frekuensi. Tabel
distribusi frekuensi akan dibahas pada bab berikutnya.
Penyajian Data Dalam Bentuk Diagram
Jumlah mahasiswa tingkat III pada tiap kelas untuk
tahun
ajaran baru ditunjukkan oleh daftar berikut:
kelas
|
A
|
B
|
C
|
D
|
E
|
jumlah mahasiswa
|
40
|
30
|
59
|
52
|
45
|
Beberapa bentuk diagram yang menggambarkan
daftar tersebut di atas adalah:
1. Diagram lambang (piktogram)
Data pada daftar di atas dapat dibuat menjadi dagram
lambang berikut:
Kelas
|
Lambang
|
Jumlah
|
A
|
··········
··········
··········
··········
|
40
|
B
|
··········
··········
··········
|
30
|
C
|
··········
··········
··········
··········
··········
·········
|
59
|
D
|
··········
··········
··········
··········
··········
··
|
52
|
E
|
··········
··········
··········
··········
·····
|
45
|
2. Diagram batang
Ada dua jenis diagram batang: tegak dan mendatar.
Untuk daftar di atas diagram batang tegaknya adalah:
3. Diagram garis
Perhatikan daftar, maka diagram garisnya sebagai
berikut:
4. Diagram Lingkaran
Persentase frekuensi tiap kelas dinyatakan dalam
persentase luas lingkaran.
Ø
data
kelas A:
Ø
data
kelas B:
Ø
data
kelas C:
Ø
data
kelas D:
Ø
data
kelas E:
DAFTAR
DISTRIBUSI FREKUENSI
1.
Membuat Daftar Distribusi Frekuensi
Nilai
matematika dari 20 orang mahasiswa di suatu kelas adalah sebagai berikut:
45
|
67
|
32
|
75
|
56
|
65
|
81
|
47
|
58
|
69
|
66
|
73
|
63
|
76
|
46
|
35
|
58
|
64
|
67
|
59
|
Langkah-langkah
membuat daftar distribusi frekuensi:
·
susun
data dari yang terkecil sampai yang terbesar
32
|
35
|
45
|
46
|
47
|
56
|
58
|
58
|
59
|
63
|
64
|
65
|
66
|
67
|
67
|
69
|
73
|
75
|
76
|
81
|
·
Tentukan
rentang data (jangkauan)
Rentang = Data
terbesar – data terkecil = 81- 32 = 49
·
Tentukan
banyak kelas interval (dengan aturan Sturges)
Banyak kelas = 1 + 3,3 log n ; n = banyak data
|
Banyak kelas harus bilangan bulat (dibulatkan ke
atas)
|
Banyak kelas =
1 + 3,3 log 20 = 5,3 =6 (dibulatkan ke atas)
·
Tentukan
panjang kelas (p) =
catatan:
p harus bilangan bulat, dan biasanya dipilih bilangan ganjil (dibulatkan ke
atas).
·
Pilih
batas bawah kelas interval pertama (nilai data terkecil = 32)
·
Tentukan
frekuensi masing-masing kelas dengan sistem turus.
Nilai
|
Turus
|
Jumlah mahasiswa
|
32-40
|
||
|
2
|
41-49
|
|||
|
3
|
50-58
|
|||
|
3
|
59-67
|
|||| ||
|
7
|
68-76
|
||||
|
4
|
77-85
|
|
|
1
|
Penyajian
data yang dikelompokkan menurut distribusi frekuensi dapat dinyatakan dengan
grafik yang disebut histogram dan jika titik tengah pada histogram kita
hubungkan disebut polygon frekuensi.
polygon frekuensi
|
histogram
|
Hal-hal
yang perlu diketahui dari daftar distribusi frekuensi
§
kelas interval
§
batas bawah kelas interval yaitu bilangan-bilangan di
sebelah kiri kelas interval
§
batas atas kelas interval yaitu bilangan-bilangan di
sebelah kanan kelas interval
§
panjang kelas interval yaitu selisih positif antara
setiap dua tepi bawah berurutan
§
tanda kelas/titik tengah kelas = ½ (batas bawah+batas atas)
§
tepi bawah kelas interval = batas bawah – 0,5 satuan terkecil
§
tepi atas kelas interval = batas atas + 0,5 satuan
terkecil
2. Daftar distribusi frekuensi
kumulatif
Daftar ini dibuat berdasarkan
daftar distribusi frekuensi yang terdiri dari:
o
daftar
distribusi frekuensi kumulatif kurang
dari
o
daftar
distribusi frekuensi kumulatif lebih
dari
Dari data pada tabel berikut
Nilai
|
Frekuensi
|
51-60
|
2
|
61-70
|
8
|
71-80
|
12
|
81-90
|
6
|
91-100
|
2
|
dapat dibuat distribusi frekuensi
kumulatif (DF) kurang dari dan DF lebih dari, seperti pada tabel di bawah.
DF kumulatif kurang dari
nilai
|
frek kumulatif fk £
|
£ 50,5
|
0
|
£ 60,5
|
2
|
£ 70,5
|
10
|
£ 80,5
|
22
|
£ 90,5
|
28
|
£ 100,5
|
30
|
Grafik
Grafik Distribusi frekuensi
kumulatif (kurang dari) disebut juga ogif positif.
DF kumulatif lebih dari
nilai
|
frek kumulatif fk ³
|
³ 50,5
|
30
|
³ 60,5
|
28
|
³ 70,5
|
20
|
³ 80,5
|
8
|
³ 90,5
|
2
|
³ 100,5
|
0
|
Grafik
Grafik Distribusi frekuensi
kumulatif (kurang dari) disebut juga ogif negatif.
1.
Rata-rata
(rataan) hitung (
)
n= banyak data
xi= data ke-i
i= 1,2,3,…n
contoh:
Diketahui 10 buah data: 2,2,8,3,3,3,3,2,4,10.
fi= banyaknya data xi
xi= data pada kelompok ke-i
i= 1,2,3,…n
Contoh:
data pada tabel
xi
|
fi
|
2
|
3
|
3
|
4
|
4
|
1
|
8
|
1
|
10
|
1
|
banyaknya data kelompok ke-i
rataan data kelompok ke-i
contoh:
Tinggi
rata-rata 10 pelajar adalah 162 cm, jika digabung dengan 5 pelajar lain maka tinggi
rata-rata 15 pelajar tersebut adalah 160 cm. Tinggi rata-rata 15 pelajar
tersebut adalah …
Jawab:
2.
Modus
Data dengan frekuensi terbesar.
Contoh:
data pada tabel
xi
|
fi
|
2
|
3
|
3
|
4
|
4
|
1
|
8
|
1
|
10
|
1
|
Datum x = 3 memiliki frekuensi
terbesar (f=4), maka Mo= 3
3.
Median (Me)
Nilai tengah dari data yang telah
disusun berurutan mulai datum terkecil
adalah
datum terkecil
adalah
datum terbesar
, jika n
ganjil
, jika n
genap
Contoh:
Data disusun berurutan
2,2,2,3,3,3,3,4,8,10
n=10 (genap)
4.
Kuartil
(Qi)
Nilai yang membagi sekumpulan
data yang telah disusun berurutan menjadi 4 bagian yang sama banyak.
|
|
|
|
= Kuartil bawah
= Kuartil tengah
= Median
= Kuartil atas
Contoh:
Data telah disusun
terurut:
2 2 2 3 3 3 3 4 8 10
Sumber Referensi:
www.mathbuletin.com
1.
Illowsky Barbara., Dean Susan. 2011. Collaborative
Statistics. Di download dari http://http://cnx.org/content/col10522/1.39/ pada tanggal
26 Agustus 2011. Maxfield Fondation. Connexion, Rice University, Houston,
Texas.
3.
Pelosi Marilyn K, Sandifer
Theresa M. 2003. Elementary Statistics. John Wiley & Sons
Baccarat - GURIA® | Morongo
BalasHapusBaccarat is the simplest card 샌즈카지노 game, but as a beginner, you งานออนไลน์ can learn the rules for it. The main goal is to have 바카라 사이트 fun at the dealer's hand,