Bu konuda ayrıntılı bir yazıyı Dataİst Veri Hizmetleri'nin son yazısında buldum:
EXCEL'den SPSS'e Veri Aktarma.
Onların izniyle bu ayrıntılı yazıyı aşağıda paylaşıyorum. Eğer ekran resimleriyle beraber okumak, görseller yardımıyla daha iyi öğrenmek isterseniz yukarıdaki bağlantıdan orijinal halini okumanızı tavsiye ederim. Bu yazıyı paylaşarak daha fazla insana ulaşmasını, daha fazla kişiye faydalı olmasına yardım edebilirsiniz.
SPSS Veri Girişi ve Excel’den SPSS’e Veri Aktarımı
Veri Analizini
sağlıklı yapmanın ilk adımı sağlıklı, doğru etiketler ile işlenmiş, değişken
tipleri doğru ayarlanmış bir veri seti oluşturmaktır. Veri setinizi hazırlarken
bir takım detaylara özen göstermek analiz ve raporlama sırasında size verinizi
hazırlarken harcadığınızdan çok daha fazla zaman kazandırabilir. SPSS’de bir
veri seti oluştururken aşağıdaki maddelere özellikle dikkat etmek gerekir.
1 – Değişken isimleri ve değişken etiketleri doğru
girilmiş mi? Örneğin
hastanın kilosunu girdiğimiz değişkenin kullanım kolaylığı için değişken adı
“kilo” etiketi ise “Ağırlık (kg)” olarak girilir. Böylece kısa ve açıklayıcı
değişken isimleri ile analiz kolaylaşırken detaylı etiketler ile oluşturulan
tablolarda daha sonradan değişiklik yapma ihtiyacı ortadan kalkar. SPSS sonuç
çıktılarında eğer var ise değişken ve değer etiketlerini kullanır.
2 – Kategorik değişkenler önce nümerik olarak
kodlanıp ardından değerlere kategori etiketi atanmış mı? örnek: cinsiyet değişkeni SPSS’de Erkek
=1 Kadın=0 olmak üzere nümerik olarak girilmiş, daha sonra 0 değerine KADIN, 1
değerine de ERKEK etiketleri atanmış olmalıdır. Bu bir zaman kaybıymış gibi
gözükebilir ancak nispeten ileri analizlerde gruplara göre analiz gerektiğinde
zaman kazandıracaktır.
3 – Nümerik değişkenlerin kaç ondalık basamağa
sahip olacağı tutarlı şekilde belirtilmiş mi? Bu da aslında daha çok kozmetik bir tercih ama
kimi değişkenin virgülden sonra 12 kimi değişkenin virgülden sonra sıfır
basamak göstermesi tablolar açısından büyük bir problem ve daha sonraki formatlama
sürecini uzatan ve zorlaştıran bir etmen.
4 – Değişken tipleri doğru olarak belirlenmiş mi? SPSS kimi zaman sürekli/sayısal
değişkenleri otomatik olarak nominal olarak kodlar. Buna dikkat etmezseniz
tablo ve grafik oluştururken problem yaşar, zaman kaybedersiniz.
Neden veriyi
doğrudan SPSS’e girmek yerine EXCEL’den aktarmalıyım?
SPSS Veri editörü
her ne kadar bir spreadsheet programı gibi kullanılabilirse de çok büyük
olmayan (maksimum 250-300 hasta) veri setlerini manipüle etmek için EXCEL çok
daha uygun. Bu yazıda göstereceğimiz aktarma yollarını da uygulayınca EXCEL ve
SPSS arasında geçiş yapmanın da kolay olduğunu göreceksiniz.
Şimdi gelin önce
EXCEL’e veriyi nasıl girmemiz gerektiğini görelim. Aşağıdaki resimde dikkat
etmemiz gereken tüm önemli noktalar var.
a)
Veri
girişine A1 hücresinden, yani sol üst köşeden başlayacağız. Eğer boş sütun ve
boş satırlar bırakırsak SPSS bunları aktarma sırasında değişkenler olarak
algılayacak ve bize temizlik işi çıkartacaktır
b)
1
nolu satırda değişken isimlerini giriyoruz. Burada değişken isimlerini Bir
tablo ya da grafikte görmek istediğiniz şekilde girin. SPSS bu full ismi
Değişken isim etiketi olarak kaydedecek. Yani Türkçe harflerden ya da
boşluklardan korkmamıza gerek
c)
A
sütununa her zaman bir indeks değişkeni koymak iyi olur. Eğer veri setinizde
yoksa bile hastalara/deneklere/gözlemlere birer gözlem numarası veren bir
değişken (ID, Hasta No, etc.) yaratmak daha sonra platformlar arası transferi
ve veri üzerinde yapacağımız değişiklikleri kolaylaştıracaktır.
d)
2
nolu satırdan başlayarak sırayla her hastanın/gözlemin verilerini gireceğiz.
e)
Boş
sütun ve boş satır bırakmayacağız
f)
Eğer
eksik veri varsa boş bırakabileceğimiz gibi 999 ya da 9999 gibi veride normal
şartlar altında asla gözlemeyeceğimiz bir değer verebiliriz. Daha sonra SPSS’e
hangi değerleri “eksik veri” (missing value) olarak tanıması gerektiğini
söyleceğiz. SPSS hem boş hücreleri hem de tanımlanmış bir değeri eksik bilgi
olarak tanıyabilir.
g)
Excel
dosyası açtığımızda otomatik olarak 3 adet çalışma sayfası yaratacak ve bizi
Sayfa 1’e yönlendirecek. Burada SPSS’e daha kolay aktarım için SPSS’e aktarmak
istediğimiz veriyi Sayfa 1’de tutmak istiyoruz.
Excel’de veri
setimizi hazırladık ve bilgisayarımıza kaydettik. Şimdi bu veriyi SPSS
programına aktarmak için SPSS’i açıyoruz. (Ben SPSS 22.0 versiyonunu
kullanıyorum. Çok eski bir sürümünü kullanmıyorsanız tüm menülerin ve
seçeneklerin aşağı yukarı aynı olması gerekir). Karşımıza çıkan ilk diyalog
ekranında NEW DATASET seçeneğini tıklayarak boş bir veri seti açıyoruz. Şimdi
veri setimizi EXCEL’den SPSS’e aktarmak için menülerden aşağıdaki seçenekleri
sırasıyla tıklıyoruz:
FILE -> OPEN
-> DATA
Karşımıza yeni
bir diyalog ekranı çıkacak. Bu ekranda kritik nokta Files of Type bölümünden
Excel (*.xls…) seçeneğini tıklamayı unutmamak. Aksi takdirde SPSS varsayılan
dosya tipi olan SPSS veri formatı
(*.sav) uzantılı dosyaları görecektir sadece. Excel dosyalarını açma
seçeneğini tıklayıp veri setimizin olduğu klasörü seçiyoruz.
Karşımıza çıkan
bir sonraki ekranda SPSS bizden Excel dosyasında verinin hangi çalışma
kitabında, hangi satır ve sütunlar arasında olduğunu teyit etmemizi isteyecek.
Eğer Excel dosyasındaki ilk çalışma kitabına, birinci satır ve sütundan giriş
yaptıysak o zaman burada herhangi bir değişiklik yapmamıza gerek yok. Zaten bu
bölümde işimizi kolaylaştırmak için verimizi EXCEL’de oluştururken Sayfa 1’de
A1 hücresinden veri girişi yapmaya başlamıştık. Eğer herhangi bir sebeple
verinin Excel dosyasındaki yeri farklı olursa bu diyalog penceresinde çalışma
sayfasını ve verinin hangi hücrelerde olduğunu seçebiliriz. Ancak bu pek de
pratik bir yol değil. Baştan veriyi SPSS’e en kolay aktaracağımız şekilde
düzenlemek daha kolay. Normal şartlarda bu diyalog penceresinde “Read variable
names from the first row of data” seçeneği seçilmiş olmalı. Eğer herhangi bir
sebeple bu kutucuk işaretli değilse işaretleyin. Bu SPSS’e değişken isimlerini
verinin birinci satırından alması gerektiğini söylüyor. Eğer bunu seçmezsek o
zaman birinci satır da normal bir gözlem gibi algılanacak. Eğer değişken isimleri
olmadan veriyi aktarmak istersek, yani excelde değişken isimlerini yazmadıysak
bu seçeneği boş bırakabiliriz.
OK’e basıp veri
setini oluşturuyoruz. Otomatik olarak karşımıza veri setindeki değişkenleri ve
özelliklerini gösteren Variable View çıkıyor. Sol alttan istersek Data View’a
girerek teker teker verimizi inceleyebiliriz. Ancak burada yapacak bir iki
işimiz var. Öncelikle 5.sütündaki LABEL kısmına dikkat ediyoruz. Burada
değişkenlerin etiketleri EXCEL’de yazdığımız gibi girilmiş, değişken isimleri
(1SÜTUN) ise özel karakterlerden ve boşluklardan arındırılmış şekilde otomatik
olarak düzenleniyor. Şimdi veriyi kullanılır hale getirmek için birkaç ufak
değişiklik yapacağız.
Öncelikle
dördüncü satırdaki DECIMALS kısmına bakıyoruz. Burada tüm değişkenler 0 olarak
girilmiş. Bunun sebebi EXCEL’de tüm değerlerin tam sayı olarak girilmiş olması.
Ancak eğer SPSS’e 0 ondalık basamağı kullanmasını söylersek o zaman
ortalamaları ya da diğer hesaplamaları yaptığımızda SPSS en yakın tam sayıya
bütünleyerek çıktı verecek. O yüzden Yaş’dan başlayarak tüm sayısal değer alan
değişkenlerin decimals bilgisini 0’dan 2’ye değiştiriyoruz. Ardından sistolik
kan basıncı değişkeninde girdiğimiz 999 değerinin basınç olarak değil de eksik
bilgi oalrak kodlanması için MISSING sütununda Sistolikmmhg değişkeninin üstüne
tıklıyor, discrete missing values seçeneğini işaretliyor ve 999 değerini
giriyoruz.
Son olarak
Cinsiyet değişkeni için Value Label yani değer etiketlerini gireceğiz. Şu anda
cinsiyet değişkeni erkekler için 1, kadınlar için 0 değerini alıyor. Bu
değişkene ait etiketleri değiştirmek için VALUES sütununda Cinsiyet
değişkeninin üstüne tıklıyoruz. Ve yeni diyalog ekranında 0 değeri için KADIN 1
değeri için de ERKEK etiketini ekliyoruz.
No comments:
Post a Comment