Hướng dẫn sử dụng SPSS v12

SPSS training: Hướng dẫn dưới đây dựa trên window XP và spss 12.0.

I.   Giới thiệu:

1.    Các loại file dùng trong spss:   Dưới đây, dấu “*” dùng để thay thế tên file, “*.sav” có thể là “minh.sav” hoặc tên file khác, nhưng đuôi (sau dấu phảy) không thay đổi tùy tiện được vì nó cho biết bản chất của file đó là file loại gì.

•   File dữ liệu: có dạng *.sav (đuôi .sav)
•   File để viết các dòng lệnh (syntax file): có dạng *.sps
•   File kết quả (output file): có dạng *.spo

2.    Mở các files trên trong spss: Có nhiều cách mở các file này trong spss. Hai cách mở thông thường là:

•   Start=>all program=>spss for window=spss 12.0 for window, hoặc:
•   Vào window explorer, tìm directory và file spss rồi bấm nhanh 2 lần chuột trái vào biểu tượng của file đó

3.    Khi đã mở được file dữ liệu rồi, ta sẽ thấy cửa sổ của spss:
•   Trên cùng là tên của cửa sổ spss (màu xanh), có tên file và kiểu cửa số (spss data editor là cửa sổ cho file dữ liệu, spss syntax editor là cửa số cho file lệnh, và spss viewer là cửa số để xem kết quả). Phía bên phải thanh này là các nút mở rộng/thu hẹp cửa sổ và nút đóng cửa số (có dấu X màu đỏ).
•   Thanh menu: bao gồm danh sách các nhóm lệnh như “file” gồm các lệnh liên quan đến các file như mở/đóng file, “edit” gồm các lệnh liên quan đến hiệu đính file như copy hay cut, “view” gồm các lựa chọn liên quan đến việc hiển thị trên màn hình spss, “data” gồm các lệnh thao tác và chuẩn bị số liệu, “transform” gồm các lệnh làm biết đổi hoặc tạo mới các biến số, “analyze” gồm các lệnh phục vụ cho việc phân tích thống kê, “graph” gồm các lệnh vẽ đồ thị hay biểu đồ, “utilities” gồm các lệnh tiện ích (làm cho file dữ liệu dễ dùng), “add-ons” gồm các lệnh thêm vào chương trình spss cơ bản, “window” liên quan đến các lệnh ưu tiên hiện thị cửa sổ nào và cửa sổ của file loại nào đang ở dạng tích cực.
•   Dưới thanh menu có thanh công cụ gồm các biểu tượng của một số lệnh thường dùng
•   Dưới thanh biểu tượng các lệnh thường dùng trên là phần màn hình về các đặc trưng của file spss.
•   Lưu ý là có hai trang hiển thị khác nhau những đặc trưng của file dữ liệu (phía dưới màn hình có “Data view” và “Variable view”). Trang “Data view” hiển thị giá trị của các biến số đối với mỗi case, các cột là các biến, các hàng là các case. Trên nóc các cột là tên biến, phía trái là cột với số thứ tự các case.

Xin lối, không biết add ảnh minh hoạ cho các bạn bằng cách nào

Variable view hiển thị các đặc trưng của các biến số. Các cột là các đặc trưng của các biến số như tên biến, loại biến số hay biến chữ, số lượng ký tự được dùng, phần thập phân sau dấu phảy đối với biến số, nhãn của biến số, nhãn và giá trị của các phương án trả lời, v.v.. Các hàng là thứ tự các biến số trong file dữ liệu.

Save file: Có thể dùng lệnh “save” hay “save as” để lưu dữ liệu sau khi đã làm việc xong tương tự như đối với microsoft word.

Split file:

dùng để tách file theo các đặc trưng của một biến hay một số biến như tách riêng theo tỉnh, hay theo giới tính, v.v…

Nếu dùng lệnh này và sau đó save file, nhớ save với tên file mới để khỏi lẫn với file gốc.

cách làm: từ menu bar, làm như sau:

Data=>split files…=> chọn biến để split file (có thể chọn hơn một biến), chọn “organize outputs by groups” and “sort file by grouping variables”>>> sau đó chạy frequency, lựa chọn này sẽ cho nhiều bảng nhỏ (nếu chọn split file theo 2 biến), mỗi bảng nhỏ là một phương án của các biến được chọn để split file.

Data=>split files…=> chọn biến để split file (có thể chọn hơn một biến), chọn “organize outputs by groups” and “compare groups”>>> lựa chọn này sẽ cho các bảng dạng như bảng chéo 3 chiều (hoặc hơn, nếu chọn từ 2 biến trở lên cho split file) (số bảng sẽ ít hơn lựa chọn bên trên).

Có thể trở lại file không split bằng việc vào Data=>split files…=>Analyze all cases. Hoặc vào syntax window viết lệnh “split file off.” và chạy lệnh này.

II.   Những lệnh thường dùng trong spss:

A.   Sử dụng lệnh có sẵn trên thanh menu:

1.   Chuẩn bị dữ liệu:

Nói chung, các biến số có sẵn do nhập số liệu từ bảng hỏi không dùng được ngay, mà cần một số thao tác chuẩn bị trước khi có thể dùng để phân tích. Như vậy bởi vì một số trường hợp có thể không có thông tin về biến đó, hoặc biến đó ở dạng biến liên tục (tuổi hay năm sinh) trong khi chúng ta cần biến số hạng (nhóm tuổi, hay lớp thế hệ), v.v..

Để xem số liệu của một biến số nào đó đã sẵn sàng cho việc phân tích hay chưa, chúng ta dùng lệnh “frequencies…” đơn giản:

Analyze=>Descriptive Statistics=>Frequencies… rồi chọn biến (năm sinh) ở bên trái, nhấn nút tam giác ở giữa để đưa biến số đó sang ô bên phải, rồi ấn OK.

Trong ví dụ này, chúng ta thấy năm sinh được nhập với 4 chữ số, có 8 trường hợp không có thông tin (missing). Biến năm sinh có thể không tiện cho chúng ta trong một số trường hợp khi chúng ta cần phân tích theo tuổi. Như vậy, chúng ta phải tạo ra biến số mới từ biến “năm sinh”

Lệnh “compute”:

Transform=>compute…

Ta viết vào ô “Target Variable” tên biến mà chúng ta muốn tạo. Tên biến chỉ được có tối đa 8 ký tự, ví dụ “tuoi”. Sau đó chúng ta có thể viết công thức để tạo biến mới ở ô bên phải dấu “=”. Có thể dùng các trợ giúp ở phía dưới để chọn biến số và các ký hiệu toán học, cũng như các lệnh logic.

Nhấn “Type & Label…” để gán nhãn cho biến số này. Một cửa số con sẽ hiện ra và ta ghi nhãn vào, chẳng hạn “Tuổi của người được hỏi”. Chúng ta cũng cần quyết định xem đây là biến có giá trị số hay chữ. Nếu số, chúng ta chọn “numeric”, nếu là biến chữ chúng ta chọn “string”. Sau đó ấn “continue” chúng ta sẽ trở lại cửa sổ tạo biến. ấn OK, chúng ta đã tạo biến xong.

Chúng ta có thể xem kết quả bằng cách chạy lệnh frequencies với biến mới được tạo.

Lệnh recode:

Lệnh này có 2 lựa chọn: (1) thay đổi mã số của một biến (into same variables), hoặc (2) tạo ra một biến mới từ việc mã hóa các giá trị theo kiểu khác (into different variables).

Ví dụ, chúng ta có biến số giới tính (a2a) với giá trị 1=nam và 2=nữ. Giả sử chúng ta muốn đổi thành biến số dummy (có giá trị “0″ và “1″), chúng ta có thể thay đổi mã số của nữ từ 2 thành 0 như sau:

transform=>recode=into same varriables…

Chúng ta chọn biến “giới tính”, ấn vào phím “old and new values…” để xác định giá trị nào trong biến số này sẽ được thay bằng giá trị mới. Một cửa sổ con sẽ hiện ra.

Chúng ta viết 2 vào ô “old value” và “0″ vào ô “New value”, rồi ấn “add”. Đối với các biến số có nhiều giá trị và chúng ta muốn thay nhiều giá trị, chúng ta có thể lặp lại điều này bao nhiêu lần tùy thích. Sau đó, chúng ta ấn “continue”, ta sẽ quay về cửa sổ recode ban đầu, ấn OK, biến số “giới tính” sẽ có giá trị mới là 0=nữ và 1=nam.

Tạo biến mới bằng lệnh recode:
Giả sử chúng ta cần tạo ra một biến số có các nhóm tuổi. Chúng ta đã có biến số “tuổi”, chúng ta muốn nhóm các độ tuổi lại thành “dưới 30 tuổi”, từ 30-50 tuổi” và “trên 50 tuổi”. Chúng ta làm như sau:

transform=>recode=into different varriables…

Chúng ta chọn biến “tuoi”, ở ô “output variable” chúng ta đặt tên cho biến mới (agegrp) và gán nhãn cho biến mới (nhom tuoi nguoi duoc hoi). ấn “old and new values…” chúng ta sẽ thấy một cửa sổ con:

Chúng ta chọn “range” rồi lần lượt điền range từ “0 through 29″ và gán cho giá trị mới (new value) bằng 1, ấn “add”, sau đó lại gán range từ “30 through 50″ với giá trị mới bằng 2, ấn “add”, rồi chọn range “51 through highest” gán giá trị 3, ấn “add”. Nhớ là chúng ta có 8 trường hợp không có giá trị ở biến tuổi (missing), do đó chúng ta phải chọn “system-missing” ở cả biến cũ và biến mới (không thay đổi).

Sau đó, ấn “continue” để trở về cửa sổ ban đầu, ấn “change” ở phía dưới của biến mới, rồi ấn “OK” để tạo biến mới (nhóm tuổi) từ biến cũ (tuổi).

Chúng ta chạy tần số (frequencies) với biến agegrp để xem kết quả.

Phân tích sơ bộ:

Lệnh frequencies:   cho tần số của các phương án trả lời, tỷ lệ phần trăm, tỷ lệ phần trăm lũy tiến.

Lệnh này có thể đi kèm một số đại lượng thống kê như:
Giá trị trung bình (mean): bằng tổng các giá trị chia cho số trường hợp
Median: giá trị của biến số mà theo đó có đúng một nửa số trường hợp có giá trị cao hơn và đúng một nửa số trường hợp có giá trị thấp hơn.
Mode: giá trị của biến số với giá trị tuyệt đối lớn nhất
Sum: Tổng các giá trị của các trường hợp
Quartiles: giá trị chia các trường hợp ra thành 4 nhóm có số lượng bằng nhau
cut points for # equal groups: giá trị chia các trường hợp ra thành # nhóm có số lượng bằng nhau.
Std deviation: độ lệch chuẩn, cho biết độ phân tán của số liệu so với giá trị trung bình
Variance: bằng độ lệch chuẩn bình phương
range: khoảng từ giá trị nhỏ nhất đến giá trị lớn nhất
minimum và maximum: giá trị nhỏ nhất và giá trị lớn nhất
SE mean: giá trị trung bình của sai số chuẩn
Skewness: độ lệch khỏi vị trí đối xứng của phân bố các giá trị của các trường hợp

2Viết lệnh trong syntax window:

Những dòng bắt đầu bằng dấu * được xem là dòng bình luận chứ không phải dòng lệnh và khi chạy spss sẽ không tính đến những dòng này. Đặc điểm này thường được dùng để viết những chú thích lẫn trong các chương trình spss.

**Mọi lệnh của spss đều bắt đầu từ đầu dòng và kết thúc bằng dấu chấm.

**Chuẩn bị số liệu là rất quan trọng. Chuẩn bị số liệu gồm những lệnh cơ bản sau:

*Lệnh “set length” để đặt trang trong output window.

set length=1000.

freq var b3n5.

*Lệnh “display” để tìm hiểu các biến số trong file (số lượng, tên, nhãn, biến số hay chữ, tạo codebook).

display.

display labels.

display dictionary.

**Lệnh “recode’ để thay giá trị này bằng giá trị khác của biến số.

recode b3n1 (5=2)(2=5)(3=1)(1=4)/a2 (1=3)(3=1)/b3n5 (sysmis=14).
freq var b3n5.

recode b3n1 b3n2 b3n3  b3n4 (5=2)(2=5)(3=1)(1=4).

*Lệnh “rename” đổi tên biến.

rename var (b3n1=loi).

*Lệnh “variable label” và “value label”:

variable label b3n1 ‘Quan he cua nguoi thu 1 voi chu ho’/b3n2 ‘Quan he cua nguoi thu 2 voi chu ho’
/b3n3 ‘Quan he cua nguoi thu 3 voi chu ho’.
value label b3n1 b3n2 b3n3 b3n4 1 ‘nguoi duoc hoi’ 2 ‘chong’ 3 ‘con de’ 4 ‘con nuoi’/a2 1 ‘HCMC’ 2 ‘Hanoi’ 3 ‘Ha Tay’.

*Lệnh ‘compute’ là lệnh tạo biến mới. Lệnh này thường đi với lệnh ‘if’.
freq var b5n1.

compute b5n1new=1.

**Đến đây, biến b5n1new có mọi trường hợp có giá trị 1. Để chia khoảng làm như sau:
**Chú thích: các ký hiệu logic: ><=,   >= tuong duong voi ‘ge’ (greater or equal), ‘gt’ (greater), ‘le’ (less or equal), ‘lt’ (<=), ‘ne’ (not equal)
.
**Chú ý: “and” (cả 2 điều kiện phải thỏa mãn), “or” (một trong hai điều kiện thỏa mãn).
**if ((x ge 200 and y<15) and (a>1950 or b<2000)).

if (b5n1>1974 and b5n1<1980) b5n1new=2.
if (b5n1>1979 and b5n1<1986) b5n1new=3.
if (b5n1>1985) b5n1new=4.

variable label b5n1new ‘Nam sinh cua nguoi thu 1′.
value label b5n1new 1 ‘Sinh truoc 1975′ 2 ‘1975-79′ 3 ‘1980-85′ 4 ‘Sinh sau 1985′.
freq var b5n1new.

** Có thể tạo biến thẳng bằng một loạt lệnh “if”.

if (b5n1<1975) b5n1new=1.
if (b5n1>1974 and b5n1<1980) b5n1new=2.
if (b5n1>1979 and b5n1<1986) b5n1new=3.
if (b5n1>1985) b5n1new=4.

**Cũng có thể tạo biến mới bằng lệnh recode:

recode age (1 thru 10=1)(11 thru 20=2)(21 thru hi=3) into nhomtuoi.
variable label nhomtuoi ‘Nhom tuoi cua nguoi duoc hoi’.
value label nhomtuoi 1 ‘1-10’ 2 ’11-20’ 3 ‘21+’.
freq var nhomtuoi.

**Lệnh “temporary” và “select if”: để lựa chọn một số ca có đặc thù nào đó để phân tích chứ không phân tích tất cả các ca.
**Lệnh “temporary” làm cho lệnh “select if” chỉ có tác dụng đối với một thủ tục thống kê đi kèm ngay sau đó.
**Nếu dùng lệnh “select if” mà không có “temporary” thì máy tính sẽ xóa tất cả những ca không thoả mãn điều kiện trong lệnh “select if”.

temporary.
select if (a2=3).
freq var a2 b5n1new.

freq var a2.

temporary.
select if (a2 ne 3).
freq var a2 b5n1new.

freq var a2 b5n1new.

**Lệnh “count” để tính số lượng biến số của mỗi ca có cùng một giá trị nào đó. Lệnh này rất lợi hại khi dùng để xây dựng index.

count socon=b3n1 b3n2 b3n3 b3n4 b3n5 b3n6 b3n7 b3n8 b3n9 b3n10 (3, 4).
variable label socon ‘So con song cung trong ho’.
freq var socon.

*Lệnh frequencies variables:

freq var b5n1/format=notable/stat=mean.

freq var b5n1.

**Lệnh crosstab:

crosstab tables=b5n1new by a2/cell=count row column/stat=chi.

**Bỏ 2 biến

save outfile=’c:\loi\tam.sav’/drop var20 var30.

**Thay đổi trật tự các biến trong tệp dữ liệu, giữ nguyên các biến khác.

save outfile=’c:\loi\tam.sav’/keep var100 var50 all.

**Chỉ giữ lại 2 biến:

save outfile=’c:\loi\tam.sav’/keep var100 var50.

**Thay tên biến trong tệp mới.

save outfile=’c:\loi\tam.sav’/rename (varcu=varmoi)(varcu1=varmoi1).

Thi du:

save outfile=’c:\tam1.sav’/keep b1n1 b2n1 b3n1 b4n1 b5n1/rename (b1n1=b1n)(b2n1=b2n)(b3n1=b3n)(b4n1=b4n)(b5n1=b5n).

save outfile=’c:\tam2.sav’/keep b1n2 b2n2 b3n2 b4n2 b5n2/rename (b1n2=b1n)(b2n2=b2n)(b3n2=b3n)(b4n2=b4n)(b5n2=b5n).

**Sau do vao menu data=>merge file=>add cases để tạo file mới.

maneih – tamlyhoc.net

About these ads

Bình luận đã được đóng.

Follow

Get every new post delivered to your Inbox.

%d bloggers like this: