So Sánh SAS, SPSS VÀ STATA

Hiện nay có ba bộ chương trình chuyên dụng phục vụ cho xử lý và phân tích số liệu thống kê rất thông dụng trên thế giới, đó là SAS, SPSS và STATA


Lê Đỗ Mạch
Viện khoa học thống kê
Hiện nay có ba bộ chương trình chuyên dụng phục vụ cho xử lý và phân tích số liệu thống kê rất thông dụng trên thế giới, đó là SAS, SPSS và STATA. Các chương trình này không những được giảng dạy trong các trường đại học mà còn là những công cụ không thể thiếu được đối với các nhà thống kê và các nghiên cứu quan sát thống kê ở nhiều lĩnh vực khác nhau. Trong số ba bộ chương trình thì SAS là chương trình lớn nhất và mạnh nhất nhưng lại đắt nhất, nên trong giai đoạn hiện nay ít được phổ biến ở nước ta; còn hai bộ chương trình SPSS và STATA nhiều người biết và đang sử dụng trong nghiên cứu thống kê từ đầu những năm 1990.
Vậy, sự khác nhau của STATA với SAS và SPSS là như thế nào? và bộ chương trình nào là tốt nhất. Mỗi bộ chương trình đều có đặc trưng riêng của nó, những điểm mạnh và yếu của nó. Bài viết này sẽ tóm tắt đặc trưng, điểm mạnh và điểm yếu riêng của từng bộ chương trình trên cả bốn phương diện:
1. Về sử dụng
SAS là bộ chương trình mà nhiều người sử dụng có trình độ cao ưa thích bởi sức mạnh và khả năng lập trình của nó. Do SAS là một bộ chương trình mạnh như vậy nên khó học nhất. Để sử dụng SAS, ta phải viết chương trình để thao tác dữ liệu và thực hiện các phân tích dữ liệu của mình. Nếu chương trình mắc lỗi, cái khó là phải biết tìm lỗi ở đâu và cách sửa thế nào.
SPSS là một bộ chương trình mà nhiều người sử dụng ưa thích do nó rất dễ sử dụng. SPSS có một giao diện giữa người và máy cho phép sử dụng các menu thả xuống để chọn các lệnh thực hiện. Khi thực hiện một phân tích chỉ đơn giản chọn thủ tục cần thiết và chọn các biến phân tích và bấm OK là có kết quả ngay trên màn hình để xem xét. SPSS cũng có một ngôn ngữ cú pháp có thể học bằng cách dán cú pháp lệnh vào cửa sổ cú pháp từ một lệnh vừa chọn và thực hiện, nhưng nói chung khá phức tạp và không trực giác.
STATA là một bộ chương trình mà nhiều người mới bắt đầu và sử dụng mạnh đều ưa thích vì nó vừa dễ học có nhiều khả năng. STATA sử dụng các lệnh trực tiếp, có thể vào mỗi lệnh ở một thời điểm để thực hiện (chế độ này được người mới bắt đầu ưa thích) hoặc có thể soạn thảo thành một chương trình bao gồm nhiều lệnh cho một nhiệm vụ và thực hiện cùng một lúc. Thậm chí nếu mắc lỗi trong chương trình thì có thể nhận biết và sửa chữa dễ dàng.
2. Về quản lý dữ liệu
SAS rất mạnh trong lĩnh vực quản lý dữ liệu, cho phép người sử dụng thao tác dữ liệu hầu như với mọi cách có thể. SAS cũng đưa vào thủ tục Proc sql cho phép thực hiện mọi câu hỏi Sql (Structured query language) trên file dữ liệu. Tuy nhiên phải mất nhiều thời gian để học và hiểu được cách quản lý dữ liệu của SAS và nhiều nhiệm vụ quản lý phức tạp của nó lại được thực hiện bằng những lệnh đơn giản trong SPSS và STATA. Thay vào đó, SAS có thể làm việc với nhiều file dữ liệu cùng một lúc; điều này giảm đi tính phức tạp trong chuẩn bị dữ liệu đối với những nhiệm vụ phân tích đòi hỏi phải làm việc với nhiều file dữ liệu cùng một lúc. Trong khi đó mỗi thời điểm STATA hoặc SPSS chỉ làm việc được với một file dữ liệu. SAS có thể quản lý những file dữ liệu khổng lồ lên đến 32.768 biến và số lượng bản ghi là rất lớn chỉ phụ thuộc vào kích cỡ của đĩa cứng. Ưu điểm này có thể làm đơn giản hoá trong khi tổ chức xử lý và phân tích trên một khối lượng rất lớn dữ liệu vì dữ liệu chỉ chứa trong một file.
SPSS có một bộ soạn thảo dữ liệu tương tự như excel, bộ soạn thảo cho phép vào các dữ liệu và mô tả các thuộc tính của chúng, tuy nhiên SPSS không có những công cụ quản lý dữ liệu thật mạnh (mặc dù SPSS phiên bản 11 có thêm các lệnh chuyển cấu trúc dữ liệu theo chiều ngang thành cấu trúc dữ liệu theo chiều dọc và ngược lại….). SPSS xử lý mỗi file dữ liệu ở một thời điểm và không phải là rất mạnh khi thực hiện các nhiệm vụ phân tích cần làm việc với nhiều file dữ liệu cùng một lúc. Các file dữ liệu có thể có đến 4096 biến và số lượng bản ghi chỉ bị giới hạn trong dung lượng của đĩa cứng.
STATA hoàn toàn không có khả năng quản lý dữ liệu mạnh như SAS, nhưng các lệnh quản lý dữ liệu của nó vẫn có nhiều sức mạnh, lại rất đơn giản. Chúng cho phép thực hiện các thao tác phức tạp về dữ liệu một cách dễ dàng. Tuy nhiên, mỗi thời điểm STATA chỉ làm việc được với một file dữ liệu, vì vậy những nhiệm vụ xử lý cần nhiều file dữ liệu cùng một lúc đối với STATA là phức tạp hơn. Với việc đưa vào bộ giải phóng STATA /Se, số lượng biến có thể có đến 32.768 biến trong một file dữ liệu STATA, và kích cỡ của file cũng chỉ phụ thuộc vào dung lượng đĩa cứng.
3. Về phân tích thống kê
SAS, SPSS, STATA cùng tính toán những thống kê mô tả và thực hiện những phân tích thống kê chung nhất như hồi qui, hồi qui logistic, phân tích tồn tại, phân tích phương sai, phân tích nhân tố, và phân tích nhiều chiều.
Trước hết xin bàn về khả năng tổng hợp số liệu (tính toán các thống kê mô tả). Một trong những công việc thường xuyên phải làm đối với cán bộ nghiệp vụ th

Bình Luận

Your email address will not be published. Required fields are marked *

*

Bài Viết Liên Quan: