Bài tập và hướng dẫn phân tích số liệu bằng SPSS pptx

53 1.3K 14
Bài tập và hướng dẫn phân tích số liệu bằng SPSS pptx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài tập và hướng dẫn phân tích số liệu bằng SPSS 1 BAI TAP CA NHAN I.ASSIGNMENT 1: Bài 1: Anh/Chị hãy vào trang web: http://www.fpts.com.vn/user/stock/thong-ke/ thu thập số liệu theo tháng của chỉ số giá chứng khoán VN Index (VNI) và giá của cổ phiếu của Công ty Chứng khoán Sài Gòn (SSI), và thực hiện các yêu cầu sau đây: - lưu số liệu vừa thu thập về dưới dạng tập tin Excel với tên : data1.xls a. Chuyển hai chuỗi dữ liệu đó qua tập tin Eviews với tên biến là VNI và SSI? - click chuột phải vào data1.xls chọn Open with/Eviews - trong hộp thoại Spreadsheet Read: - bước 1: chọn Custom range sau đó điều chỉnh tới cột cần đặt tên /Next - bước 2: lần lượt nhập tên cho 2 cột là VNI và SSI /Finish 2 b. Vẽ hai biến VNI và SSI trên cùng một đồ thị? - từ cửa sổ tập tin, chọn Quick/Graph - trong Series list, nhập tên biến vào (biến nào ở trục hoành gõ trước): vni ssi /OK - nếu chọn Type: là Line & Symbol và Axis/Scale : #2 SSI là Right /OK thì ta có đồ thị sau 200 400 600 800 1,000 1,200 0 50 100 150 200 250 300 2 4 6 8 10 12 14 16 18 20 22 24 VNI SSI c. Tính suất sinh lợi của thị trường (R m ) và hãy vẽ trên cùng đồ thị hai biến VNI và R m ? Lưu ý, R m có thể được tính như sau R m = (VNI t – VNI t-1 )/VNI t-1 hoặc R m = ln(VNI t /VNI t-1 ). Trong Eviews, hàm ln được sử dụng là log. - trên màn hình lệnh của Eviews nhập : genr rm=log(vni/vni(-1)) - sau đó, tương tự câu b, chọn Quick/Graph, rồi nhập tên biến : vni rm /OK - chọn Type: Line & Symbol và Axis/Scale cho Rm là Right /OK, ta có đồ thị sau 3 200 400 600 800 1,000 1,200 2 1 .0 .1 .2 .3 .4 2 4 6 8 10 12 14 16 18 20 22 24 VNI RM d. Vẽ đồ thị tần suất kèm thống kê mô tả biến SSI? Giải thích ý nghĩa của các thống kê trong bảng kết quả? - chọn Quick/Series Statistics/Histogram and Stats - trong Series name, nhập tên biến : ssi /OK , có đồ thị sau 0 2 4 6 8 10 0 25 50 75 100 125 150 175 200 225 250 275 Series: SSI Sample 1 24 Observations 24 Mean 103.6250 Median 61.75000 Maximum 265.0000 Minimum 21.40000 Std. Dev. 80.80398 Skewness 0.645914 Kurtosis 2.037646 Jarque-Bera 2.594943 Probability 0.273222 4 Ý nghĩa của các thống kê trong bảng kết quả : Series : biến Sample : mẫu quan sát Observations : số quan sát Mean : giá trị trung bình Median: trung vị Maximum: giá trị lớn nhất Minimum: giá trị nhỏ nhất Std.Dev. : độ lệch chuẩn Skewness : độ nghiêng Kurtosis : độ nhọn Jarque-Bera: thống kê JB, càng nhỏ thì biến càng “dễ” có phân phối chuẩn Probability: xác suất tương ứng của JB, càng nhỏ thì khả năng bác bỏ giả thiết Ho càng cao (giả thiết Ho mặc định là : biến có pp chuẩn), ở đây có kết quả 0.273222 (rất nhỏ) tức là biến không có phân phối chuẩn e. Vẽ trên cùng đồ thị VNI và VNI trễ một giai đoạn? - chọn Quick/Graph - nhập tên biến : vni vni(-1) /OK , có đồ thị sau 200 300 400 500 600 700 800 900 1,000 1,100 2 4 6 8 10 12 14 16 18 20 22 24 VNI VNI(-1) 5 f. Vẽ giản đồ tự tương quan của VNI với độ trễ được chọn là 5. Anh/Chị hãy giải thích và nêu ý nghĩa các hệ số AC và PAC? - chọn Quick/Series Statistics/Correlogram - trong Series name, nhập tên biến : vni(-5) /OK - trong Correlogram Specification, chọn Level /OK, có giản đồ tương quan sau Ý nghĩa các hệ số AC và PAC : AC (Autocorrelation Coefficient): hệ số tự tương quan  xác định chuỗi thời gian dừng hay không : - là “dừng” khi AC đầu tiên ≠0 nhưng các AC tiếp theo =0 một cách có ý nghĩa thống kê - là “không dừng” khi một số AC ≠0 một cách có ý nghĩa thống kê PAC (Partial Autocorrelation Coefficient): hệ số tự tương quan riêng xác định mô hình ARIMA thích hợp g. Vẽ giản đồ tự tương quan sai phân bậc nhất của VNI với độ trễ được chọn là 5. Anh/Chị có nhận xét gì giữa kết quả câu (g) và câu (f)? - chọn Quick/Series Statistics/Correlogram - trong Series name, nhập tên biến : d(vni,5) /OK - trong Correlogram Specification, chọn Level /OK, có giản đồ tương quan sau 6 Nhận xét kết quả câu g và f : - ở câu g là chuỗi thời gian không dừng vì: các hệ số AC đầu rất cao và về sau giảm dần =0 theo độ trễ - ở câu f là chuỗi thời gian dừng vì: các hệ số AC đầu ≠0 nhưng tiếp theo sẽ =0 Bài 2: Sử dụng tập tin hhexpe06.dta (tập tin Stata), chuyển sang tập tin Eviews và thực hiện các yêu cầu sau đây: - click chuột phải vào hhexpe06.dta chọn Open with/Eviews - xuất hiện hộp thoại Table read specification: chọn các biến cần thiết theo yêu cầu của đề bài để chuyển sang Eviews (mặc định là chọn hết) /OK a. Vẽ đồ thị tần suất các biến chi tiêu lúa gạo, chi tiêu phi lương thực, chi tiêu giáo dục, chi tiêu sức khỏe, chi tiêu nước uống, chi tiêu điện sinh hoạt và qui mô hộ gia đình Việt Nam năm 2006? 7 - mở cùng lúc các biến riceexp, nonfdx_1, educex_1, hlthex_1, waterexp, elecexp, hhsize bằng cách : giữ phím Ctrl khi chọn biến rồi click chuột phải chọn Open/as Group để mở biến - từ cửa sổ vừa mở, chọn View/Graph… - trong Graph Options : chọn Type là Distribution /OK, ta có đồ thị tần suất như sau 0 1,000 2,000 3,000 4,000 5,000 0 4,000 8,000 12,000 16,000 Frequency RICEEXP 0 1,000 2,000 3,000 4,000 5,000 6,000 0 40,000 80,000 120,000 160,000 Frequency NONFDX_1 0 1,000 2,000 3,000 4,000 5,000 6,000 7,000 0 10,000 20,000 30,000 40,000 Frequency ED U C EX_1 0 2,000 4,000 6,000 8,000 10,000 0 40,000 80,000 120,000 Frequency HLTHEX_1 0 2,000 4,000 6,000 8,000 10,000 0 5,000 10,000 15,000 20,000 Frequency WATER EXP 0 2,000 4,000 6,000 8,000 0 10,000 20,000 30,000 40,000 Frequency ELECEXP 0 500 1,000 1,500 2,000 2,500 3,000 0 2 4 6 8 10 12 14 16 18 Frequency HHSIZE 8 b. Lập bảng giá trị trung bình của các biến trên theo 5 nhóm thu nhập khác nhau? Anh/Chị rút ra được nhận xét gì? - double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau - chọn View/Descriptive Statistics & Tests/Stats by Classification… - xuất hiện hộp thoại Statistics By Classification : - trong Statistics : click chọn Mean - trong Series/Group for classify : nhập biến thu nhập (ko tìm thấy???) /OK, ta có kết quả như sau Nhận xét: c. Lập bảng giá trị trung bình của các biến trên theo 8 vùng địa lý khác nhau ở Việt Nam? Anh/Chị rút ra được nhận xét gì? - double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau - chọn View/Descriptive Statistics & Tests/Stats by Classification… - xuất hiện hộp thoại Statistics By Classification : - trong Statistics : click chọn Mean - trong Series/Group for classify : nhập Reg8 (biến vùng địa lý) /OK, ta có các kết quả như sau Nhận xét ở Việt Nam năm 2006: - Chi tiêu lúa gạo trung bình: cao nhất ở vùng 7 (1970.702), thấp nhất ở vùng 1 (663.8771) 9 - Chi tiêu phi lương thực trung bình: cao nhất ở vùng 7 (9690.978), thấp nhất ở vùng 3 (3196.382) - Chi tiêu giáo dục trung bình: cao nhất ở vùng 7 (2003.274), thấp nhất ở vùng 3 (675.6620) - Chi tiêu sức khỏe trung bình: cao nhất ở vùng 7 (1986.412), thấp nhất ở vùng 3 (658.8135) - Chi tiêu nước uống trung bình: cao nhất ở vùng 7 (236.9655), thấp nhất ở vùng 3 (40.83916) - Chi tiêu điện sinh hoạt trung bình: cao nhất ở vùng 7 (1182.311), thấp nhất ở vùng 3 (250.9021) - Qui mô hộ gia đình trung bình: cao nhất ở vùng 3 (6 người/hộ), thấp nhất ở vùng 1 (4 người/hộ) Vùng 7: có chi tiêu TB cao nhất => vùng đồng bằng Nam Bộ (mức sống cao) Vùng 3: mức chi tiêu TB thấp + qui mô hộ gia đình TB cao nhất => vùng duyên hải miền Trung (nghèo, đông con) Vùng 1: chi tiêu TB lúa gạo và qui mô hộ gia đình TB thấp nhất => vùng núi caoTây Nguyên (thiếu lương thực, dân tộc thiểu số) d. Lập bảng so sánh giá trị trung bình các biến trên theo hai khu vực thành thị và nông thôn? Anh/Chị rút ra được nhận xét gì? - double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau - chọn View/Descriptive Statistics & Tests/Stats by Classification… - xuất hiện hộp thoại Statistics By Classification : - trong Statistics : click chọn Mean - trong Series/Group for classify : nhập Urban06 (biến khu vực) /OK, ta có kết quả như sau Nhận xét : 10 [...]... thấp bằng 0.0000 (mà p-value càng thấp thì khả năng bác bỏ H0 càng cao) do đó ta bác bỏ H0 (H0: trung bình chi tiêu giáo 11 dục ở thành thị và nông thôn là bằng nhau)  có sự khác biệt về chi tiêu giáo dục trung bình giữa thành thị và nông thôn Bài 3: Anh/Chị hãy chọn và phân tích một vấn đề về năng lực cạnh tranh cấp tỉnh ở Việt Nam mà mình quan tâm Để hỗ trợ bài tập này, Anh/Chị nên sử dụng tập tin... Các hệ số b4,b5,b6 không có ý nghĩa thống kê Hệ số b2, b3 có ý nghĩa thống kê và có dấu đúng với kỳ vọng Vì: - b2 >0 : điểm về kỹ năng bán hàng càng cao thì doanh số bán hàng cũng tăng theo - b3 >0 : nhân viên càng hăng hái trong công việc thì doanh số bán hàng càng tăng d) Ước lượng mô hình dự báo: chưa học! Bài 2: a) Chọn các biến y,b2,b3,b4,b5,b6,b7,b8 -> nhấp chuột phải, Open/as group -> vào view/... P(X < 7.4) 12 Vì μ=8 và phân phối của X là pp chuẩn ( pp chuẩn đối xứng quanh giá trị μ ) nên :  P( X < 7.4 ) = P( X > 8.6 ) = 0.4522 d Tính P(7.4 < X < 8.6) Vì μ=8 và phân phối của X là pp chuẩn ( pp chuẩn đối xứng quanh giá trị μ ) nên :  P( 7.4 < X < 8.6 ) = 2 * P( 8 < X < 8.6 ) = 2 * 0.0478 = 0.0956 Bài 5: Từ một mẫu 25 quan sát, người ta tính được giá trị trung bình là 172.5 và độ lệch chuẩn là... TRUNG BÌNH ( với X có phân phối chuẩn ) : - là thống kê t : với giả thiết H0, có phân phối t với số bậc tự do là N-1 ( nếu không biết σ của X ) - là thống kê z : với giả thiết H0, có phân phối chuẩn hóa ( nếu biết σ của X ) Ở đây do ta đã biết σ = 15.4 , nên thuộc loại thống kê z có phân phối chuẩn hóa b Kiểm định giả thiết trên với mức ý nghĩa lần lượt như sau: α = 1%, 5%, 10%, và 15%? Anh/Chị cho biết... Kiểm định giả thiết cho rằng Hệ số Beta của công ty chứng khoán Sài Gòn =1 5 Tình hệ số tương quan giữa suất sinh lợi thị trường và suất sinh lợi của cổ phiếu SSI: Nhập lệnh Genr rim=@cor(ri,rm) hoặc mở biến ri và rm as groupQuick/Group Statistics/Correlation Với rm=log(vni/vni(-1)) và ri=log(ssi/ssi(-1)) RI RM RI 1 0.4460120397302639 RM 0.4460120397302639 1 6 Ước tính hệ số Beta điều chỉnh cho cổ phiếu... 2006, 2007, và 2008 (và các báo cáo tổng hợp liên quan) Bài 4: Cho X ~ N(8,25)  μ=8 , σ=5 Yêu cầu: Vẽ phát họa đồ thị cho từng trường hợp a Tính P(X > 8.6) Có Z =  8.6 − 8 = 0.12 5 P( X > 8.6 ) = với Z ~ N( 0,1 ) P( Z > 0.12 ) = 1 - P( Z < 0.12 ) = 1 - 0.5478 = 0.4522 Tính P( Z < 0.12 ) bằng Excel, sử dụng hàm : = NORMDIST ( 0.12 , 0 , 1 , true ) = 0.547758426 b Tính P(8 < X < 8.6) Vì μ=8 và phân phối... e) Kiểm định các hệ số hồi quy: Các hệ số b1,b2,b3,b5,b6,b7 đều có ý nghĩa kinh tế ở mức 5% vì p-value của chúng đều nhỏ hơn 0.05 (bác bỏ Ho, Ho = các hệ số không có ý nghĩa thống kê) Ý nghĩa kinh tế: b1= -149.15 : hệ số cắt b2= 6.07 : nếu các biến giải thích khác không đổi, nếu tổng số lao động (x2) tăng thêm 1 ngàn người thì doanh thu (Y) sẽ tăng thêm 6.07 triệu đôla  Các hệ số khác giải thích tương... Series Distribution Tests : - Trong Test value: nhập vào “MEAN” là 168 - Trong Mean test assumption: nhập vào “ENTER s.d if known” là 24 ( do = N-1 = 25 -1) /OK 13  Khi α càng tăng thì càng “dễ” chấp nhận giả thiết Ho II ASSIGNMENT 2: Bài 2: Từ dữ liệu của Assignment 1 1 Ước lượng mô hình CAPM có dạng: log(SSI/SSI(-1)) c log(VNI/VNI(-1)) : Chọn 2 biến ssi và vni  Quick/Estimation Equation  nhập log(SSI/SSI(-1))... phù hợp vì các giá trị phân tán quanh đường hồi quy • Vẽ đồ thị phân tán giữa X5 với Y: (tương tự với X3) 17 Y 0.602849 0.932005 0.105862 0.987976 0.618947 0.052856 0.215714 1.000000 70,000 60,000 50,000 Y 40,000 30,000 20,000 10,000 0 0 10,000 20,000 30,000 40,000 50,000 X5 Nhận xét : đây là mô hình phù hợp vì các giá trị phân tán quanh đường hồi quy d) Nhấp đúp vào biến y -> vào view/ Descriptive... chỉnh cho cổ phiếu SSI: Genr beta_adjusted=c(2)/@cor(ri,rm) 7 Giả sử suất sinh lợi phi rủi ro của Việt Nam là 9.6% và phần bù rủi ro thị trường là 5.5%, ước tính suất sinh lợi kỳ vọng cho cổ phiếu SSI: RSSI,VNI = 9,6% + beta*5,5% Bài 3: III ASSIGNMENT3: Bài 1: a) Nhấp đúp vào biến y -> vào view/ Descriptive Statistic & Tests/ Stats by classification, gõ “X2” ở Series/ group for classify -> ta có bảng . Bài tập và hướng dẫn phân tích số liệu bằng SPSS 1 BAI TAP CA NHAN I.ASSIGNMENT 1: Bài 1: Anh/Chị hãy vào trang web: http://www.fpts.com.vn/user/stock/thong-ke/ thu thập số liệu theo. giữa thành thị và nông thôn Bài 3: Anh/Chị hãy chọn và phân tích một vấn đề về năng lực cạnh tranh cấp tỉnh ở Việt Nam mà mình quan tâm. Để hỗ trợ bài tập này, Anh/Chị nên sử dụng tập tin PCI.xls. tháng của chỉ số giá chứng khoán VN Index (VNI) và giá của cổ phiếu của Công ty Chứng khoán Sài Gòn (SSI), và thực hiện các yêu cầu sau đây: - lưu số liệu vừa thu thập về dưới dạng tập tin Excel

Ngày đăng: 09/08/2014, 14:21

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan