Bài giảng Phương pháp nghiên cứu khoa học - Chương 8: Phân tích số liệu

47 922 2
Bài giảng Phương pháp nghiên cứu khoa học - Chương 8: Phân tích số liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng Phương pháp nghiên cứu khoa học - Chương 8: Phân tích số liệu

CHƯƠNG 8: PHÂN TÍCH SỐ LIỆU Mục đích của chương này là phải đưa ra cách thể hiện đơn giản về việc phân tích số liệu như thế nào. Đáp ứng mục tiêu trên, các nội dung trình bày trong chương này bao gồm: 8.1. Mã hóa và lưu giữ các quan sát 8.2. Phân tích một biến 8.3. Lập bảng chéo trong phân tích số liệu 8.4. Phân tích hồi quy tuyến tính đơn 8.5. Phân tích hồi quy đa biến 8.6. Các biến giả trong phân tích hồi quy 8.7. Giới thiệu quy trình xử lý số liệu định lượng trong nghiên cứu xây dựng chỉ số cạnh tranh cấp tỉnh (CPI) 8.1-Mã hóa và lưu giữ các quan sát  Thường các dữ liệu được lưu giữ theo dạng ma trận.  Mã hóa có nghĩa là định rõ các loại và chỉ định chữ số cho mỗi loại.  Chẳng hạn như mã số theo giới, trong đó nữ là 1, nam là hai; hay mã số theo vùng: vùng Bắc bộ là 1, Trung bộ là 2, Nam bộ là 3… 8.1-Mã hóa và lưu giữ các quan sát  Hoặc mã số theo thang đo mức độ đồng tình có 7 mức độ: hoàn toàn đồng tình là 1, đồng tình phần lớn là 2, đồng tình một phần là 3, không đồng tình là 4, không đồng tình phần lớn là 5, không đồng tình 1 phần tình là 6, rất không đồng tình là 7.  Ngày nay có nhiều chương trình phần mềm để xử lý và lưu giữ số liệu điều tra như chương trình SPSS, ACESS, SAS… Phân tích định lượng 8.2-Phaân tích moät bieán  Phân tích thường dựa vào một dạng nào đó của “phân loại” và “so sánh”.  Giả sử chúng ta muốn biết sở hữu xe hơi theo hộ trong tổng số dân cư hay tổng số hộ. Mỗi hộ sau đó có thể được phân loại dựa vào số xe hơi được sở hữu  Các quan sát theo mẫu ngẫu nhiên với kích thước mẫu n=100 hộ có thể được phân loại theo phân bổ tần suất một biến theo biểu 8.1 dưới đây x=Số xe hơi sở hữu h=tần số tuyệt đối=số lượng hộ theo sở hữu xe hơi h/n= quan hệ tần suất Tỷ lệ 0 3 0,03 3 1 45 0,45 45 2 37 0,37 37 3 11 0,11 11 4 4 0,04 4 Tổng số 100 1,00 100 BẢNG 8.1: Sở hữu xe hơi theo hộ trong mẫu ngẫu nhiên 8.2-Phân tích một biến (tt)  Ngoài ra, từ kết quả khảo sát trên, nhờ vào máy tính có thể tính các số trung bình, số trung vị, phương sai, độ chênh lệch chuẩn, hệ số biến thiên. Đây là các chỉ số kiểm định thống kê về kết quả khảo sát để đảm bảo độ tin cậy của số liệu thu thập.  Số trung bình: n x x i   8.2-Phân tích một biến (tt)-Các kiểm định thống kê  Trong công thức trên, x i là giá trị quan sát thứ i, n là số lần quan sát. Trung bình số học (mean) làx là ký hiệu của số trung bình trong thí dụ này bằng 1,68, tức trung bình có 1,68 xe hơi trên 1 hộ  Tần số h và tần suất f được tính bằng hệ số h/n, trong đó h là tần số tuyệt đối (trong thí dụ của chúng ta h số hộ theo số xe sở hữu 8.2-Phân tích một biến (tt)-Các kiểm định thống kê  Số trung vị (median) là giá trị nằm giữa của giãy số  Nếu giá trị quan sát là lẻ thì số thứ tự của số trung vị (median) là (n+1)/2. Trong thí dụ này (0,1,2,3,4), số trung vị nằm ở vị trí thứ 3 có giá trị =2  Nếu số giá trị quan sát là chẵn, số trung vị là số nằm giữa hai giá trị trung tâm. Giả sử số biến quan sát x trong thí dụ của chúng ta là từ 0 đến 5 (0, 1, 2, 3, 4, 5), khi đó số trung vị trong thí dụ này có giá trị là (2+3)/2= 2,5. 8.2-Phân tích một biến (tt)-Các kiểm định thống kê  Khoảng biến thiên R = Xmax-Xmin, thể hiện độ ổn định của dãy số liệu (khoảng biến thiên càng nhỏ thể hiện dãy số đạt độ ổn định cao, ngược lại khoảng biến thiên lớn thể hiện đại lượng ngẫu nhiên bị phân tán)  Xmin là giá trị nhỏ nhất của quan sát trong thí dụ này =0,000; Xmax là giá trị lớn nhất của quan sát trong thí dụ này=4,000  Như vậy khỏang biến thiên trong thí dụ này R= 4,000-0,000=4,000 8.2-Phân tích một biến (tt)-Các kiểm định thống kê  Độ lệch chuẩn (standard deviation). Độ lệch chuẩn là công cụ để so sánh sự đồng nhất của hai dãy phân phối, dãy nào có độ lệch chuẩn nhỏ được coi nhà đồng nhất hơn  Độ lệch chuẩn là căn bậc hai của phương sai của mẫu quan sát. Phương sai của mẫu quan sát được tính theo công thức sau: 1 )( 2     n x x i x  [...]...8.2 -Phân tích một biến (tt)-Các kiểm định thống kê 2 • Độ lệch chuẩn    trong thí dụ của chúng ta δ= 0,836 • Ước lượng số trung bình tổng thể • Dựa vào độ lệch chuẩn có thể ước lượng số trung bình của tổng thể • Dựa vào các kiểm định thống kê để có thể rút ra rằng xu hướng tìm được qua kích thước mẫu là 100 hộ (thí dụ trên) có đủ để đại diện cho xu thế của toàn bộ số hộ hay không? 8.2 -Phân tích. .. thứ chín 36 18 1.26 14.50 Năm thứ mười 37 19 1.28 15.00 8.5-Hồi qui tương quan bội(tt)    A1=1,459; A2=30,69;A3 =-0 ,818; và B =-1 7,103, tức phương trình hổi quy có dạng: Y= 1,459X1+30,69X 2-0 ,818X 3-1 7,103 Hệ số tương quan bội R=0,996 rất cao thể hiện mối quan hệ chặt chẽ giữa các biến độc lập với biến phụ thuộc Hệ số hồi qui điều chỉnh bình phương bằng 0,993 cho thấy có tới 99,3% biến thiên trong thu... những nhân viên đã qua một chương trình huấn luyện, trong khi đó nhóm B gồm những người chỉ được giới thiệu một cách tóm lược về công việc bán hàng 8.6-Các biến giả (ảo) trong phân tích hồi qui(tt )- Các biến độc lập giả   Chúng ta cần hoàn thành một phân tích hồi qui, trong đó biến độc lập là số tháng mà người bán hàng thực hiện công việc bán hàng hay là kinh nghiệm qua số tháng bán hàng, và biến... thuộc là doanh thu bán hàng trong một tháng Chúng ta, tất nhiên có thể phân tích theo hai nhóm một cách độc lập Bằng việc phân tích cả hai nhóm đồng thời qua sử dụng các biến giả chúng ta có thể so sánh kết quả thực hiện của hai nhóm 8.6-Các biến ảo (giả) trong phân tích hồi qui(tt )- Các biến độc lập giả      Ta gọi:X1j là số tháng kinh nghiệm mà người thứ j bán hàng có được qua thời gian bán... thứ mười 37 19 Năm thứ nhất 20 10 Số liệu biểu trên có thể biểu diễn trên đồ thị dưới đây: 40 30 20 Series1 10 0 0 5 10 15 20 8.4-Hồi quy tuyến tính giản đơn(tt)     đồ trên thể hiện mối quan hệ giữa X và Y là quan hệ đường thẳng (tuyến tính) Giải phương trình hồi qui tuyến tính trên máy tính với các số liệu bảng trên cho ta kết quả hệ số A=1,945 và B=1,491, phương trình tuyến tính thể hiện mối... được nằm ngoài khoảng 1, 5-2 ,0 tức giả thuyết H bị loại bỏ 8.3-Lập bảng chéo    Thí dụ chúng ta cần nghiên cứu khả năng quan hệ giữa trình độ giáo dục của khách hàng và sự quan tâm về sản phẩm nào đó Số liệu có thể được lập bảng chéo được trình bày trong bảng 8.2 dưới đây Trong đó Trình độ giáo dục được phân theo hai mức (cao và thấp) và mức độ quan tâm sản phẩm đã được phân thành hai loại (cao... cho 3 đến 4 biến Với bất kỳ số loại dòng và cột nào chúng ta thường được chú ý đến kiểm chứng giả thuyết, H, rằng có hay không sự độc lập thống kê về mối quan hệ giữa phân loại theo dòng và phân loại theo cột Thường được kiểm định qua ChiSq (xem giáo trình xác suất-thống kê) 8.3-Lập bảng chéo (tt)-Nhiều biến và kiểm định thống kê    Khi sử dụng ý nghĩa ở mức độ 0,05 (sai số) , giá trị tới hạn cho 1... kết quả số liệu bảng 8.1, sử dụng công thức tính ChiSq ta có thể tính ChiSq mối quan hệ giữa cột và dòng, và ChiSq=0,533 So sánh với kết quả tra bảng cho thấy 0,533  3,841, tức giả thuyết H không cần phải loại bỏ và kết luận là ở đây có sự độc lập Thủ tục kiểm định này được gọi là kiểm định độc lập 8.4-Hồi quy tuyến tính giản đơn    Một trong những các phương pháp thống kê hữu ích là phân tích hồi... của toàn bộ số hộ hay không? 8.2 -Phân tích một biến (tt)-Các kiểm định thống kê   Giả sử cho rằng số xe hơi theo hộ là phân bố chuẩn, tức 95% giới hạn độ tin cậy, số trung bình xe hơi cho tổng thể toàn bộ N hộ, ký hiệu số trung bình cho tổng thể là , và  có thể tính được qua bảng phân bố Student t Với xác suất độ tin cậy cho trước, tra bảng phân bố student t, tìm thấy  có hai giá trị trên và dưới,... ai ở nhóm A; X3j là mối tương tác= sản phẩm của X1j và X2j; Yj là tổng mức bán=là doanh số một tháng tháng cuối cùng của người thứ j Chúng ta có 10 quan sát cho nhóm B được thể hiện phần trên trong bảng 8.6 và 12 quan sát cho nhóm A đặt dưới số liệu của nhóm B Bảng 8.6: Số liệu thể hiện các biến ảo Số TT 1 X1j =Số tháng X2j=biến ảo 2 2 0 X3j=Sự tương tác 0 Yj=Doanh thu tháng 3 5 0 0 1 3 7 0 0 4 4 10

Ngày đăng: 04/06/2014, 06:55

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan