Review statistics PHÂN TÍCH DỮ LIỆU PLS SEM

18 9 0
Review statistics  PHÂN TÍCH DỮ LIỆU PLS SEM

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Khái niệm về đo lường Đo lường là hoạt động gán con số (biểu tượng) để biểu diễn cho đặc điểm (thuộc tính) của đối tượng (theo một quy tắc nhất định) để: Mô tả thuộc tính của đối tượng So sánh thuộc tính của đối tượng này với đối tượng khác Ví dụ: Thuộc tính? Biểu tượng? Gán? ID Tên Giới tính Gender Gender2 Biến khác 1 Nguyễn Văn A nam 1 M … 2 Nguyễn Thị B nữ 2 F … 3 Nguyễn Văn C nam 1 M … 4 levels of measurement 4 levels of measurement Types of variable (loại biến số) SPSS Nominal: định danh Ordinal: thứ tự Qualitative Var (Biến định tính) Nominal Ordinal Internal: khoảng bằng nhau. Không “True zero”. Ví dụ: độ C, quyết định mua hàng, mức độ hài lòng,… Ratio: tỷ lệ. Chia các khoảng cách bằng nhau + True zero (gốc 0 cố địnhở đó không thể đo lường được ví dụ: 0kg, 0cm, 0 độ F…) Quatitative Var (Biến định lượng) Scale Questionnaire Coding: ID, Items (Observed VarsIndicators), Answer SPSS: Import data: File => Import Data => Excel…=> chọn file (3_Preprocessing…) Chọn sheet (Data Screening) Chọn “Read variablename from first row of data” Variable Management: Name (of variable) Type (of values): đã số hóa hết => Numeric Qualitative Var Quantitative Var Lable (of Variable) √ √ Biến có nhiều Item => gắn vào cột N khi chạy phân tích (Lable of) Values √ KHÔNG GẮN Measure NominalOrdinal Scale Thống kê mô tả: Qualitative Var Lệnh: Analyze => Descriptive Statistics => Frequences Đại diện là Frequency Chạy lệnh này cho Biến định lượng

REVIEW STATISTICS Khái niệm đo lường Đo lường hoạt động gán số (biểu tượng) để biểu diễn cho đặc điểm (thuộc tính) đối tượng (theo quy tắc định) để: o Mô tả thuộc tính đối tượng o So sánh thuộc tính đối tượng với đối tượng khác Ví dụ: Thuộc tính? Biểu tượng? Gán? ID Tên Giới tính Nguyễn Văn A Nguyễn Thị B Nguyễn Văn C nam nữ nam Gende r Gender M F M Biến khác … … … levels of measurement Types of levels of measurement variable SPSS Nominal: định danh (loại biến số) Qualitative Var Nomina Ordinal: thứ tự (Biến định tính) l Quatitative Var Ordinal Scale Internal: khoảng Không “True zero” Ví dụ: độ C, định mua hàng, mức độ hài lòng,… Ratio: tỷ lệ Chia khoảng cách + True zero (gốc cố định-ở khơng thể đo lường ví dụ: 0kg, 0cm, độ F…) (Biến định lượng) Questionnaire Coding: ID, Items (Observed Vars/Indicators), Answer SPSS: 3.1 Import data: File => Import Data => Excel…=> chọn file (3_Preprocessing…) Chọn sheet (Data Screening) Chọn “Read variablename from first row of data” 3.2 Variable Management: Name (of variable) Type (of values): số hóa hết => Numeric Qualitative Var Quantitative Var √ √ Lable (of Variable) Biến có nhiều Item => gắn vào cột N chạy phân tích (Lable of) Values Measure √ KHƠNG GẮN Nominal/Ordinal Scale 3.3 Thống kê mơ tả: Qualitative Var o Lệnh: Analyze => Descriptive Statistics => Frequences o Đại diện Frequency o Chạy lệnh cho Biến định lượng Quantitative Var o Lệnh: Analyze => Descriptive Statistics => Descriptive o Đại diện Mean Stardard Deviation 3.4 Data cleansing (Cleaning): Filter file Excel (Bài kì có lỗi sai để tìm) Qualitative Variable: o Invalid Value: Delete => Missing Value o Missing Value: check lại Questionaire or Mode (giá trị thường xuất hiện) Quantitative Variable: o Invalid Value: Delete => Missing Value o Missing Value: điền Mean or Median (dùng cần số nguyên) Outliers: Số liệu nghi ngờ THỐNG KÊ (STATISTICS) Xem file excel: “4_Statistics” Mean (Trung bình) = xtb o Đại diện cho biến định lượng  Đánh giá biến số: khứ, mục tiêu, đối tượng khác, benchmark  Kết luận khái niệm (kèm theo GAP với biến số) o Mean đại diện cho mẫu Và người ta dùng để đánh giá quan sát cụ thể => tương quan so với nhóm Độ lệch = xi – xtb Standard deviation (độ lệch chuẩn) o trung bình “độ lớn” độ lệch o đo độ phân tán mẫu xung quanh Mean o Tính St.dev:  Cách 1: Lấy trị tuyệt đối độ lệch => tính trung bình  Cách 2: Lấy phương sai => thường dùng Variance (phương sai): o đo độ phân tán (độ biến thiên) mẫu xung quanh Mean quy ước bình phương độ lệch chuẩn o Trung bình "Bình phương độ lệch” n ∑ ( xi−xtb )2 σ 2= i=1 n Covariance (Hiệp phương sai): o đo biến thiên hai biến so với Mean chúng o trung bình tích độ lệch thời điểm => tương quan chiều hay ngược chiều, ko xác định độ lớn n ∑ ( xi −xtb )∗( yi− ytb ) Cov ( xi , yi )= I=1 n o Cov > => chiều (cùng nằm nằm Mean) o Cov < => ngược chiều o Chưa đánh giá độ lớn nên phải dùng Correlation Coefficient of Correlation (hệ số tương quan): cho thấy ràng buộc (bound) độ lớn (size) mối liên hệ tuyến tính Corr(xi,yi)= Cov(xi , yi) σx∗σy o Đi từ [-1;1] o tương quan dương hoàn hảo o -1 ngược chiều hoàn hảo o không tương quan Lưu ý: o Các thông số tính cho biến định lượng, ko dùng c/m biến định tính có liên quan o Nếu muốn đánh giá tương quan biến định tính thành nhiều biến => đánh giá biến 5 PHÂN VỊ: Xem file excel: “5_Percentiles” Median (trung vị): vị trí trung tâm Percentiles (phân vị) Quantile (tứ phân vị) o Q1: giá trị phân vị thứ 25 o Q2: giá trị phân vị thứ 50 o Q3: giá trị phân vị thứ 75 HỒI QUY Xem file Excel: “6_Regression” Income = 6.282 + 2.198 Exp o Inc = 2Exp o Delta (y) = a*Delta (x) o Exp Indepedend Var o Income Dependend Var Sai số, mặt trực quan: o Nếu tất điểm nằm nằm thẳng => sai số = o Nhân quả: kết nhiều nguyên nhân tạo thành o Nếu tất điểm ko nằm đường thẳng xu hướng (cùng chiều ngược chiều) => kết bị phụ thuộc tác động nhiều yếu tố có yếu tố đầu vào mà xem xét (biến độc lập) Phương trình: o Phương trình hồi quy: (1): Yi^ = Bo^ + B1^*Xi o Ln có khoảng cách giá trị thực tế (Yi) ước lượng(Yi^), sai số: (2): ei = Yi – Y^i o Tổng hợp (1) (2): (3): Yi = Yi^ + ei = Bo^ + B1^*Xi + ei o Trong nghiên cứu MQH nhân quả, khơng thể tìm hiểu hết ngun nhân tác động tới yếu tố mà thường tìm hiểu số nguyên nhân Những yếu tố khơng tìm hiểu ko thể mơ hình hồi quy coi sai số o Tại phương trình (3) gồm phần: phần (Bo^ + B1^*Xi) mô tả mức độ tác động Xi, phần (ei) mô tả tác động yếu tố khác chưa đưa vào mơ hình OLS (Oridinal least squares: Bình phương tối thiểu nhỏ nhất): o Để tìm đường thẳng tối ưu, sử dụng phương pháp OLS o Điều hàm ý: đường thẳng tối ưu đường thẳng mà tổng bình phương sai số nhỏ (trong tất đường thẳng thể xu hướng) n Tổng distance  = ∑ ei = e1^2 + e2^2 + … + en^2 => MIN i=1 o n n i=1 i=1 ∑ ei2=∑ ¿ ¿ ¿ => tìm Min = KS hàm số (dùng máy tính) R-square: o 0= Excel => chọn sheet “original” Bước 3: Variable Management o Quantitative Var: Lable (gắn nhãn cho tường minh), Measure (Edu …) o Qualitative Var: thêm Values Lable (Level: 1=>3: Staff, Middle, Senior; Gender: =>2: Female, Male) Bước 4: Descriptive Statistics o Qualitative Vars:  Analyze => Descriptive Statistics => Frequencies  Chọn biến định tính Gender Frequency Percent Valid Female 79 39.5 Male 121 60.5 Total 200 100.0 Valid Cumulative Percent Percent 39.5 39.5 60.5 100.0 100.0 Level Frequenc y Percent Valid Staff 60 30.0 Middle 56 28.0 Senior 84 42.0 Total 200 100.0 Valid Cumulative Percent Percent 30.0 30.0 28.0 58.0 42.0 100.0 100.0  Câu hỏi: bảng giải vấn đề gì? mẫu bị lệch?  Khơng lưu file output mà copy KQ sang Word o Quantitative Var:  Analyze => Descriptive Statistics => Descriptive  Chọn biến định lượng Descriptive Statistics Experience Age Education Satisfaction Income Valid N (listwise) N Minimum Maximum Mean 200 36 19.40 200 21 66 42.38 200 17 9.35 200 2.58 200 4.50 100.53 48.920 200 Std Deviation 6.392 7.701 4.875 1.289 17.60376 Bước 5: Cross table o Analyze => Table => Custom table o Phần Define có Summary Statistics => tự tìm hiểu o Qual-Qual Gender Female Male Level Staff Middle Senior Count Count Count 28 21 30 32 35 54 o Quant-Qual Experience Age Education Satisfaction Income Mean Mean Mean Mean Mean Gender Female 20.32 43.39 8.77 2.71 45.94 Male 18.79 41.72 9.73 2.49 50.87 Level Staff 20.02 43.15 9.28 2.52 39.27 Middle Senior 18.50 19.55 41.79 42.23 9.95 9.00 2.59 2.61 46.37 57.52 Bước 6: Phân vị o Analyze => Des …Sta => Explore o Chọn biến định lượng o Chọn Statistics => Percentitles Percentiles Percentiles 10 25 50 75 90 95 9.0000 11.0000 15.0000 19.5000 24.0000 28.0000 29.9500 28.1000 33.0000 37.0000 42.0000 48.0000 52.0000 54.0000 Weighted Experience Average Age (Definition 1) Education 2.0000 3.0000 5.0000 10.0000 14.0000 16.0000 17.0000 Satisfaction 1.0000 1.0000 1.0000 2.0000 3.7500 4.9000 5.0000 21.0600 28.1720 36.3050 46.7250 61.6875 72.9600 79.5275 Income Tukey's Experience 15.0000 19.5000 24.0000 Hinges Age 37.0000 42.0000 48.0000 Education 5.0000 10.0000 14.0000 Satisfaction 1.0000 2.0000 3.5000 36.3600 46.7250 61.5850 Income Bước 7: Ma trận tương quan (Correlation Table) o Lệnh: Analyze => Correlate => Bivariate o Chọn biến dịnh lượng Correlation s Experience Age Education Satisfaction Satisfactio Experience Age Education n Income 842** -0.01 0.052 798** 842** -0.026 0.055 672** -0.01 -0.026 0.057 -0.032 0.052 0.055 0.057 0.007 Income 798** 672** -0.032 Câu hỏi: Để đánh giá tương quan Y1 & Y2 làm sao: - Analyze => Correlate => Bivariate => Chọn Y1, Y2: - Giải thích bảng Correlations: N: Số mẫu Sig: P Values Hệ số tương quan Y1 Y2 (Pearson Correlation) -0.089 0.007 Bước 8: Hồi quy o Lệnh: Analyze => Repress…=> Lin… o Depen => Income; Indepen => Exp o Phần Save: chọn Unstandardized Predicted (sửa lại Income_hat giá trị dự đoán) Residual (độ lệch) Model Summary Adjusted R Std Error of Model R R Square Square the Estimate a 798 637 635 10.630962 a Predictors: (Constant), Experience ANOVAa Sum of Squares 39291.158 Model df Regressio n Residual 22377.437 198 Total 61668.595 199 a Dependent Variable: Income b Predictors: (Constant), Experience Coefficientsa Mean Square F 39291.158 347.656 113.017 Sig .000b Unstandardized Coefficients B Std Error 6.282 2.407 2.198 118 Standardize d Coefficients Beta Model (Constant) Experienc 798 e a Dependent Variable: Income  Pt hồi qui: Income^ = 6.282 + 2.198*Exp t 2.610 18.646 Sig .010 000

Ngày đăng: 30/11/2023, 22:12

Tài liệu cùng người dùng

Tài liệu liên quan