Gom nhóm dữ liệu đáp án bài tập

5 3.7K 125
Gom nhóm dữ liệu đáp án bài tập

Đang tải... (xem toàn văn)

Thông tin tài liệu

Gom nhóm dữ liệu đáp án bài tập

1Đáp án bài tập chương 5 : Gom nhóm DL2BÀI TẬP• Thời gian : 15’• Cho DL sau : {2,3,4,10,11,12,20,25,30} và k =2• Với trung tâm các nhóm là (m1, m2), sửdụng thuật toán k-means để xác định cácnhóm. Tính độ đo SSE cho từng nhóm ởvòng lặp đầu tiên và cuối cùng.• Dưới đây là một đáp án. 23Đáp án : k - MEANS• Cho tập DL 1 chiều sau và k = 2 : {2,3,4,10,11,12,20,25,30}• Bước 1 : – Giả sử chọn các trung tâm cụm là : m1=5, m2=10• Gán các đối tượng vào hai cụm. Thu được :– K1={2,3,4},– K2={10,11,12,20,25,30}– SSE = 744• Tính lại trung tâm cụm : m1= 3; m2=184Đáp án : k - MEANS• Tiếp tục :– K1={2,3,4,10}, K2={11,12,20,25,30}– Trung tâm cụm mới : m1=4.75, m2=19.6• Tiếp tục :– K1={2,3,4,10,11,12}, K2={20,30,25}– Trung tâm cụm mới : m1=7, m2=25• Các cụm thu được cuối cùng :– K1={2,3,4,10,11,12}, K2={20,30,25}– SSE = 150 • Thuật toán dừng vì các trung tâm cụm không thay đổi . 35Bài tập : THUẬT TOÁN AGNES• Thời gian : 20’• Cho tập DL gồm 6 điểmtrong không gian 2chiều. Sử dụng thuậttoán AGNES vớiComplete link (khoảngcách xa nhất giữa 2điểm của 2 nhóm khácnhau) để gom nhóm.Điểm Tọa độ x Tọa độ yP1 0.40 0.53P2 0.22 0.38P3 0.353 0.32P4 0.26 0.19P5 0.08 0.41P6 0.45 0.306Đáp án : THUẬT TOÁN AGNES• Xây dựng ma trận khoảng cách (độ đo Euclide)giữa các điểmP1 P2 P3 P4 P5 P6P10.00 0.23 0.22 0.37 0.34 0.24P20.23 0.00 0.15 0.19 0.14 0.24P30.22 0.15 0.00 0.16 0.29 0.10P40.37 0.19 0.16 0.00 0.28 0.22P50.34 0.14 0.29 0.28 0.00 0.39P60.24 0.24 0.10 0.22 0.39 0.00 47Đáp án : THUẬT TOÁN AGNESSử dụng Complete Link :1. Bước 1 : mỗi điểm là một nhóm2. Bước 2 :• Trong số các nhóm gồm một điểm thì dist(3,6) minnên gộp điểm P3 và P6 với nhau thành một nhóm• Thu được các nhóm : {1}, {4}, {2}, {5}, {3,6},3. Quay lại bước 2 do chưa thu được nhóm “toàn bộ” :4. Tính khoảng cách giữa các nhóm . Ví dụ :• Dist({3,6},{1}) =max(dist(3,1),dist(6,1))=max(0.22, 0.24) = 0.24(cần liệt kê đầy đủ các khoảng cách giữa các nhóm)8Đáp án : THUẬT TOÁN AGNESSử dụng Complete Link :5. dist(2,5) là nhỏ nhất nên gộp P2 và P5. Ta có các nhóm sau : {1}, {4}, {3,6}, {2,5}6. Tính khoảng cách giữa các nhóm. Ví dụ :• dist({3,6},{2,5}) = max(dist(3,2),dist(6,2),dist(3,5),dist(6,5)) = max(0.15, 0.24, 0.28, 0.39) = 0.39• dist({3,6},{4}) = max(dist(3,4),dist(6,4)) = max(0.16, 0.22) = 0.22• (cần liệt kê đầy đủ các khoảng cách giữa các nhóm)• dist({3,6},{4}) nhỏ nhất nên gộp các nhóm {3,6}, {4} thành một nhóm.• Ta thu được các nhóm : {1},{2,5},{3,4,6} 59Đáp án : THUẬT TỐN AGNESSử dụng Complete Link :7.Tiếp tục : • Tính khoảng cách giữa các nhóm : ….• Gộp {1} với {2,5} thu được các nhóm {1,2,5}, {3,4,6} 8.dist ({3,4,6},{1,2,5})= 0.399.Gộp 2 nhóm này ta thu được nhóm “tồn bộ” và thuật tốn dừng 10Đáp án : THUẬT TỐN AGNES3 6 4 1 2 500.050.10.150.20.250.30.350.412345612 534Các nhóm(Complete Link)Sơ đồ hình cây0.390.220.340.140.1 . 1Đáp án bài tập chương 5 : Gom nhóm DL2BÀI TẬP• Thời gian : 15’• Cho DL sau : {2,3,4,10,11,12,20,25,30} và k =2• Với trung tâm các nhóm là (m1,. thuật toán k-means để xác định cácnhóm. Tính độ đo SSE cho từng nhóm ởvòng lặp đầu tiên và cuối cùng.• Dưới đây là một đáp án. 2 3Đáp án : k - MEANS• Cho tập

Ngày đăng: 31/08/2012, 16:33

Hình ảnh liên quan

Đáp án : THUẬT TOÁN AGNES - Gom nhóm dữ liệu đáp án bài tập

p.

án : THUẬT TOÁN AGNES Xem tại trang 5 của tài liệu.
Sơ đồ hình cây - Gom nhóm dữ liệu đáp án bài tập

Sơ đồ h.

ình cây Xem tại trang 5 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan