Tiểu luận môn cơ sở dữ liệu nâng cao Đẳng cấu đồ thị con với thời gian đa thức

MỤC LỤC  MỤC LỤC_____________________________________________________________1 LỜI NÓI ĐẦU__________________________________________________________2 TỔNG QUAN__________________________________________________________3 Đẳng cấu đồ thị con với thời gian đa thức._____________________________________4 TỔNG KẾT VÀ HƯỚNG DẪN SỬ DỤNG CHƯƠNG TRÌNH__________________46 Tác giả bài báo trên đã chỉ ra cho chúng ta thấy một hướng tiếp cận rất hay về vấn đề đẳng cấu đồ thị, đặc biệt là làm giảm thời gian tính toán bằng cách tính trước cây quyết định ở bước tiền xử lý. Trong quá trình tính toán, tác giả nêu lên những phương pháp để có thể giảm thiểu độ phức tạp của chương trình một cách cần thiết. Vì thế nếu đi sâu tìm hiểu ta có thể áp dụng cách tiếp cận này cho một số bài toán thực tế. Bên cạnh đó, tác giả cũng chỉ cho chúng ta thấy một số hạn chế nhất định của phương pháp này.______46 Do hạn chế về thời gian và ngôn ngữ nên bài dịch này sẽ không tránh khỏi sai sót, em mong được sự góp ý của thầy. Ngoài bài dịch này ra, em có minh họa cho bài báo này bằng một chương trình đơn giản để nhận dạng đồ thị. Chương trình được viết bằng ngôn ngữ C++ (Visual Studio 2010). Thực hiện chương trình bằng cách nhập vào 2 tập tin văn bản (theo dạng ma trận).______________________________________________46 TÀI LIỆU THAM KHẢO (CỦA BÀI BÁO)__________________________________47 Trang 1 LỜI NÓI ĐẦU Môn Cơ sở dữ liệu (Nâng cao) là một môn rất hay, khó và cần thiết cho sinh viên ngành tin học. Và càng hay hơn nữa khi em được thầy Đỗ Phúc phụ trách môn học này. Khi học với thầy em nhận thấy rằng: thầy có kiến thức rất sâu rộng ở nhiều lĩnh vực nên luôn tạo cho bài giảng của mình một cách rất sinh động, tự nhiên. Thầy dẫn dắt chúng em đi sâu vào bài học bằng những kiến thức, những mẩu chuyện, những ví dụ rất quen thuộc và cách thầy đan xen chúng vào nhau thật là khéo léo. Qua môn học này ở chương trình cao học, em nhận ra rằng trên cơ sở dữ liệu truyền thống ta có rất nhiều cách thức để tạo, biến đổi, . . . nó có hiệu quả hơn với nhu cầu thực tế sử dụng mà trước đây em chưa biết được. Bên cạnh đó em cũng đúc kết được thêm một số kinh nghiệm, kỹ năng rất quan trọng, cần thiết và nhất là phần kiến thức vô cùng bổ ích mà thầy đã truyền đạt và định hướng cho chúng em. Em xin gởi lời cám ơn đến thầy Đỗ Phúc, thầy đã rất tận tâm, truyền đạt rất nhiều kiến thức, ý tưởng mà em rất tâm đắc. Em chúc thầy cùng luôn khỏe mạnh và đạt nhiều thành quả trong công việc của mình. Trang 2 TỔNG QUAN Vấn đề đẳng cấu đồ thị chúng ta đã nghe và ứng dụng của nó trong thực tế cũng rất nhiều. Nhưng điều quan trọng là cho đến thời điểm hiện tại, chúng ta vẫn chưa tìm ra một phương pháp tối ưu nhất để giải quyết vấn đề này. Một số phương pháp nghiên cứu trong quá khứ và hiện tại giải quyết cho vấn đề này cũng còn tồn tại một số hạn chế nhất định. Do đó, hiện tại vẫn còn nhiều công trình khoa học nghiên cứu về vấn đề này để tìm ra cách tối ưu nhất cho trường hợp tổng quát. Trong quá trình học môn Cơ sở dữ liệu nâng cao do thầy Đỗ Phúc phụ trách, thầy có giới thiệu một hướng tiếp cận cho vấn đề này với độ phức tạp thời gian là đa thức. Em thấy đây là một hướng tiếp cận mới có những ưu điểm mà ta có thể ứng dụng cho một số vấn đề trong thực tế. Bên cạnh đó, do tính chất của môn học, nên em mạn phép được dịch bài báo và cài đặt thí nghiệm chương trình minh họa cho bài báo này mà thầy đã giới thiệu. Thông tin về tiêu đề và tác giả của bài báo như sau: Subgraph Isomorphism in Polynomial Time B.T. Messmer and H. Bunke Institut fur Informatik und angewandte Mathematik, University of Bern, Neubruckstr. 10, Bern, Switzerland Ni dung bài báo xin    c dch và trình bày nh sau: Trang 3 Đẳng cấu đồ thị con với thời gian đa thức. B.T. Messmer vàd H. Bunke Trong bài báo này, chúng tôi đề xuất một cách tiếp cận mới cho vấn đề tìm đồ thị con đẳng cấu. Phương pháp mới được thiết kế dựa trên 2 đồ thị. Một đồ thị mẫu sẵn có (model graphs) và một đồ thị đầu vào (input graphs). Ta sẽ tìm một đồ thị con trong đồ thị ban đầu mà đẳng cấu với đồ thị đưa vào. Ý tưởng của phương pháp này là trước tiên ta sẽ tạo ra một cây quyết định (decision tree) trên đồ thị mẫu. Khi thực thi, đồ thị đầu vào sẽ được phân loại bởi cây quyết định và cho biết có tồn tại một đồ thị con đẳng cấu với đồ thị đầu vào hay không. Nếu chúng ta bỏ qua thời gian cần thiết cho quá trình tiền xử lý (tạo ra cây quyết định ban đầu), thì bài toán sẽ có độ phức tạp là bậc 2 của số đỉnh đồ thị đầu vào. Hơn nữa, thuật toán cũng độc lập với đồ thị mẫu và số cạnh của nó. Tuy nhiên, cây quyết định được xây dựng trong bước tiền xử lý có thể phát triển theo cấp số nhân với số đỉnh của đồ thị mẫu. Vì vậy, chúng tôi xin trình bày một thuật toán nhằm mục đích giảm độ phức tạp của cây quyết định. Việc ứng dụng thuật toán trong việc nhận dạng đồ thị được trình bày tóm tắt như sau: Trang 4 1. Giới thiệu Đẳng cấu đồ thị và đồ thị con là những khái niệm đã được dùng trong nhiều ứng dụng khác nhau. Giải pháp so sánh sự khác nhau giữa các đồ thị là động lực thúc đẩy nhiều nhà nghiên cứu trong suốt hai mươi năm qua. Một số thuật toán trước đây đề xuất độ phức tạp xấu nhất theo cấp số nhân và được biết dưới dạng các bài toán NP-complete. Trong phần sau đây, chúng tôi sẽ cung cấp một cách tổng quan thuật toán về đẳng cấu đồ thị và đồ thị con. Trong quá khứ có hai cách tiếp cận cơ bản về vấn đề đẳng cấu đồ thị. Cách thứ nhất được dựa trên khái niệm về lý thuyết nhóm và nghiên cứu của nhóm hoán vị. Cách này đã được chỉ ra rằng tồn tại một giới hạn vừa phải của một cấp số nhân đối với các vấn đề đẳng cấu đồ thị nói chung. Hơn nữa, bằng cách áp đặt hạn chế nhất định trên các thuộc tính của đồ thị, ta có thể thấy được các thuật toán có độ phức tạp đa thức. Ví dụ: Luks và Hoffman mô tả một phương pháp giới hạn đa thức cho việc tìm đẳng cấu đồ thị bằng các liên kết hóa trị. Đối với trường hợp đặc biệt, đẳng cấu đồ thị hóa trị ba, thuật toán có độ phức tạp là O(n 6 ) theo tài liệu [Luk82]. Trong tài liệu [HW74], một phương pháp đề xuất tính toán đẳng cấu của đồ thị phẳng có độ phức tạp tuyến tính về thời gian Tuy nhiên, nhược điểm lớn của các thuật toán dựa trên khái niệm lý thuyết nhóm thường là chi phí và độ phức tạp lý thuyết cao. Cách tiếp cận thứ hai của việc đẳng cấu đồ thị và đồ thị con nghiêng về hướng thực hành nhiều hơn bằng cách xây dựng một thuật toán để phát hiện đẳng cấu. Hầu hết các thuật toán này được dựa trên không gian tìm kiếm và quay lui. Một trong những lý thuyết đầu tiên trong lĩnh vực này được nêu ra bởi Corneil và Gotlieb trong tài liệu [CG70]. Cải tiến chính của phương pháp quay lui được Ullman trình bày, ông giới thiệu phương pháp cải tiến làm giảm không gian tìm kiếm của thủ tục quay lui một cách đáng kể được trình bày trong tài liệu [Ull76]. Gần đây, trong tài liệu [MLL92, FFG90], vấn đề đẳng cấu đồ thị được đơn giản hơn bằng cách xây dựng một đồ thị liên kết cho tất cả các đỉnh có thể ánh xạ. Và gần đây Trang 5 nhất, cách tiếp cận mạng để so khớp đồ thị đã được đề xuất trong tài liệu [MB95b]. Cho đến nay, chúng ta chỉ xét vấn đề tìm đồ thị hay đồ thị con đẳng cấu cùng một thời điểm. Tuy nhiên, trong các ứng dụng thực tế thường là một cơ sở dữ liệu đồ thị mẫu, và một đồ thị đầu vào cần kiểm tra đẳng cấu với các đồ thị trong cơ sở dữ liệu mẫu đó. Nếu số lượng các đồ thị trong cơ sở dữ liệu lớn, ta kiểm tra tuần tự mỗi đồ thị thì thuật toán trở nên rất tốn kém. Tất nhiên một số hệ thống đã được đề xuất trong quá khứ mà kết hợp các thuật toán đẳng cấu đồ thị hoặc đồ thị con với phương pháp lập chỉ mục. Ý tưởng cơ bản của lập chỉ mục là sử dụng riêng lẽ và dễ dàng tính toán các đặc tính của đồ thị đầu vào trong trường hợp chọn một tập nhỏ đồ thị của cơ sở dữ liệu đồ thị mẫu ban đầu. Trong [HS88], Horaud đề xuất sử dụng các đa thức nội tại thứ hai của ma trận Laplacian của đồ thị như là một chỉ mục đối với cơ sở dữ liệu đồ thị. Tuy nhiên, chỉ số này chỉ duy nhất cho đồ thị có ít hơn 12 đỉnh và độ phức tạp tính toán của nó là O(n 4 ), với n là số đỉnh của đồ thị. Một cách tiếp cận khác được trình bày trong [Par93], bằng cách tính toán cấu trúc chỉ mục mà nó được tổ chức như một một mạng phân cấp tương tự như việc so khớp đồ thị mạng căn bản được mô tả trong [MB95b]. Vấn đề được quan tâm nhất hiện này là phương pháp lập chỉ mục được đề xuất trong [Ike87, GB89, Spi93]. Thay vì sử dụng một cơ chế lập chỉ mục như là một bước tiền xử lý để phát hiện ra đẳng cấu đồ thị hoặc đồ thị con, cơ sở dữ liệu của đồ thị được chuyển đổi thành một cây quyết định. Cây quyết định sau đó được sử dụng trực tiếp dùng để chỉ mục và so khớp đồ thị mẫu với đồ thị đầu vào. Tuy nhiên, tất cả các phương pháp tiếp cận bằng cây quyết định đã được trình bày cho đến nay được ứng dụng mạnh trong việc nhận dạng các đối tượng 3D chứ chưa được sử dụng trong vấn đề đẳng cấu đồ thị nói chung. Trong bài báo này, chúng tôi đề xuất một phương pháp mới phát hiện đẳng cấu đồ thị và đồ thị con. Nó có hai tính năng quan trọng. Đầu tiên, thời gian thực thi của phương pháp này chỉ là bậc hai số đỉnh của đồ thị mẫu nếu chúng ta bỏ qua thời gian cần thiết cho bước tiền xử lý. Thứ hai, thời gian là độc Trang 6 lập với số lượng đồ thị trong cơ sở dữ liệu. Phương pháp mới dựa trên ý tưởng sau đây. Chúng tôi tạo ra một tập của tất cả các hoán vị của ma trận kề của đồ thị mẫu và tổ chức này tập hợp trong cây quyết định. Các đồ thị mẫu có thể kết hợp với nhau trong cùng một cây quyết định. Cây quyết định được xây dựng trước từ đồ thị mẫu. Khi thực thi, nó được sử dụng để xác định nếu có một đẳng cấu đồ thị con từ một đồ thị đầu vào với một trong những đồ thị mẫu. Ưu điểm chính của phương pháp này là nó đảm bảo độ phức tạp chỉ ở bậc hai thời gian. Tuy nhiên, thời gian cho bước tiền xử lý là tạo ra cây quyết định, trong trường hợp xấu nhất, sẽ là một cấp số nhân của các đỉnh. Tuy nhiên, chúng tôi tin rằng phương pháp này là một đóng góp mới trong lĩnh vực phát hiện đẳng cấu đồ thị con. Đây là một lĩnh vực ứng dụng được quan tâm đặc biệt với các đồ thị mẫu là tương đối nhỏ. Phần còn lại của bài báo này được tổ chức như sau. Phần 2: Những định nghĩa cơ bản và ký hiệu. Phần 3: Một trong các thuật toán cơ bản trong việc đẳng cấu đồ thị con được mô tả ngắn gọn để so sánh. Phần 4: Ý tưởng cơ bản và tổng quan của thuật toán mới. Phần 5 – 6: Mô tả chi tiết hơn về các thủ tục và cấu trúc dữ liệu của thuật toán mới. Phần 7: Kết quả của một tính toán phân tích phức tạp. Phần 8: Các kỹ thuật rút gọn cây quyết định. Phần 9: Một số thí nghiệm. Phần 10 Ứng dụng thuật toán vào việc phân tích hình ảnh. Phần 11: Tóm tắt kết quả và hướng nghiên cứu trong tương lai. Trang 7 2. Định nghĩa và ký hiệu Một số định nghĩa và ký hiệu cơ bản: Định nghĩa 2.1: Một đồ thị G có nhãn gồm 6 phần G = (V, E, µ, ν , L ν , L e ) với: • V là tập các đỉnh, • E ⊆ V × V là tập các cạnh, • µ : V → L ν là một hàm gán nhãn các đỉnh, • ν : E → L e là một hàm gán nhãn các cạnh, Thông thường, ta giả định rằng L ν và L e là tập giới hạn của nhãn tượng trưng. Lưu ý rằng những định nghĩa trên tương ứng với trường hợp của đồ thị có hướng. Đồ thị vô hướng sẽ có cùng một nhãn cho cạnh có hướng từ (v1, v2) và ngược lại. Định nghĩa: 2.2: Cho một đồ thị G = (V, E, µ, ν , L ν , L e ), một đồ thị con của G là có dạng: S = (V s , E s , µ s , ν s , L ν , L e ) như vậy: 1. Vs ⊆ V 2. E s = E ∩ (Vs × Vs) 3. µ s (v)=    µ(v) nếu v ∈ V s Không xác định cho các trường hợp còn lại 4. ν s (e)=    ν(e) nếu e ∈ E s Không xác định cho các trường hợp còn lại Cho đồ thị G = (V, E, µ, ν , L v , L e ) có V = {v 1 , v 2 , . . . , v n }. G cũng có thể đại diện bởi ma trận kề M= (m ij ), i, j = 1, . . ., n với m ij = µ(v i ) và m ij = ν ((v i ,v j )) với i ≠ j. Rõ ràng, các ma trận kề đại diện cho đồ thị không bị đếm lặp tại đỉnh. Tuy nhiên, đây không phải là hạn chế thực sự khi lặp ta có thể được biểu diễn bằng cách mở rộng tập nhãn đỉnh. Rõ ràng, ma trận M không phải là duy nhất cho đồ thị G. Nếu M đại diện cho G, sau đó bất kỳ hoán vị của M cũng là một đại diện hợp lệ của G. Định nghĩa 2.3: Một ma trận cấp n × n P = (p ij ) được gọi là một ma trận hoán vị nếu: Trang 8 1. p ij ∈ { } 1,0 với i, j = 1, . . ., n 2. 1 1 = ∑ = n i ij p với j = 1, . . ., n 3. 1 1 = ∑ = n j ij p với i = 1, . . ., n Nếu đồ thị G được biểu diễn bởi ma trận kề (cấp n×n) M và P là một ma trận hoán vị (cấp n×n), khi đó ma trận M’ (cấp n×n): M’ = PMP T (1) Với P T là hoán vị của P, và cũng là ma trận kề của G. Nếu p ij = 1 khi đỉnh thứ j trong M trở thành đình thứ i trong M’. Định nghĩa 2.4: Cho G 1 , G 2 là hai đồ thị và M 1 , M 2 là hai ma trận kề tương ứng. G1 và G2 là đẳng cấu nếu tồn tại một ma trận hoán vị P sao cho M 2 = PM 1 P T (2) Chú ý rằng ma trận P có thể được hiểu như là một hàm song ánh f mà nó ánh xạ các đỉnh từ G1 vào G2 và ngược lại. Như vậy, f(v j ) = v i nếu m ij = 1. Chúng ta sẽ gọi cả P và f là một đẳng cấu đồ thị con giữa G1 và G2. Như vậy, vấn đề tìm đẳng cấu đồ thị giữa hai đồ thị G1 và G2 là tương đương nhau bằng cách tìm ma trận hoán vị P với công thức (2) đúng. Định nghĩa 2.5: Cho hai đồ thị G1 và G2, có một đồ thị con đẳng cấu của G1 với G2 nếu có tồn tại một đồ thị con S ⊂ G2 như vậy G1 và S là đẳng cấu. Định nghĩa 2.6: Cho M = (m ij ) là một ma trận vuông cấp n và S k,m (M) là ma trận (m×k) thu được từ M bằng cách xóa các hàng k + 1, …, n và cột m + 1, …., n, với k, m < n. Như vậy S k,m (M) = (m ij ); i = 1, …, k và j = 1, …, m. Sử dụng các ký hiệu được giới thiệu trong những định nghĩa sau, không chỉ là khái niệm của đẳng cấu đồ thị mà còn đẳng cấu đồ thị con có thể được mô tả dưới dạng ma trận kề. Cho đồ thị G1 và G2 với ma trận kề M1 (m×m) và M2 (n×n) với m ≤ n. Có một đẳng cấu đồ thị con từ G1 vào G2 nếu tồn tại một ma trận hoán vị P (n×n) thỏa: M 1 = S m,m (PM 2 P T ) (3) Trang 9 Như vậy, vấn đề tìm một đồ thị con G2 đẳng cấu với G1 là tương đương với việc tìm ma trận hoán vị P thỏa biểu thức (3). Lưu ý rằng S m,m (PM 2 P T ) = S m,n (P)M 2 (S m,n (P)) T . 3. Tóm tắt thuật toán Ullman. Để so sánh, chúng ta xem phương pháp của Ullman trong [Ull76]. Phương pháp này có thể được áp dụng cho cả hai: tìm đẳng cấu đồ thị và đồ thị con. Phương pháp này được dựa trên kỹ thuật quay lui và một số thủ tục cải tiến. Trong số tất cả các phương pháp đã được đề cập, phương pháp của Ullman được xem là một trong các thuật toán nhanh nhất cho vấn đề tìm đồ thị đẳng cấu. Đầu vào của thuật toán gồm một đồ thị mẫu G = (V, E, µ, ν , L v , L e ) và một đồ thị đầu vào G1 = (V 1 , E 1 , µ 1 , ν 1 , L v , L e ). Cho M (n×n) là ma trận kề của G và M 1 (m×m) là ma trận kề của G 1 . Chúng ta tìm tất cả các ma trận hoán vị P mà có M 1 = S m,m (PM 1 P T ). Lưu ý rằng S i,n (P) là một ma trận hoán vị (i×n) đại diện cho một mảnh dò tìm từ đỉnh đầu tiên thứ i của G vào một số đỉnh trên G 1 . Nếu S i,i (M I ) = S i,n (P)M(S i,n (P)) T thì rõ ràng S i,n (P) đại diện cho một đẳng cấu đồ thị từ đồ thị con G 1 với một số đồ thị trong G gồm n đỉnh. Thuật toán của Ullman được dựa trên ý tưởng tìm tất cả các đồ thị con đẳng cấu bằng cách thiết lập ma trận hoán vị P từng dòng một (Hình 1). Theo định nghĩa 2.3, chúng ta biết rằng mỗi hàng k trong P có chứa chính xác một phần tử p ki = 1, trong khi tất cả các phần tử p kj = 0 với j ≠ i. Thủ tục đệ quy Backtrack được thiết lập bằng cách gán phần tử p 11 = 1 và tất cả các phần tử còn lại của hàng đầu tiên là 0. Nếu S 1,n (P) là một mảnh dò tìm được đại diện cho một đẳng cấu đồ thị con, khi đó thủ tục Backtrack được gọi lại và dòng thứ hai của P được thiết lập. Quá trình này được tiếp tục cho đến khi m dòng của P được thiết lập thành công và một đẳng cấu đồ thị con được tìm thấy hoặc điều kiện trong bước (3.b.ii) không thỏa mãn. Trong cả hai trường hợp, tiến trình sẽ quay lui với bước trước đó và gán P ki một giá trị khác. Trang 10 [...]... toán đẳng cấu đồ thị con khác đã được đề xuất trong các tài liệu đến thời điểm này) các thuật toán mới đảm bảo việc tìm ra tất cả các đồ thị và đồ thị con đẳng cấu trong thời gian bậc hai Đương nhiên, việc liệt kê danh sách của tất cả các đẳng cấu đồ thị con có thể mất thời gian theo cấp số nhân Các thuật toán Trang 25 mới cung cấp giải pháp cho việc tìm đẳng cấu đồ thị con trong phạm vi bậc hai về thời. .. toàn độc lập với số lượng các đồ thị mẫu trong cơ sở dữ liệu Trong khi đó, các thuật toán thông thường phải thực hiện một tìm kiếm đẳng cấu đồ thị cho mỗi đồ thị mẫu trong cơ sở dữ liệu và do đó phụ thuộc tuyến tính vào kích thước của cơ sở dữ liệu Trong khi thời gian tính toán của thuật toán cây quyết định dao động từ Trang 34 0.005 đến 0.01 giây, các thuật toán thông thường yêu cầu thời gian càng nhiều... kết luận rằng một cơ sở dữ liệu có chứa 100 đồ thị mẫu sẽ cần ít hơn 15 MB Do đó, với việc thực hiện thời gian chạy là độc lập với số lượng đồ thị mẫu, thuật toán mới là một lựa chọn thú vị cho nhiều ứng dụng thực tế Trang 35 Ngoài ảnh hưởng của kích thước của đồ thị và kích thước của cơ sở dữ liệu, sự phức tạp của vấn đề đẳng cấu đồ thị cũng là phụ thuộc mạnh mẽ vào số của các cạnh trong một đồ thị. .. chúng tôi tạo ra một đồ thị mẫu duy nhất bao gồm 11 đỉnh và 33 cạnh và sau đó dần dần Trang 33 thêm vào các đồ thị mới có cùng kích thước cho đến khi có 30 đồ thị trong cơ sở dữ liệu Với từng đồ thị mới đã được thêm vào cơ sở dữ liệu, một đồ thị đầu vào tương ứng được tạo ra và ta cố gắng tìm tất cả đẳng cấu đồ thị bằng cả hai thuật toán Kết quả của thí nghiệm thứ hai được hiển thị trong các Bảng 15... vào các yếu tố sau: N = số đồ thị mẫu trong cơ sở dữ liệu, M = số lượng tối đa của các đỉnh trong một đồ thị mẫu, I = Số đỉnh của đồ thị đầu vào, lv = số lượng nhãn đỉnh, le = số lượng nhãn cạnh 7.1 Tính toán phức tạp của thuật toán thông thường Để so sánh, đầu tiên chúng ta phân tích độ phức tạp không gian và thời gian theo cách cũ, phương pháp đẳng cấu đồ thị con trên cơ sở quay lui Trường hợp tốt... với ak+1 Vì vậy, theo lý thuyết sự phức tạp thuật toán đẳng cấu đồ thị con mới được giới hạn bởi: (Độ phức tạp thời gian trong trường hợp tốt nhất và xấu nhất của cây quyết định theo chiều rộng) O(M(2Mle + lv) + M2) = O (M2le + Mlv) (14) Chú ý rằng độ phức tạp của thuật toán mới đối với phát hiện đẳng cấu đồ thị con cũng áp dụng để phát hiện đẳng cấu đồ thị Một lần nữa, trường hợp đặc biệt cho đồ thị. .. tạp thời gian để phát hiện đẳng cấu đồ thị dựa trên việc rút gọn chiều rộng cây quyết định được tăng từ O(M 2) lên O(M3) Ngoài ra, tối ưu cây quyết định theo chiều rộng không còn hỗ trợ phát hiện đẳng cấu đồ thị con Phương pháp thứ hai nhằm mục đích rút gọn theo chiều sâu của cây quyết định Cây quyết định rút gọn theo chiều sâu sẽ không còn đảm bảo một phát hiện đẳng cấu đồ thị trong thời gian đa thức. .. M ) (11) Nếu có một số đồ thị mẫu trong cơ sở dữ liệu, cây quyết định trở thành phụ thuộc tuyến tính vào N, kích thước của cơ sở dữ liệu là: (độ phức tạp không gian của cây quyết định) ( ( O Nlv 1 + le2 ) M ) Trang 24 (12) Đây là trường hợp xấu nhất của đồ thị có hướng và có nhãn Trường hợp đặc biệt, đồ thị không nhãn, vô hướng Đối với những đồ thị này, trường hợp xấu nhất đối với các thuật toán thông... và tập các ma trận hoán vị tại nút N biểu thị cho tất cả các đồ thị đẳng cấu giữa GI và Gi Trang 21 Dễ dàng để thấy rằng thuật toán mới cho phép đẳng cấu đồ thị đi qua cây quyết định mà không có sự cần thiết phải quay lui và do đó độ phức tạp thời gian chỉ là đa thức ứng với số đỉnh của đồ thị đầu vào Hơn nữa, thuật toán rõ ràng là độc lập với số lượng đồ thị mẫu được biểu diễn trong cây quyết định... cây quyết định trở nên nhỏ hơn so với tất cả các đồ thị mẫu mới được thêm vào cơ sở dữ liệu Mặc dù với cả 2 cách rút gọn, cây quyết định hoàn chỉnh phát triển với số lượng đồ thị mẫu, nó lớn gấp bốn lần cây quyết định rút gọn Trong hình 18 cho thấy bộ nhớ sử dụng bởi cây quyết định theo chiều rộng ngày càng lớn Lưu ý rằng một cơ sở dữ liệu chứa 30 đồ thị mẫu - mỗi đồ thị mẫu có 11 đỉnh và 33 cạnh – thì . tìm đồ thị hay đồ thị con đẳng cấu cùng một thời điểm. Tuy nhiên, trong các ứng dụng thực tế thường là một cơ sở dữ liệu đồ thị mẫu, và một đồ thị đầu vào cần kiểm tra đẳng cấu với các đồ thị. nhỏ đồ thị của cơ sở dữ liệu đồ thị mẫu ban đầu. Trong [HS88], Horaud đề xuất sử dụng các đa thức nội tại thứ hai của ma trận Laplacian của đồ thị như là một chỉ mục đối với cơ sở dữ liệu đồ thị. . đẳng cấu đồ thị hoặc đồ thị con, cơ sở dữ liệu của đồ thị được chuyển đổi thành một cây quyết định. Cây quyết định sau đó được sử dụng trực tiếp dùng để chỉ mục và so khớp đồ thị mẫu với đồ thị

Tiểu luận môn cơ sở dữ liệu nâng cao Đẳng cấu đồ thị con với thời gian đa thức

Thông tin tài liệu

Từ khóa liên quan

Mục lục

I. 4. Đẳng cấu đồ thị con bằng thuật toán cây quyết định.

8. Tối ưu quyết định cho các ứng dụng thực tế.

Trích đoạn

Tài liệu cùng người dùng

Tài liệu liên quan