NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH MRI VÀ ỨNG DỤNG

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH MRI VÀ ỨNG DỤNG

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH MRI VÀ ỨNG DỤNG

Lý do chọn đề tài

Thông thường trong y học, bác sĩ dựa vào việc phân đoạn ảnh y học để chẩn đoán và đưa ra kế hoạch điều trị. Việc phân đoạn phân hình ảnh tự động thông thường không thể cho ra kết quả với độ chính xác và nhất là khi không có mô hình của các cơ quan cụ thể. Họ thường sử dụng các phương pháp phân đoạn ảnh tương tác thông thường. Các thuật toán tương tác phân đoạn ảnh được dùng để áp dụng phân đoạn cho các ảnh phổ biến hiện nay như ảnh số (ảnh lấy từ camera và sau đó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho các xử lý tiếp theo) và ảnh tiếp nhận từ vệ tinh hay có thể quét từ ảnh chụp bằng máy quét ảnh. Các thuật toán tương tác phân đoạn phổ biến bao gồm các phương pháp Geodesic, Random Walks, và GraphCut thường rất nhạy cảm với số lượng và vị trí tương tác của người dùng và thường không thể tạo ra được một đường ranh giới chính xác với một số lượng nhỏ các tương tác. Đặc biệt, các đường ranh giới tạo ra bởi các thuật toán này thường nham nhở và không bám sát vào đường viền thực tế của vật thể cần tách trong bức ảnh. Một cách để tinh chỉnh đường biên là sử dụng đường viền linh động mô hình Snakes để chỉnh sửa lại đường viền biên ban đầu được tạo ra bởi phương pháp tách ảnh sử dụng thông tin vùng. Tuy nhiên, bước tinh chỉnh dựa trên mô hình Snakes thay đổi làm mịn đường viền một cách cục bộ mà không thể biến đổi cả đường viền để bám vào các đặc điểm hình học hay các gờ (edge) trên bức ảnh và không thể đối phó với sự thay đổi hình dạng topology của đường viền trong quá trình vận động. Qua giới thiệu và tham khảo một số công trình nghiêm cứu mới về việc vận dụng các phương kết nối đường viền linh động Active Contours vào các phương pháp phân đoạn ảnh truyền thống như Geodesic và Random Walks để thực hiện các bài toán tách ảnh tự đông và thường tạo ra các phân khúc được chia quá nhỏ với các hình ảnh phức tạp thì thấy cho kết quả rất khả quan như tăng độ chính xác trong phân khúc ảnh, tạo ra đường ranh giới mượt hơn và bám sát vào đường viền thực tế của vật thể. Kết quả trong bài báo “Robust interactive image segmentation using convex active contours “ của nhóm tác giả đã nói lên được những điều trên. Mặc khác, theo khảo sát ban đầu của tôi trên các bức ảnh MRI và đặc biệt là ảnh MRI của tiền liệt tuyến, vùng tiền liệt tuyến cần phân đoạn thường có đường viền biên nhẵn, mịn. Tôi nhận thấy điều này rất thích hợp khi sử dụng phương pháp đường viền cố định để phân đoạn các ảnh MRI của tiền liệt tuyến. Do đó, đề tài tôi sẽ nghiên cứu lại phương pháp đường viền linh động có sử dụng thuật toán sử dụng đường viền linh động Active Contour để áp dựng thực hiện phân đoạn cho ảnh MRI tiền liệt tuyến. Với hi vọng kết quả mang lại có thể đóng góp được một phần nào đó áp dụng trong thực tiễn.

Mục tiêu nghiên cứu

  • Nghiên cứu tìm hiểu về ảnh y học và cụ thể là ảnh MRI Tiền Liệt Tuyến
  • Nghiên cứu tìm hiểu về các kỹ thuật phân đoạn ảnh và chi tiết là kỹ thuật phân đoạn ảnh sử dụng đường viền linh động lồi.
  • Xây dựng một phương pháp phân đoạn ảnh bán tự động sử dụng kỹ thuật mô hình đường viền linh động hàm lồi trên miền liên tục nhằm phân đoạn ảnh y học MRI để ứng dụng trong y học.

Đối tượng và phạm vi nghiên cứu

  • Đối tượng nghiên cứu: ảnh y học MRI và các kỹ thuật phân đoạn ảnh.
  • Phạm vi nghiên cứu: ứng dụng kỹ thuật phân đoạn ảnh dựa trên đường viên linh động lồi vào trong ảnh MRI Tiền Liệt Tuyến.

Phương pháp nghiên cứu

  • Thu thập, phân tích các tài liệu và thông tin liên quan đến đề tài.
  • Tìm hiểu và nghiên cứu cơ bản về ảnh y học MRI và đặc biệt là các dữ liệu hình ảnh MRI tiền tiệt tuyến thông qua nguồn dữ liệu trên là nguồn dữ liệu mở của tổ chức NA-MIC
  • Tìm hiểu và nghiên cứu cơ bản về các kỹ thuật phân đoạn ảnh.
  • Đề xuất, ứng dựng phương pháp đoạn ảnh sử dụng đường viền linh động áp dụng trên ảnh y học MRI tiền liệt tuyến. Sử dụng phần mềm chuyên dụng Matlab để mô phỏng, so sánh và đánh giá kết quả thực hiện được.

Bố cục của luận văn

Ngoài phần mở đầu, kết luận và tài liệu tham khảo, kết cấu luận văn gồm 3 chương như sau:

CHƯƠNG 1 TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ

CHƯƠNG 2 CÁC KỸ THUẬT PHÂN ĐOẠN ẢNH VÀ KỸ PHÂN ĐOẠN ẢNH SỬ DỤNG ĐƯỜNG VIỀN LINH ĐỘNG

CHƯƠNG 3 XÂY DỰNG ỨNG DỤNG PHÂN ĐOẠN ẢNH MRI TIỀN LIỆT TUYẾN

CHƯƠNG 1

TỔNG QUAN VỀ XỬ LÝ ẢNH

    1. Giới thiệu về xử lý ảnh số và ảnh y học
      1. Giới thiệu về xử lý ảnh

Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận.

Hình 1.1. Quá trình xử lý ảnh

Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta sẽ xem xét các bước cần thiết trong xử lý ảnh.

      1. Một số khái niệm cơ bản
        1. Điểm ảnh – Pixel

Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính cần phải tiến hành số hoá ảnh. Trong quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần giá trị mà về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này người ta sử dụng khái niệm Picture element mà ta quen gọi là Pixel – phần tử ảnh. Như vậy, một ảnh là một tập hợp các Pixel.

        1. Mức xám – Gray level

Mức xám là kết quả của sự mã hóa tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị sáng, kết quả của quá trình lượng tử hóa.

        1. Biên

Biên là một đặc tính rất của đối tượng trong ảnh, nhờ vào biên mà chúng ta phân biệt được đối tượng này với đối tượng kia. Một điểm ảnh có thể gọi là điểm biên nếu ở đó có sự thay đổi đột ngột về mức xám. Tập hợp các điểm biên gọi là biên hay còn gọi là đường bao ảnh.

        1. Láng giềng
        2. Vùng liên thông
        3. Biểu diễn ảnh
        4. Tăng cường và khôi phục ảnh
        5. Biến đổi ảnh
        6. Phân tích ảnh
        7. Nhận dạng ảnh
        8. Nén ảnh
      1. Xử lý ảnh y học
        1. Giới thiệu về xử lý ảnh y học

Các thực thể tạo ảnh y học (medical imaging modallity) khác nhau cung cấp các thông tin đặc tính riêng biệt về các cơ quan bên trong hay của các tổ chức mô của cơ thể. Độ tương phản và độ nhìn thấy của ảnh y học phụ thuộc vào thực thể tạo ảnh, hàm đáp ứng cũng như phụ thuộc vào các vùng bệnh lý của bệnh nhân.

        1. Một số hình ảnh y học

Hình ảnh X-quang

Hình ảnh siêu âm (Ultrasound)

Hình ảnh chụp cắt lớp (CT- scanner)

Hình ảnh chụp cộng hưởng từ (MRI)

Chụp cộng hưởng từ hay còn gọi là chụp MRI (Magnetic Resonnace Imaging) là phương pháp là một kỹ thuật chuẩn đoán y học tạo ra hình ảnh giải phẫu của cơ thể nhờ sử dụng từ trường và sóng radio (không sử dụng tia X), thực hiện bằng cách đưa cơ thể vào vùng từ trường mạnh để đồng hóa chiều chuyển động của các nguyên tử Hydro trong các phân tử nước của cơ thể và một ăng ten thu phát sóng radio tần số thấp (tần số radio này được thay đổi trong vùng từ trường ổn định của nam châm chính tùy theo mục đích khảo sát của sự phân biệt mỡ, nước, vv..) được sử dụng để gửi tín hiệu đến cơ thể gặp các nguyên tử Hydro của cơ thể sau đó nhận lại tín hiệu về chiều chuyển động của các nguyên tử này, tín hiệu của ăng ten được truyền về trung tâm máy tính xử lý tín hiệu số sau đó các tín hiệu được truyền về máy tính điều khiển và các hình ảnh cấu trúc cơ thể được mô phỏng tại đây. Hình ảnh MRI cho phép tiếp cận trực quan đến nhiều cấu trúc phức tạp trong cơ thể để đánh giá các chức năng hoạt động của chúng mà không cần xâm nhập. MRI là phương pháp tốt nhất để phát hiện sớm và đánh giá tình trạng các khối u. Các mô mềm như tim, gan, thận, phổi,.. cũng được chụp và tạo ảnh 3D với khoảng cách điểm ảnh 1mm để dễ dàng phát hiện các tổn thương nhỏ nhất và rõ nhất mà các phương pháp chẩn đoán hình ảnh khác không có được.

Não úng thuỷ 2

Hình 1.14. Hình MRI của não bình thường và não úng thủy

        1. Các chuẩn ảnh y học và truyền thông ảnh y học

Chuẩn DICOM

Chuẩn PACS

    1. Các kỹ thuật tiền xử lý ảnh
      1. Giới thiệu về tiền xử lý ảnh
      2. Một số kỹ thuật tiền xử lý ảnh
        1. Toán tử điểm
        2. Các toán tử không gian
    2. Kết luận chương

Trong chương một đã giới thiệu tổng quan về hệ thống xử lý ảnh, giới thiệu về xử lý ảnh y tế, cũng như trình bày tổng quát các kỹ thuật tiền xử lý ảnh cũng như các kỹ thuật phân đoạn ảnh.

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH MRI VÀ ỨNG DỤNG
NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH MRI VÀ ỨNG DỤNG

CHƯƠNG 2

CÁC KỸ THUẬT PHÂN ĐOẠN ẢNH VÀ KỸ THUẬT PHÂN ĐOẠN ẢNH SỬ DỤNG ĐƯỜNG VIỀN LINH ĐỘNG

    1. Kỹ thuật phân đoạn ảnh
      1. Khái niệm về phân đoạn ảnh

Phân đoạn ảnh là một trong những bước quan trọng nhất trong xử lý ảnh số. Có thể hiểu phân đoạn ảnh là tiến trình chia ảnh thành nhiều vùng, mỗi vùng chứa một đối tượng hoặc một nhóm đối tượng cùng kiểu.

      1. Một số kỹ thuật phân đoạn ảnh cơ bản
        1. Phân đoạn ảnh theo ngưỡng
        2. Phân đoạn dựa theo đường biên
        3. Phân đoạn theo miền đồng nhất
    1. Các phương pháp phân đoạn ảnh sử dụng thông tin vùng

Trong các phương pháp phân đoạn, tách ảnh sử dụng thông tin về vùng, người sử dụng thường được yêu cầu vẽ hai loại stroke (nét vẽ) vào trong bức ảnh để gán nhãn một số pixel là thuộc foreground (đối tượng) hay thuộc background (phông nền). Sau đó, thuật toán tách ảnh sẽ hoàn thành việc gán nhãn cho những pixel còn lại của bức ảnh.

Một phương pháp tách ảnh sử dụng thông tin vùng nổi tiếng là:

Thuật toán Graph Cut mô tả giá trị các pixel foreground và background dựa trên histogram được lấy mẫu từ các hạt giống foreground và background. Sự phù hợp của mỗi giá trị pixel đối với mô hình foreground và background được phản ảnh lên độ lớn của liên kết đầu mối kết nối mỗi pixel với đầu mối foreground và background.

Ngoài ra, nhiều loại tương tác với người sử dụng được giới thiệu trong Grabcut bao gồm một khung bao quanh đối tượng foreground, một công cụ lasso cho các ảnh khó tách, các nét vẽ foreground và background để chỉnh sửa cục bộ và một chổi biên cho thảm biên giới. Phương pháp Grabcut có thể thực hiện tốt việc tách ảnh cho các bức ảnh mà màu của foreground và background tách bạch rõ ràng nhưng hiệu quả của nó thường không đạt yêu cầu nếu foreground và background có chung sự phân bố màu (color distribution). Một vấn đề chung của các phương pháp dựa trên thuật toán graph-cut là lỗi “small cut”. Vì graph-cut tìm cách hạn chế tối thiểu tổng trọng lực (weight) dọc theo đường cắt, nó có thể tạo ra những phân khúc rất nhỏ trong trường hợp có ít các pixel hạt giống và có đường biên mờ.

Thuật toán random walks yêu cầu đầu vào là các pixel hạt giống foreground và background. Phương pháp này cũng mô hình hóa một bức ảnh như là một đồ thị (graph). Với mỗi pixel chưa được gán nhãn, nó lần lượt tính xác suất một người đi bộ ngẫu nhiên dọc theo các cạnh của đồ thị bắt đầu từ pixel đó sẽ trước tiên đi tới một trong những pixel đã được gán nhãn nào đó. Thuật toán sẽ gán mác có xác suất lớn nhất cho mỗi pixel. Thuật toán random walks hoạt động tốt hơn trong trường hợp bức ảnh có các biên mờ và không bị lỗi “small cut” như trong graph-cut. Tuy nhiên, thuật toán random walks là một phương pháp nhằm hạn chế tối thiểu năng lượng Dirichlet với các điều kiện biên. Trong đó, các điều kiện biên khác nhau (các pixel hạt giống khác nhau) sẽ luôn cho các hàm điều hòa khác nhau, do đó nó rất nhạy cảm với vị trí và số lượng hạt giống foreground và background.

Thuật toán Geodesic dựa trên việc tính khoảng cách geodesic có trọng từ mỗi pixel đến các hạt giống foreground và background cho tương tác tách ảnh và video. Thuật toán Geodesic mở rộng cơ cấu geodesic bằng cách tăng tốc độ xử lý và nới lỏng các yêu cầu kết nối, nghĩa là mỗi phân khúc được tách ra phải được nối với các nét vẽ tương ứng của người dùng.

Ưu thế của các thuật toán geodesic là chúng nhanh hơn rất nhiều các thuật toán graph-cut và random walks. Mặc dù các thuật toán geodesic không bị lỗi “small cut” như graph-cut nhưng hiệu suất của nó phụ thuộc nhiều vào độ tách biệt đủ lớn giữa phân bố màu của foreground và background. Nhược điểm lớn của các thuật toán Geodesic là chúng rất nhạy cảm với vị trí của hạt giống vì các vị trí của hạt giống khác nhau sẽ dẫn đến khoảng cách geodesic khác nhau cho mỗi pixel.

    1. Các mô hình đường viền linh động và mô hình đường viền linh động lồi với lời giải SPLIT BREGMAN

Đường viền linh động Snake là một trong những mô hình đường viền linh động đầu tiên được đề xuất. Các tác giá đề xuất sử dụng mô hình Snake để tinh chỉnh đường viền biên ban đầu được tạo ra bởi phương pháp tách ảnh sử dụng thông tin vùng. Tuy nhiên, như đã đề cập trước đó, việc tinh chỉnh dựa vào Snake chỉ có thể thay đổi làm mịn đường viền một cách cục bộ chứ không thể luân chuyển toàn bộ đường viền để bám vào các đặc điểm hình học và các gờ (edge) của bức ảnh và không có khả năng đối phó với sự thay đổi topology của đường viền trong quá trình vận động.

Đường viền linh động geodesic (GAC) là một phiên bản cải tiến của mô hình Snake. Mô hình GAC cho phép các thay đổi topology và sự phát hiện biên một cách ổn định khi có sự biến đổi lớn của gradient bao gồm cả sự xuất hiện của các khoảng trống.

      1. Mô hình đường viền linh động lồi

Mô hình đường viền linh động lồi nhằm tìm ra các lời giải minimum toàn cục, kết hợp mô hình GAC và mô hình CVACWE nhằm khai thác một cách hiệu quả cả thông tin biên và thông tin vùng.

Mô hình đường viền linh động lồi được được biểu diễn

(2.1)

với các định nghĩa ký hiệu sau:

  • Hàm u là một hàm trong miền bức ảnh Ω, nhận các giá trị giữa 0 và 1 ở mỗi vị trípixel x trong bức ảnh. Các vùng phân khúc đạt được bằng cách so sánh hàm u với ngưỡng.
  • Hàm gb là một hàm biên và thường là một hàm phát hiện gờ như sau:

(2.2)

trong đó I(x) là độ sáng của pixel x.

  • Hàm hr là một hàm vùng chỉ độ phù hợp với các vùng bên trong và bên ngoài của đường cắt. Cụ thể là với và lần lượt là các hàm vùng bên trong và bên ngoài. Chúng thường được định nghĩa như sau:

với và lần lượt là độ sáng trung bình của vùng bên trong Cin và vùng bên ngoài Cout.

Về cơ bản biểu thức (2.1) chứa hai thành phần được cân bằng bởi một hệ số λ, với thành phần đầu tiên là thành phần biên và thành phần thứ hai là thành phần vùng.

Một khi bài toán tối ưu hóa của biểu thức (2.1) được giải, vùng được tách ra được xác định bằng cách so sánh hàm u với ngưỡng, nghĩa là:

Cin = {x|u(x) > T}; Cout = Ω\Cin (2.3)

thông thường T = 0.5.

Bài toán tách ảnh tự động dựa trên mô hình đường viền linh động lồi trong (2.1) thường được giải bằng một phương pháp lặp luân phiên như sau:

1. Cố định vùng phân khúc, tức là cố định CinCout, và cập nhật hr .

2. Cố định hr để tìm lời giải u cho (2.1).

3. Cật nhật CinCout theo (2.3).

Ba bước trên được lặp lại cho đến khi hội tụ. Ta có thể thấy rằng phần chiếm nhiều thời gian tính toán nhất của phương pháp lặp này chính là bước 2 – giải bài toán tối ưu (2.1).

      1. Lời giải SPLIT BREGMAN

Cụ thể, thay vì giải bài toán (2.1) một cách trực tiếp, Bregman giới thiệu một hàm vector mới vào trong mô hình trên như sau:

(2.4)

với điều kiện ràng buộc . Ràng buộc này được cưỡng chế sử dụng phương pháp lặp Bregman có hiệu suất cao như sau:

(2.5)

(2.6)

với k ≥ 0 là chỉ số lặp. Các tính toán trong biểu thức (2.5) và (2.6) được lặp đi lặp lại cho đến khi hội tụ.

Vì (2.5) là khả vi, nó có thể được giải sử dụng một phương pháp lặp luân phiên. Cụ thể là mỗi vế được lấy vi phân đối với u sử dụng phương trình vi phân Euler-Lagrange và được kết quả là điều kiên tối ưu cho u như sau:

(2.7)

với ∆u là hàm Laplacian của udiv(dk − bk ) là divergence của (dk − bk). Dựa trên (2.7), uk+1 có thể được tính xấp xỉ bằng phương pháp lặp Gauss-Seidel. Sau đó (2.5) được giải với lời giải tối ưu cho dk+1đượctính bởi cách so sánh với ngưỡng mềm như sau:

    1. Kết luận chương

Chương 2 đã giới thiệu cơ bản về kỹ thuật phân đoạn ảnh trong xử lý ảnh. Một số các phương pháp phân đoạn ảnh sử dụng thông tin vùng hiện nay đang được sử dụng, trình bày các ưu nhược điểm của các phương pháp này, đồng thời trình bày chi tiết mô hình đường viền linh động lồi và thuật toán Split Bregman để giải mô hình.

CHƯƠNG 3

XÂY DỰNG ỨNG DỤNG PHÂN ĐOẠN ẢNH MRI

TIỀN LIỆT TUYẾN

    1. Ảnh MRI tiền liệt tuyến
      1. Tiền liệt tuyến

Tiền liệt tuyến là một cơ quan nằm ở bụng dưới hay cổ bàng quang. Là tuyến bao quanh đoạn đầu của niệu đạo. Niệu đạo dẫn nước tiểu từ bàng quang ra đến đầu dương vật. Một chức năng của tiền liệt tuyến là giúp kiểm soát nước tiểu bằng cách tạo áp lực trực tiếp đối với phần niệu đạo mà tiền liệt tuyến bao quanh.

      1. Ảnh MRI tiền liệt tuyến

Ảnh MRI cung cấp tương phản mô mềm tốt hơn khi sử dụng T2-weighted, do đó việc giải phẫu tuyến tiền liệt và khối u có thể được hình dung tốt hơn. Việc phân định tuyến tiền liệt dễ dàng hơn từ hình ảnh MRI, kết quả là vùng chẩn đoán khoanh vùng nhỏ hơn và giảm được phương sai trong quan sát.

    1. Tổng quan về hệ thống thực hiện phân đoạn ảnh MRI tiền liệt tuyến

Công cụ toán học chủ chốt của phương pháp được đề xuất là mô hình đường viền linh động hàm lồi trên miền liên tục . Mô hình này sử dụng cả các thông tin về biên và thông tin về vùng để tìm lời giải tối ưu.

Trong đề tài này, tôi đề xuất kết hợp phương pháp đường viền linh động hàm lồi trên miền liên tục với một trong các phương pháp tách ảnh sử dụng thông tin vùng thông dụng, cụ thể là phương pháp Geodesic Star Convexity. Trong sự kết hợp này, phương pháp tách ảnh sử dụng thông tin vùng được sử dụng trong bước đầu tiên để tạo ra đường viền cắt khởi điểm. Đường viền linh động hàm lồi được sử dụng ở bước thứ hai để tối ưu hóa đường viền cắt.

Thêm vào đó, vì tốc độ hội tụ khi giải các mô hình đường viền linh động hàm lồi nhìn chung là chậm, chúng tôi sử dụng phương pháp Split Bregman nhằm giải mô hình đường viền linh động hàm lồi được đề xuất với tốc độ nhanh.

Ảnh Đầu Vào

Khởi tạo đường viền

Tính toán hàm thành phần vùng của mô hình đường viền linh động

Tính toán hàm thành phần biên của mô hình đường viền linh động

Giải quyết phương pháp đường viền linh động bằng các hàm thành phần vùng và thành phần biên để thu được một hoặc nhiều đường viền chính xác

Ảnh đầu vào được phân đoạn với sự phân đoạn được chỉ định bởi các đường viền chính xác.

Hình 3.1. Sơ đồ khối hệ thống chương trình

    1. Khởi tạo đường viền cắt

Với bất kỳ mô hình đường viền linh động nào, đường viền cần phải được khởi tạo trước khi quá trình vận động đường viền bắt đầu. Ở đây, sử dụng kết quả tách ảnh của phương pháp Geodesic Star Convexity để khởi tạo đường viền. Trong phương pháp này người sử dụng thường được yêu cầu vẽ hai loại stroke (nét vẽ) vào trong bức ảnh để gán nhãn một số pixel là thuộc foreground (đối tượng) hay thuộc background (phông nền).

    1. Mô hình đường viền linh động

Sau khi có kết quả đường viền khởi tạo ban đầu thì đường viền linh động hàm lồi được sử dụng ở bước thứ hai để tối ưu hóa đường viền cắt. Mô hình đường viền linh động hàm lồi có hai thành phần: Thành phần vùng và thành phần biên.

      1. Thành phần vùng

Thành phần vùng nhằm đảm bảo rằng đường cắt thỏa mãn các tiêu chuẩn về sự gắn kết trong từng vùng được định nghĩa bởi hàm hr . Cụ thể là với và lần lượt là các hàm vùng bên trong và bên ngoài của đường cắt.

Áp dụng phương pháp Split Bregman để giải bài toán với một hr cho trước. Ta sử dụng phương pháp lặp luân phiên như sau để giải bài toán:

  1. Cố định u và cập nhật µin, µout, , theo công thức sau

, ,

, .

  1. Cố định ,và cập nhật u với việc lặp đi lặp lại các biểu thức dưới đây cho đến khi hội tụ

trong đó , k ≥ 0 là chỉ số lặp.

Sau khi bài toán tối ưu hóa của biểu thức của mô hình đường viền linh động lồi thì vùng được tách ra được xác định bằng cách so sánh hàm u với ngưỡng, nghĩa là

      1. Thành phần biên

Thành phần biên trong phương trình mô hình đường viền linh động lồi là total variation có trọng của hàm u, trong đó tỉ trọng gb đóng một vai trò quan trọng. gb là kết quả của việc áp dụng hàm phát hiện gờ trên bức ảnh gốc

Lưu ý rằng hàm phát hiện gờ trả về các giá trị giữa 0 và 1, và một giá trị nhỏ của gb chỉ ra khả năng có sự xuất hiện của gờ.

    1. Dữ liệu

Các kết quả phân đoạn ảnh tiền liệt tuyến cho các tập dữ liệu lấy từ “Prostate Segmentation Challenge Training Data- MICCAI09”. Sử dụng các ảnh T2w trong hai tập dữ liệu ảnh MRI.

Phương pháp được thực hiện trên máy tính cá nhân và được cài đặt phần mềm Matlab để thực thi mô phỏng.

Tham số λ được gán giá trị bằng 1000

Tham số T được gán giá trị bằng 0.5

Tham số μ được thiết lập bằng 10000

Tất cả các giá trị thông số λ, T và μ được thiết lập cố định cho tất cả các thí nghiệm.

    1. Kết quả thí nghiệm

Kết quả phân đoạn tiền liệt tuyến theo phương pháp đề xuất

(a) Đầu vào người sử dụng (b) Đường viền khởi tạo

(c) Kết quả phân đoạn

Hình 3.5. Kết quả người sử dụng thứ nhất

(a) Đầu vào người sử dụng 2 (b) Đường viền khởi tạo

(c) Kết quả phân đoạn

Hình 3.6. Kết quả của người sử dụng thứ hai.

Nhận xét

Hình 3.5 và hình 3.6 minh họa kết quả khởi tạo và kết quả phân đoạn tiền liệt tuyến đối với slice thứ 14 của bệnh nhân thứ nhất. Ta có thể nhận thấy so với kết quả khởi tạo thì ở kết quả cuối cùng, đường viền của tiền liệt tuyến đã được làm mịn hơn nhiều. Tuy nhiên, ta cũng thấy rằng đối với các nét vẽ đầu vào foreground và background khác nhau thì kết quả khởi tạo và phân đoạn khác nhau. Đây chính là hạn chế của phương pháp được đề xuất

Để đạt được kết quả mong muốn người sử dụng có thể thực hiện chỉnh sửa bằng cách vẽ thêm các nét vẽ là foreground hoặc background. Hình 3.6 cho thấy đường viền tiền liệt tuyến còn một số vùng chưa bám sát vào gờ hình học của đối tượng. Để cải thiện chất lượng, người dùng chỉ cần thêm các stroke vào những vùng bị lỗi để cải thiện kết quả phân đoạn ảnh ở những vùng này, hay nói cách khác là chỉnh sửa kết quả phân đoạn ảnh 1 cách cục bộ. Sau khi chỉnh sửa ta thấy rằng kết quả phân đoạn hình 3.7 (b) đã được cải thiện, một số vùng chưa bám sát vào gờ hình học của đối tượng nay đã bám sát hơn.

  1. Thêm các nét vẽ

(b) Kết quả phân đoạn sau khi thêm các nét vẽ

Hình 3.7. Kết quả phân đoạn sau khi chỉnh sửa kết quả của người sử dụng thứ 2

So sánh kết quả phân đoạn tiền liệt tuyến theo phương pháp đề xuất với kết quả phân đoạn của các chuyên gia

Ngoài việc đánh giá kết quả phân đoạn bằng thị giác, để chính xác hơn thì ta thực hiện đánh giá kết quả phân đoạn một cách định lượng. Để đánh giá thí nghiệm một cách trực quan hơn thì thực hiện tính độ trùng lặp giữa vùng tiền liệt tuyến được phân đoạn bởi chuyên gia và vùng tiền liệt tuyến được phân đoạn bởi phương pháp được đề xuất. Tôi sử dụng công thức Dice Measure – DSC để tính toán độ chính xác của việc phân đoạn. Công thức DSC được định nghĩa như sau

Trong đó A là kết quả phân đoạn, B là vùng phân đoạn được cung cấp bởi một chuyên gia chuẩn đoán hình ảnh, và |.| là số lượng các pixel đã được phân đoạn. Khi DSC = 1 có nghĩa là kết quả trùng khớp hoàn toàn và DSC = 0 thì ngược lại. Nếu DSC càng gần bằng 1 thì kết quả phân đoạn càng chính xác và ngược lại DSC càng gần bằng 0 thì kết quả phân đoạn thất bại.

Bảng 3.1 thể hiện kết quả tính toán độ trùng lặp giữa kết quả phân đoạn của chuyên gia và kết quả phân đoạn của phương pháp được đề xuất đối với các slice của bệnh nhân thứ nhất và bệnh nhân thứ hai

Bảng 3.1. Đánh giá định lượng của kết quả phân đoạn ảnh

Bệnh nhân 1SliceDSC
Slice thứ 140.9532
Slice thứ 150.8906
Slice thứ 160.9564
Slice thứ 170.9372
Slice thứ 180.9695
Slice thứ 190.9167
Slice thứ 200.9011
Slice thứ 210.9475
Bệnh nhân 2SliceDSC
Slice thứ 140.8871
Slice thứ 150.9356
Slice thứ 160.9571
Slice thứ 170.9481
Slice thứ 180.9389
Slice thứ 190.9398
Slice thứ 200.9553
Slice thứ 210.7055

Nhận xét

Ta thấy rằng tỉ lệ trùng lặp đối với các slice khá đồng đều, áp dụng công thức DSC vào kết quả chương trình của tôi thì độ trùng lặp trung bình đạt kết quả là 0.92122. Với độ trùng lặp cao nhất và thấp nhất trong bảng 3.1 là 0.9695 và 0.7055.

Bên dưới là kết quả tính độ trùng lặp giữa vùng tiền liệt tuyến được phân đoạn bởi chuyên gia và vùng tiền liệt tuyến được phân đoạn bởi phương pháp được đề xuất

Bệnh nhân 1Slice 15Slice 19
Ảnh gốcD:\Study\luan van chinh thuc\gsc-1.2\ket qua\need-segment-RGB-bn12\0015-bn1.pngD:\Study\luan van chinh thuc\gsc-1.2\ket qua\need-segment-RGB-bn12\0018-bn1.png
Kết quả phân đoạn bởi chuyên giaD:\Study\luan van chinh thuc\gsc-1.2\ket qua\seg-expert-BW-bn12\0015-BW-exp-bn1.pngD:\Study\luan van chinh thuc\gsc-1.2\ket qua\seg-expert-BW-bn12\0018-BW-exp-bn1.png
Kết quả phân đoạn bằng phương pháp đề xuấtD:\Study\luan van chinh thuc\gsc-1.2\ket qua\segbw\0015-bn1-seg.pngD:\Study\luan van chinh thuc\gsc-1.2\ket qua\segbw\0018-bn1-seg.png
Kết quả so sánh độ trùng lặp của 2 ảnh

Hình 3.8. So sánh kết quả phân đoạn ảnh tiền liệt tuyến giữa chuyên gia và kết quả phân đoạn của chương trình đề xuất ở bệnh nhân thứ nhất ( slice thứ 15 và slice thứ 19)

Bệnh nhân 2Slice thứ 16Slice thứ 21
Ảnh gốcD:\Study\luan van chinh thuc\gsc-1.2\ket qua\need-segment-RGB-bn12\0021-bn2.png
Kết quả phân đoạn bởi chuyên giaD:\Study\luan van chinh thuc\gsc-1.2\ket qua\seg-expert-BW-bn12\0016-BW-exp-bn2.pngD:\Study\luan van chinh thuc\gsc-1.2\ket qua\seg-expert-BW-bn12\0021-BW-exp-bn2.png
Kết quả phân đoạn bằng phương pháp đề xuấtD:\Study\luan van chinh thuc\gsc-1.2\ket qua\segbw\0016-bn2-seg.pngD:\Study\luan van chinh thuc\gsc-1.2\ket qua\segbw\0021-bn2-seg.png
Kết quả so sánh độ trùng lặp của 2 ảnh

Hình 3.9. So sánh kết quả phân đoạn ảnh tiền liệt tuyến giữa chuyên gia và kết quả phân đoạn được đề xuất ở bệnh nhân thứ nhất (slice thứ 16 và slice thứ 21)

Hình 3.8 và hình 3.9 thể hiện sự so sánh giữa kết quả phân đoạn ảnh tiền liệt tuyến của chuyên gia và kết quả phân đoạn được đề xuất. Nhìn chung kết quả phân đoạn được đề xuất gần đúng với kết quả phân đoạn bằng tay của chuyên gia.

Cụ thể, ví dụ hình 3.8 mô tả độ trùng lặp giữa kết quả phân đoạn ảnh 2 slice của bệnh nhân thứ nhất. Ta có thể thấy rằng ở slice thứ 15, kết quả phân đoạn của chuyên gia và kết quả phân đoạn của phương pháp được đề xuất có độ trùng lặp thấp, theo kết quả tính toán độ trùng lặp DSC= 0.8906 cho thấy kết quả phân đoạn của slice thứ 15 có độ chính xác không trùng khớp với kết quả của chuyên gia. Đối với slice thứ 19 ta thấy kết quả phân đoạn của slice này so với kết quả của chuyên gia có độ trùng lặp khá cao với DSC=0.9695 so với kết quả của slice thứ 19 thì kết quả của slice thứ 19 có độ trùng lặp cao hơn.

Ví dụ hình 3.9 cũng thể hiện sự so sánh kết quả phân đoạn của chuyên gia với kết quả của phương pháp được đề xuất đối với bệnh nhân thứ 2. Về mặt thị giác, ta có thể nhận thấy kết quả phân đoạn của slice thứ 16 có độ chính xác cao hơn rất nhiều so với kết quả phân đoạn của slice thứ 21 khi thực hiện so sánh với kết quả phân đoạn của chuyên gia. Tính toán độ trùng lặp giữa kết quả giữa chuyên gia và kết quả của phương pháp được đề xuất đối với slice thứ 16 có DSC= 0.9571, còn đối với slice thứ 21 có DSC= 0.7055. Nguyên nhân là do ở slice thứ 21, kích thước của tiền liệt tuyến nhỏ và khó phân biệt với các mô ở xung quanh.

Tuy nhiên độ chính xác của kết quả phân đoạn của các slice sẽ giảm dần đi ở slice ở gần chóp của tiền liệt tuyến, bởi vì kích thước của vùng tiền liệt tuyến nhỏ đi, và thiếu sự rõ ràng của vùng biên giữa phần tiền liệt tuyến với vùng xung quanh, gây khó khăn hơn cho việc phân đoạn. Do đó, người sử dụng (chẳng hạn như các bác sĩ chuẩn đoán hình ảnh) phải cẩn thận hơn trong việc xác định các hạt giống (seeds) cho phần foreground và background.

So sánh giá trị độ trùng lặp trung bình DSC của phương pháp phân đoạn ảnh tiền liệt tuyến trong bài báo tham khảo có trị DSC trung bình bằng 0.61 và 0.87, ta có thể thấy DSC trung bình theo phương pháp được đề xuất có DSC trung bình 0.92985 được cải thiện đáng kể so với 2 phương pháp tham khảo. Hơn nữa tốc độ hội tụ của phương pháp đường viền linh động của chúng tôi rất nhanh, mất ít hơn nửa giây để tối ưu hóa kết quả cắt tách một slice với độ phân giải 256×256.

KẾT LUẬN

Luận văn đã đưa ra phương pháp phân đoạn ảnh tiền liệt tuyến đường viền linh động tương tác mới. Phương pháp nhằm mục đích cung cấp một giải pháp mới để có thể tạo ra hệ thống mới hữu ích trong việc tái cấu trúc lại đường viền từ đường viền khởi tạo trên ảnh MRI đầu vào. Tổng quát hơn, phương pháp đề xuất việc sử dụng một mô hình đường viền linh động cho việc phân đoạn ảnh tương tác bằng việc sử dụng dữ liệu đầu vào từ người dùng. Mặc khác phương pháp đề xuất của luận được tối ưu về tốc độ xử lý phân đoạn bằng việc kết hợp với phương pháp Split Bregman. Mô hình đường viền linh động được đề xuất này có thể được tối ưu tự động một đường viền khởi tạo, nó cũng có thể hỗ trợ cho việc thêm vào các dữ liệu của người sử dụng để cải tiến đường viền. Điều này đặc biệt quan trọng trong trường hợp đường viền khởi tạo thiếu chính xác. Các mô hình đường viền linh động được biết đến trước đó như kỹ thuật phân đoạn tự động nhưng chưa áp dụng thành công trong việc phân đoạn ảnh tương tác.

Tuy nhiên để đạt được kết quả tách ảnh như mong muốn, người sử dụng phải thực hiện chỉnh sửa bằng cách vẽ thêm các nét vẽ là foreground hoặc background. Vì vậy phương pháp đề xuất vẫn còn hạn chế bởi nếu kết quả khởi tạo không tốt sẽ ảnh hưởng đến kết quả phân đoạn cuối cùng.

Mặc khác, trong phương pháp tách ảnh được đề xuất, có một số thông số tự do mà tôi lựa chọn giá trị dựa trên thực nghiệm bằng cách lần lượt gán cho chúng các giá trị khác nhau và chọn giá trị cho tỉ lệ lỗi trung bình thấp nhất trên tất cả các bức ảnh kiểm thử. Đó là λ trong và µ. Trong tương lai chúng ta có thể phát triển một thuật toán (learning algorithm) để học giá trị của các thông số này dưới sự hướng dẫn (supervised) sử dụng một tập dữ liệu lớn hơn để có thể tách ảnh được tốt và chuẩn xác hơn.

LIỆN HỆ:

SĐT+ZALO: 0935568275

E:\DỮ LIỆU COP CỦA CHỊ YẾN\LUAN VAN DUY TAN\LUAN VAN DUY TAN\TRAN DANG MINH

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *