Phân tách cụm danh từ cơ sở tiếng Việt sử dụng mô hình CRFs

Title: Phân tách cụm danh từ cơ sở tiếng Việt sử dụng mô hình CRFs
Authors: Nguyễn, Thị Hương Thảo
Keywords: Công nghệ thông tin;Mô hình CRFs;Cụm danh từ tiếng Việt;Hệ thống thông tin
Issue Date: 2010
Publisher: Đại học Quốc gia Hà Nội
Citation: 6 tr.
URI: http://repository.vnu.edu.vn/handle/VNU_123/7798
Khái quát về bài toán phân tách cụm danh từ và các nghiên cứu trước đó cũng như kết quả đã đạt được về bài toán này. Trình bày một số thuật toán điển hình phân tách cụm danh từ, từ đó chọn ra hướng tiếp cận với ngôn ngữ tiếng Việt. Giới thiệu một số phương pháp biểu diễn dữ liệu. Nghiên cứu về CRFs - mô hình học máy được đánh giá là một trong những phương pháp tốt nhất cho bài toán gán nhãn dữ liệu dạng chuỗi. Tìm hiểu đặc điểm cấu trúc của cụm danh từ tiếng Việt, từ đó đề xuất phương pháp thích hợp xây dựng tập dữ liệu tiếng Việt. Trình bày các kết quả thực nghiệm khi áp dụng mô hình CRFs để phân tách cụm danh từ tiếng Việt với bộ dữ liệu do luận văn xây dựng. Đưa ra một số nhận xét, đánh giá tổng quát về vấn đề cần nghiên cứu.

Nhận xét

Bài đăng phổ biến từ blog này

Thành lập bản đồ hiện trạng các thành phần của hệ sinh thái thuộc huyện Kim Bôi, tỉnh Hòa Bình phục vụ cho công tác phát triển bền vững

random noise;capacitance signal;DLTS measurement

Quan hệ giữa con người và tự nhiên trong sự phát triển bền vững ở Việt Nam hiện nay