Phân tách cụm danh từ cơ sở tiếng Việt sử dụng mô hình CRFs

Title: Phân tách cụm danh từ cơ sở tiếng Việt sử dụng mô hình CRFs
Authors: Nguyễn, Thị Hương Thảo
Keywords: Công nghệ thông tin;Mô hình CRFs;Cụm danh từ tiếng Việt;Hệ thống thông tin
Issue Date: 2010
Publisher: Đại học Quốc gia Hà Nội
Citation: 6 tr.
URI: http://repository.vnu.edu.vn/handle/VNU_123/7798
Khái quát về bài toán phân tách cụm danh từ và các nghiên cứu trước đó cũng như kết quả đã đạt được về bài toán này. Trình bày một số thuật toán điển hình phân tách cụm danh từ, từ đó chọn ra hướng tiếp cận với ngôn ngữ tiếng Việt. Giới thiệu một số phương pháp biểu diễn dữ liệu. Nghiên cứu về CRFs - mô hình học máy được đánh giá là một trong những phương pháp tốt nhất cho bài toán gán nhãn dữ liệu dạng chuỗi. Tìm hiểu đặc điểm cấu trúc của cụm danh từ tiếng Việt, từ đó đề xuất phương pháp thích hợp xây dựng tập dữ liệu tiếng Việt. Trình bày các kết quả thực nghiệm khi áp dụng mô hình CRFs để phân tách cụm danh từ tiếng Việt với bộ dữ liệu do luận văn xây dựng. Đưa ra một số nhận xét, đánh giá tổng quát về vấn đề cần nghiên cứu.

Nhận xét

Bài đăng phổ biến từ blog này

Nghiên cứu phân lập và định lượng cryptotanshinon từ cây đan sâm (Salvia miltiorrhiza Bunge.) phục vụ công tác đánh giá chất lượng dược liệu đan sâm Cryptotanshinon;Cây đan sâm (Salvia miltiorrhiza Bunge.);Dược học

Ảnh hưởng của môi trường dinh dưỡng đến sự sinh trưởng và sinh tổng hợp Poly (3-Hydroxybutyrate) của chủng vi khuẩn Yangia sp. NĐ199

Một số hợp chất flavonoid phân lập từ lá cây dâu (Morus alba L.) thu hái tại tỉnh Thái Nguyên