![](/image/logo_hskh_vie.png)
Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
http://thuvienso.dut.udn.vn/handle/DUT/367
Nhan đề: | Phân loại văn bản tin tức dùng máy vec-tơ hỗ trợ | Nhan đề khác: | Classification of news text using support vector machine | Tác giả: | Ngô, Hải Nam | Từ khoá: | Học máy;Phân loại văn bản;Máy học Supprt vector machine (SVM);Khai phá dữ liệu văn bản | Năm xuất bản: | 2019 | Nhà xuất bản: | Trường Đại học Bách khoa - Đại học Đà Nẵng | Tóm tắt: | Luận văn này thực hiện nghiên cứu, đánh giá việc phân loại văn bản tin tức dựa trên phương pháp máy học Support vector machine (SVM) cùng với sự kết hợp giữa biểu diễn văn bản bằng mô hình túi từ BoW (Bag-of-Words) và thuật toán TF-TDF (Term frequency – Inverse document frequency). Một số phương pháp máy học và khai phá dữ liệu văn bản phổ biến được áp dụng để huấn luyện tập dữ liệu cho phân loại văn bản như SVM, Bayes đơn giản (Naïve Bayes), Cây quyết định (Decision tree). Quá trình thực nghiệm phân loại văn bản tin tức với tập dữ liệu hơn 10.000 tin tức trong nhiều chủ đề được tổng hợp từ các nguồn báo chí trên Internet. Tập dữ liệu huấn luyện được trích xuất và tóm gọn trong một số chủ đề chính như: Thế giới, Giáo dục, Sức khỏe, Khoa học-Công nghệ…Kết quả thực nghiệm bước đầu đã khẳng định tính khả thi của mô hình khi kết quả phân loại đạt được độ chính xác khoảng 87%. |
Mô tả: | Luận văn Thạc sĩ Kỹ thuật. Chuyên ngành: Khoa học Máy tính. Mã số: 60.48.01.01; 54 trang |
Định danh: | http://thuvienso.dut.udn.vn/handle/DUT/367 |
Bộ sưu tập: | LV.Khoa học máy tính |
Các tập tin trong tài liệu này:
Tập tin | Mô tả | Kích thước | Định dạng | Đã có tài khoản, vui lòng Đăng nhập |
---|---|---|---|---|
NgoHaiNam.TT.pdf | Tóm tắt | 1.06 MB | Adobe PDF | ![]() |
NgoHaiNam.TV.pdf | Toàn văn | 4.3 MB | Adobe PDF | ![]() |
Các đề xuất từ CORE
Lượt xem 50
6
đã cập nhật vào 07-02-2025
Lượt tải xuống 50
6
đã cập nhật vào 07-02-2025
Google Scholar TM
Kiểm tra...
Khi sử dụng các tài liệu trong Hệ thống quản lý thông tin nghiên cứu phải tuân thủ Luật bản quyền.