- 题名/责任者:
- 面向大数据的高效能垃圾文本分类/刘伍颖著
- 出版发行项:
- 北京:国防工业出版社,2014.10
- ISBN及定价:
- 978-7-118-09759-7/CNY28.00
- 载体形态项:
- 160页:图;21cm
- 个人责任者:
- 刘伍颖, 1980- 著
- 学科主题:
- 数据处理
- 中图法分类号:
- TP274
- 中图法分类号:
- TP274
- 书目附注:
- 有书目 (第151-160页)
- 提要文摘附注:
- 本书全面客观地分析了大数据时代垃圾信息的爆发态势和文本特性,并根据信息文档的多域结构特性和文本Token频率分布的幂律特性,提出了多域学习的思想,研究了一整套面向大数据的高效能垃圾文本分类方法。本书共分7章:第1章分析大数据时代垃圾信息态势;第2章概述垃圾信息过滤方法;第3章研究电子邮件文档和手机短信文档的文本特性;第4章研究多域学习总体框架;第5章提出基于Token频率索引的文本分类算法;第6章研究有监督反馈代价问题;第7章设计面向大数据的高效能垃圾文本过滤系统。本书研究的内容新颖前沿,提出的方法普适实用,设计的数据结构、算法时空高效、应用性强。本书可以作为普通高等院校、科研机构大数据计算技术相关专业高年级本科生或研究生的实验教材,也可以作为网络信息技术公司高级研究人员的参考书。
- 使用对象附注:
- 本书可作为普通高等院校、科研机构大数据计算技术相关专业高年级本科生或研究生的实验教材,也可供网络信息技术公司高级研究人员参考。
全部MARC细节信息>>



