机读格式显示(MARC)
- 000 01544nam0 2200265 450
- 010 __ |a 978-7-118-09759-7 |d CNY28.00
- 100 __ |a 20141117d2014 em y0chiy0120 ea
- 200 1_ |a 面向大数据的高效能垃圾文本分类 |A Mian Xiang Da Shu Ju De Gao Xiao Neng La Ji Wen Ben Fen Lei |f 刘伍颖著
- 210 __ |a 北京 |c 国防工业出版社 |d 2014.10
- 215 __ |a 160页 |c 图 |d 21cm
- 320 __ |a 有书目 (第151-160页)
- 330 __ |a 本书全面客观地分析了大数据时代垃圾信息的爆发态势和文本特性,并根据信息文档的多域结构特性和文本Token频率分布的幂律特性,提出了多域学习的思想,研究了一整套面向大数据的高效能垃圾文本分类方法。本书共分7章:第1章分析大数据时代垃圾信息态势;第2章概述垃圾信息过滤方法;第3章研究电子邮件文档和手机短信文档的文本特性;第4章研究多域学习总体框架;第5章提出基于Token频率索引的文本分类算法;第6章研究有监督反馈代价问题;第7章设计面向大数据的高效能垃圾文本过滤系统。本书研究的内容新颖前沿,提出的方法普适实用,设计的数据结构、算法时空高效、应用性强。本书可以作为普通高等院校、科研机构大数据计算技术相关专业高年级本科生或研究生的实验教材,也可以作为网络信息技术公司高级研究人员的参考书。
- 333 __ |a 本书可作为普通高等院校、科研机构大数据计算技术相关专业高年级本科生或研究生的实验教材,也可供网络信息技术公司高级研究人员参考。
- 606 0_ |a 数据处理 |A Shu Ju Chu Li
- 701 _0 |a 刘伍颖, |A Liu Wu Ying |f 1980- |4 著
- 801 _0 |a CN |b WXCSXY |c 20150606
- 905 __ |a WXCSXY |d TP274/123