欢迎来到Doc100.Net免费学习资源知识分享平台!
您的位置:首页 > 程序异常 >

稿子的内容识别

更新时间: 2014-01-05 02:53:16 责任编辑: Author_N1

 

文章的内容识别
假设现在有体育,娱乐,汽车等类别,那如何根据一篇文章的内容识别其类别呢?
(1)如果采用关键词方法,数据库如何设计?
(2)如何让程序具有人工智能?
(3)中文或者日文的话,怎样对文章进行分词啊?
--参考方法--
建议你看一下Data mining: practical machine learning tools and techniques 和Data Mining: Concepts and Techniques这两本书,讲到了人工智能及数据挖掘的东西.关于多语言的问题,无论是关键词还是文章内容建议统一用unicode方式存取,这样比较的时候就不存在编码转化的问题了。
上一篇:上一篇
下一篇:下一篇

 

随机推荐程序问答结果

 

 

如对文章有任何疑问请提交到问题反馈,或者您对内容不满意,请您反馈给我们DOC100.NET论坛发贴求解。
DOC100.NET资源网,机器学习分类整理更新日期::2014-01-05 02:53:16
如需转载,请注明文章出处和来源网址:http://www.doc100.net/bugs/t/15724/
本文WWW.DOC100.NET DOC100.NET版权所有。