欢迎来到Doc100.Net免费学习资源知识分享平台!
您的位置:首页 > 程序异常 >

数据分拆,该如何解决

更新时间: 2014-01-05 02:29:25 责任编辑: Author_N1

 

数据分拆
请问如何分拆数据得到当中的重点字眼?
例如:字段A 为“广州市天河区珠江新城*****” 字段B2为“天河区珠江新城……”。如何拆分得到重点字词“珠江新城”呢?
现在工作中只有这些数据存在数据库当中,且数量非常大。如何通过方法来查找出重点字词。又或者某些字词出现的频率较多的呢?
--参考方法--
用到 分词技术,训练模型。
--参考方法--
1 编辑词库,珠江新城就是一个词条,你应该不止这一个词条吧
2 分词,采用最小切分法,保证出来的词,都是重点
--参考方法--
路过!
--参考方法--
这个~~~建词库的话是不是有点麻烦呢?
--参考方法--
我也遇到类似的问题。。
--参考方法--
这个环节属于ETL,预处理,不是挖掘的核心.
--参考方法--
DINGDINGDINGDING
--参考方法--
高呀,咋也学习学习
--参考方法--
。。。打酱油了
上一篇:上一篇
下一篇:下一篇

 

随机推荐程序问答结果

 

 

如对文章有任何疑问请提交到问题反馈,或者您对内容不满意,请您反馈给我们DOC100.NET论坛发贴求解。
DOC100.NET资源网,机器学习分类整理更新日期::2014-01-05 02:29:25
如需转载,请注明文章出处和来源网址:http://www.doc100.net/bugs/t/10455/
本文WWW.DOC100.NET DOC100.NET版权所有。