这个有词频分析和数据输出么？ #41

wolf8210137 · 2018-04-26T07:34:18Z

我想要在一个句子中，取出前3个使用频率最高的名词，或者说最重要的前三个词。单纯的分词实现不了。不知道jieba-php有分词功能么?

fukuball · 2018-04-26T08:05:13Z

@wolf8210137 有關鍵詞提取功能，使用 TF/IDF 演算法，請見 Readme 功能 3)：關鍵詞提取

kency · 2018-05-23T22:03:40Z

cut可以加一个返回完整的分词带idf和词性的数组的选项吗, 返回结果类似这样
array(21) {
[0]=>
array(2) {
["word"]=>
string(3) "这"
["idf"]=>
double(8) 1.22223333
["tag"]=>
string(1) "r"
}....
}
用google的simhash算法做文章的相似度比较，需要文章的全部分词的权重，同时做情感分析需要分词的词性
也就是说，在cut的返回结果里把idf和词性也都带上就好了@fukuball

fukuball · 2018-09-10T06:41:22Z

是可以花時間加上這樣的功能，看有沒有人要幫忙，或是等我有空 XD

fukuball added the help wanted label Oct 14, 2019

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

这个有词频分析和数据输出么？ #41

这个有词频分析和数据输出么？ #41

wolf8210137 commented Apr 26, 2018

fukuball commented Apr 26, 2018

kency commented May 23, 2018 •

edited

Loading

fukuball commented Sep 10, 2018

这个有词频分析和数据输出么？ #41

这个有词频分析和数据输出么？ #41

Comments

wolf8210137 commented Apr 26, 2018

fukuball commented Apr 26, 2018

kency commented May 23, 2018 • edited Loading

fukuball commented Sep 10, 2018

kency commented May 23, 2018 •

edited

Loading