NLP-基础任务-分词算法：概述【成熟的第三方工具包：中文（jieba、哈工大LTP）、英文（NLTK、SpaCy、StanfordCoreNLP）】

小灰灰 2023-10-04 09:31 6阅读 0赞

发表评论取消回复

表情：

评论列表（有 0 条评论，6人围观）

还没有评论，来说两句吧...

相关阅读

相关 NLP-基础任务-分词算法：概述【成熟的第三方工具包：中文（jieba、哈工大LTP）、英文（NLTK、SpaCy、StanfordCoreNLP）】

分词（tokenization）：英文通过空格或者标点符号，就可以将词分开；而中文的分词会涉及很多问题（未登录词问题、分词歧义问题、分词不一致问题），所以会有各种不同分词的算法

小灰灰/ 2023年10月04日 09:31/ 0 赞/ 7 阅读

相关 NLP-基础任务-中文分词算法(3)-基于字：基于序列标注的分词算法【BiLSTM+CRF】

CRF：条件随机场，一种机器学习技术。给定一组输入随机变量条件下，另一组输出随机变量的条件概率分布模型。以一组词性标注为例，给定输入X=\{我，喜欢，学习\}，那么输出为Y

Love The Way You Lie/ 2023年10月01日 20:39/ 0 赞/ 5 阅读

相关 NLP-基础任务-分词-第三方库：ICTCLAS【中文分词准确率最高的第三方库】【中科院】【收费】

NLP-基础任务-分词-第三方库：ICTCLAS【中文分词准确率最高的第三方库】【中科院】【收费】 http://ictclas.nlpir.org/ ---------

阳光穿透心脏的1/2处/ 2023年10月01日 18:13/ 0 赞/ 23 阅读

相关 NLP 使用jieba分词

相比于机械法分词法，jieba联系上下文的分词效果更好。同时使用HMM模型对词组的分类更加准确。测试对如下文本的分词效果 > 南门街前段时间经过整改劝阻摆摊占道的情

男娘i/ 2023年07月20日 13:31/ 0 赞/ 9 阅读

相关 python中文分词工具：结巴分词jieba

http://[blog.csdn.net/pipisorry/article/details/45311229][blog.csdn.net_pipisorry_articl

灰太狼/ 2022年08月05日 12:16/ 0 赞/ 272 阅读

相关中文分词工具—Jieba

中文分词—Jieba 是一款Python 中文分词组件 “Jieba” (Chinese for “to stutter”) Chinese text segmentatio

心已赠人/ 2022年05月21日 08:20/ 0 赞/ 475 阅读

相关中文分词之jieba分词

分词粒度：粗粒度、细粒度推荐场景：粗粒度搜索场景：细粒度——召回 1.最基本的切词方法： trie树匹配：前向、后向，举例： ![watermark_t

超、凢脫俗/ 2022年03月16日 15:22/ 0 赞/ 442 阅读

相关 Python第三方库jieba（中文分词）入门与进阶（官方文档）

转自：[https://blog.csdn.net/qq\_34337272/article/details/79554772][https_blog.csdn.net_qq_

谁借莪１个温暖的怀抱￠/ 2022年03月16日 11:14/ 0 赞/ 204 阅读

相关 Python分词模块推荐：jieba中文分词

一、结巴中文分词采用的算法基于Trie树结构实现高效的词图扫描，生成句子中汉字所有可能成词情况所构成的有向无环图（DAG) 采用了动态规划查找最大概率路径,

傷城~/ 2022年02月02日 04:19/ 0 赞/ 381 阅读

相关 jieba中文分词组件

目录 jieba简介组件特点安装方法算法使用jieba 分词添加自定义词典载入词典调整词典关键词提取基于 TF-IDF 算法的关键词抽取

妖狐艹你老母/ 2022年01月29日 10:15/ 0 赞/ 351 阅读