刨丁解羊中文分词器

2 MB/网络辅助

简介 相关 评论

简介

刨丁解羊中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。

软件介绍

该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。

软件特点

该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。DLL及OCX调用请联系QQ(601069289)。

相关介绍

英语中的分词[participle],分为现在分词和过去分词两种,是一种非谓语动词形式,尤指以-ing或-ed,-d,-t,-en或-n结尾的英语动词性形容词,具有形容词功能,同时又表现各种动词性特点,如时态,语态、带状语性修饰语的性能及带宾词的性能。 

软件截图

 刨丁解羊中文分词器

展开

同类推荐

相关文章