您当前位置: 企业通> 产品库>商务服务>商务服务>软件开发>NLPIR智能分词用语义技术解决中文信息识别难题

NLPIR智能分词用语义技术解决中文信息识别难题

供应商:灵玖中科软件(北京)有限公司【公司商铺】

所在地:北京市市辖区

联系人:张先生

价格:面议

品牌:NLPIR分词

发布时间:2019-04-29

136812*** 点击查看联系方式

来电时,请说明是在企业通看到的

下一条

【产品详情】NLPIR智能分词用语义技术解决中文信息

查看该公司全部产品>>

  随着信息技术的不断发展,互联网上的信息也在急剧膨胀,在这海量的信息中,各类信息混杂在一起,要想充分利用这些信息资源就要对它们进行整理,如果由人来做这项工作,已经是不可能的,而如果面对中文信息不采用分词技术,那么整理的结果就过于粗糙,而导致资源的不能充分利用。通过引入分词技术,就可以使机器对海量信息的整理更准确更合理,使得检索结果更准确,效率也会大幅度的提高。   但由于中文词与词之间不象西文那样有明显的分隔符,所以构成了中文在自动切分上的困难。在现有的中文自动分词方法中,基于词典的分词方法占有主导地位。而中文分词的主要困难不在于词典中词条的匹配,而是在于切分歧义消解和未登录词语的识别。在中文分词过程中,这两大难题一直没有完全突破。   1、歧义处理   歧义是指同样的一句话,可能有两种或者更多的切分方法。目前主要分为交集型歧义、组合型歧义和真歧义三种。其中交集型歧义字段数量庞大,处理方法多样;组合型歧义字段数量较少,处理起来相对较难;而真歧义字段数量很少,且很难处理。 分词歧义处理之所以是中文分词的困难之一,原因在于歧义分为多种类型,针对不同的歧义类型应采取不同的解决方法。除了需要依靠上、下文语义信息;增加语义、语用知识等外部条件外,还存在难以消解的真歧义,增加了歧义切分的难度。同时未登录词中也存在着歧义切分的问题,这也增加了歧义切分的难度。所以歧义处理是影响分词系统切分精度的重要因素,是自动分词系统设计中的一个最困难也是最核心的问题。   2、未登录词识别   新词,专业术语称为未登录词。也就是那些在字典中都没有收录过词。未登录词可以分为专名和非专名两大类。其中专名包括中国人名、外国译名、地名等,而非专名包括新词、简称、方言词语、文言词语、行业用词等。 无论是专名还是非专名的未登录词都很难处理,因为其数量庞大,又没有相应的规范,而且随着社会生活的变迁,使未登录词的数量大大增加,这又为未登录词的识别增加了难度。   北京理工大学大数据搜索与挖掘实验室张华平主任研发的NLPIR大数据语义智能分析技术是满足大数据挖掘对语法、词法和语义的综合应用。NLPIR大数据语义智能分析平台是根据中文数据挖掘的综合需求,融合了网络采集、自然语言理解、文本挖掘和语义搜索的研究成果,并针对互联网内容处理的全技术链条的共享开发平台。

温馨提示: 以上是关于NLPIR智能分词用语义技术解决中文信息识别难题的详细介绍, 产品由灵玖中科软件(北京)有限公司为您提供,如果您对灵玖中科软件(北京)有限公司产品信息感兴趣可以联系供应商 或者让供应商 灵玖中科软件(北京)有限公司 主动联系您,您也可以查看更多与 相关的产品!

NLPIR智能分词用语义技术解决中文信息识别难题 相关产品信息:
锦绣私立学校 锦绣学校 50管大弯双层铁床学校钢板铁架床上下铺铁床 西安保安公司 三亚冻库出租 海南冻库出租 葫芦岛豆制品配送哪家好 豆制品配送哪家好 辽阳养老院电话 学武术招生 西安保安公司电话 黑龙江矿山恢复治理技术 钣金加工电话 锦州冷库安装 沈阳冷库制作 起重机维修 通风工程 锦绣小学 通化安装冷库公司 鞍山哪家养老院好
NLPIR智能分词用语义技术解决中文信息识别难题 相关热搜产品信息:
产品抄数 展览会 东莞文化公司 礼品字匾批发价格培训 西安废旧物资回收 厦门演艺公司 厦门到资验资 西安塑料模具 西安塑料制品 办公用品展 西安废旧电脑回收 中国磁材展 厦门代理会计服务 心理咨询培训 洛阳小吃培训 厦门会展服务 特色小吃培训 物业管理培训 不锈钢箱加工 营养师培训

本行业精品推荐

该公司其它产品

NLPIR智能分词用语义技术解决中文信息识别难题相关区域产品:
NLPIR智能分词用语义技术解决中文信息识别难题相关区域厂家: