政务区
主要职责  机构设置 
领导介绍  直属单位 
行政许可  行政审批 
政策法规  规划计划 
通知公告  工作动态 
专题专项  数据统计 
最新关注  政务公开目录 
行政执法责任制 
服务区
服务目录  办事指南 
系统登录  表格下载 
常见问题  成果推荐 
资源数据  电子地图 
常用信息  网站导航 
互动区
领导信箱  投诉信箱 
意见征集  问题解答 
问卷调查  邮件订阅 
记者之家  联系我们 
政风行风热线 
首页 > 北京重点领域发明专利数据库 > 计算机技术
一种自动拆分英文复合词组的系统和方法
来源 : 北京市科技情报研究所
 

申请号:

200910078791

申请日:

2009/03/03

公开日:

2009/11/11

公告日:

公开号:

101576876

公告号:

授权日:

授权公告日:

专利类别:

发明

国别省市代码:

11[中国|北京]

代理机构代码:

11003[ ]

代理人:

尹振启

发明名称:

一种自动拆分英文复合词组的系统和方法

国际分类号:

G06F 17/27;G06F 17/30

范畴分类号:

39A40B40D

发明人:

杜小勇;刘红岩;何军;李直旭

申请人:

杜小勇

申请人地址:

北京市海淀区中关村大街59号中国人民大学信息学院

邮编:

100872

文摘:

一种自动拆分英文复合词组的系统和方法,其中该系统包括:词组输入模块,用于输入从一个领域的文本中分离出来的大量词组;词组分类模块,用于对所输入的每个词组进行分类,并且将简单词组放入简单词组表中;基于语言学规则的概率模型模块,用于对所分类的每个复合词组进行逐一拆分;基于文本分类的机器学习模型模块,用于对在基于语言学规则的概率模型模块中无法正确拆分的复合词组进一步拆分。

 
· 政府信息公开目录
· 政府信息公开指南
· 政府信息公开年报
· 依申请公开
· 监督投诉
常用信息更多...
北京市科委联系方式
市科委规范性文件
公务员招聘录用
技术合同认定登记机构
最新结果
高新技术企业名单
软件企业名单
科技研发机构名单
科技新星名单
问卷调查
· 市科委网站满意度调查
   
搜索
互联网搜索
 
 
全文搜索
 
邮件订阅
版权所有:北京市科学技术委员会
ICP备案编号:京ICP备05060936号
北京市科委联系电话:010-66153395 北京市科委网站联系电话:010-66114875