 |
 |
政务区 |
|
|
 |
服务区 |
|
 |
 |
互动区 |
|
|
 |
| 来源 : 北京市科技情报研究所 |
|
|
申请号: |
200910078791 |
申请日: |
2009/03/03 |
|
公开日: |
2009/11/11 |
公告日: |
|
|
公开号: |
101576876 |
公告号: |
|
|
授权日: |
|
授权公告日: |
|
|
专利类别: |
发明 |
国别省市代码: |
11[中国|北京] |
|
代理机构代码: |
11003[ ] |
代理人: |
尹振启 |
|
发明名称: |
一种自动拆分英文复合词组的系统和方法 |
|
国际分类号: |
G06F 17/27;G06F 17/30 |
|
范畴分类号: |
39A40B40D |
|
发明人: |
杜小勇;刘红岩;何军;李直旭 |
|
申请人: |
杜小勇 |
|
申请人地址: |
北京市海淀区中关村大街59号中国人民大学信息学院 |
|
邮编: |
100872 |
|
文摘: |
|
一种自动拆分英文复合词组的系统和方法,其中该系统包括:词组输入模块,用于输入从一个领域的文本中分离出来的大量词组;词组分类模块,用于对所输入的每个词组进行分类,并且将简单词组放入简单词组表中;基于语言学规则的概率模型模块,用于对所分类的每个复合词组进行逐一拆分;基于文本分类的机器学习模型模块,用于对在基于语言学规则的概率模型模块中无法正确拆分的复合词组进一步拆分。 |
| |
| |
|
|
|
 |
 |
 |
搜索 |
|
 |
 |
邮件订阅 |
|
|