NLP服务产品分为两大类,基础版包含文本处理能力,高级版包含文本生成能力,具体如下:
基础版(文本处理):词法分析、相似词召回、词相似度、句子相似度
高级版(文本生成):文本润色、句子纠错、文本补全、句子生成
主要功能
• 词法分析:分词、词性标注、命名实体识别(NER)、语义联想、句法分析、关键词提取
• 句子相似度:两个句子之间的语义相似度
特色(与现有的多数开源自然语言理解工具相比)
• 细粒度命名实体识别(ine-Grained NER)
• 支持上千种实体类型,类型之间具有层级结构;而目前多数公开的文本理解工具只支持人、地点、机构等几种或者十几种(粗粒度的)实体类型
• 增强的语义理解功能
• 上下文相关的语义联想,特定类型实体的深度语义表达
• 为多维度应用需求而设计
• 针对一项功能(比如词性标注或命名实体识别)实现了多种不同速度和精度的算法与模型供上层应用按需选择,以便满足工业界和学术界不同场景下的多 样化应用需求
• 大规模的无结构化数据以及无监督或弱监督方法→更新代价低(时效性)
短语补全:与搜索引擎搜索框的前缀补全相比,我们支持基于前缀、后缀和上下文的短语补全
句子补全:成功将中文句子续写功能在相关性、流利性、丰富性三个指标上提升至接近人类水平,并在与竞品的比较中处于领先位置
句子补全:项目中提出的SimCTG生成框架受到学术界关注
此事还得从这说起,➡
输入:中国奥运健儿击败强敌,勇夺冬奥会首金。