利用爬虫技术获取微信公众号、网站数据 ——从指定的网站进行相关信息抓取,存储到原始库,供系统分析使用
数据清洗(Data cleaning)是对数据进行重新审查和校验的过程,目的为删除重复信息、纠正存在的错误、剔除无效数据、数据一致性。——例如:广告、重复、无效网页、无效内容、关联性验证。
文本预处理利用自然语言处理技术、机器学习、深度学习算法,对文本数据进行分析。 ——例如:评论、留言、文章、销售记录
基于语料库、标注数据、经验规则,利用自然语言处理技术、机器学习、深度学习算法,将数据处理结构结合业务需求生成模型。 ——支持噪声识别模型、危机识别模型、舆论分类模型、情感分析模型、媒体影响力模型、热词分析模型、新闻溯源模型
实时监控数据源,可结合多种预警方式自动识别危机事件,预警消息及时通过站内、邮件的方式通知相关人员
拥有国家级高新技术企业认证、CMMI3软件成熟度认证、ISO9001质量管理体系认证、ISO27001信息安全管理体系认证、国家双软认证等全面的企业资质。先后成为微软加速器、百度AI加速器、青藤大学、联想之星、SAP、普华永道创新营成员,中国人工智能学会自然语言理解专委会企业会员,同时也是中文开放知识图谱平台OpenKG的发起成员之一。