自然语言处理解决方案

一、系统背景

近年来,深度学习在图像和语音处理领域已经取得显著进展,但是在同属人类认知范畴的自然语言处理任务中,研究还未取得重大突破.本文通过分析目前国内外部分专家学者对面向自然语言处理的深度学习研究的总体概况,梳理、总结了相关文献,介绍深度学习的基本概念;分析讨论了当前面向自然语言处理的深度学习研究进展及应用策略和深度学习的平台和工具;对深度学习在自然语言处理处理领域的发展趋势和有待深入研究的难点进行了展望。

二、系统概述

自然语言处理中深度学习通过建立深层神经网络,模拟人脑的机制进行解释并分析学习图像、语音及文本等数据,是目前机器学习研究中的一个热点领域.传统机器学习工作的有效性,很大程度上依赖于人工设计的数据表示和输入特征的有效性;机器学习方法在这个过程中的作用仅仅是优化学习权重以便最终输出最优的学习结果.与传统机器学习方法不同的是,深度学习试图自动完成数据表示和特征提取工作;并且深度学习更强调,通过学习过程提取出不同水平、不同维度的有效表示,以便提高不同抽象层次上对数据的解释能力.从认知科学角度来看,这个思路与人类学习机理非常吻合。

三、系统拓扑

自然语言处理

四、系统功能

文本要素智能抽取 :基于自然语言处理技术,对案件卷宗、审讯笔录、简要案情等公安情报文本信息进行文本分析挖掘,高效抽取文本要素,如作案时间、作案地点、涉案人员(涉案人员特征、涉案人员关系等)、作案手段、作案工具、损失物品、损失金额等信息。公安情报文本,经过要素智能抽取后,与公安其他的情报数据进行融合,如人员信息、道路卡口、车辆轨迹等信息,可提升非结构化数据的应用,增强情报信息维度,支撑情报综合分析与研判。

情报文本智能分类、聚类:情报文本智能聚类是基于相似性算法的聚类技术,自动对大量无类别的警情、案件等进行归类,把内容相近的文档归为一类,并可自动为该类生成主题词,从而提供文本类别名称。 按照现有的警情、案件标准化标签体系,采用文本分类算法对警情文本、案件文本信息实现自动分类打标签,可实现多维标签的案件综合检索、区域治安形势、区域态势分析等。同时,采用文本聚类算法找到情报文本之间的相似度和潜在的主题要素,探索案件文本的潜在关联要素和相关关系,为案件的串并案、类案刑侦等提供辅助支撑。

智能化文本信息搜索 :基于自然语言处理技术的文本挖掘,一方面可以对已经提取的情报文本要素进行关键字检索;另一方面通过计算情报文本之间的相似度来搜索相似或关联的情报,达到“以案搜人”、“以人搜案”、“以人搜人”、“以案搜案”等效果,有利于公安业务人员快速定位有用的案情,提升公安快速响应能力与作战能力。

助力智慧警务:昆仑自然语言处理,对海量的非结构化情报文本信息,进行深度挖掘和综合关联分析,极大提升了警察人员日常情报数据分析与应用能力,为侦查破案、维稳处突、服务民生等公安事务活动提供强大的技术支撑。

五、系统优势

智能化:基于ImageQ优势的自然语义理解技术,帮助公安行业高效激活大量沉睡的非结构性数据,并由点连线、由线成面,最大化的挖掘数据价值,辅助提升警务各模块的工作效率。

可视化:根据不同场景、不同终端的应用需求,定制人性化、交互程度高的可视化界面,让办案人员“无摩擦的”与案件线索相连接。

定制化:可根据业务进行定制化建模,模型可以本地化部署,并且根据需要在此基础上进行二次开发。从而可灵活应对需求方基于各种业务、场景的具体要求,形成符合行业特色的业务平台体系。

一站式服务:专有技术团队帮助解决前期数据接入、平台搭建,中期系统功能拓展、性能优化提升、个性化配置,后期运营维护、数据监控与安全等一系列问题

应用领域

监狱、戒毒所、公安监所、社区、学校、园区、银行

底部logo

地址:广州市越秀区东风中路268号广州交易广场2105室

粤ICP备18011755号