一种敏感词过滤方法及系统

    公开(公告)号:CN105574090B

    公开(公告)日:2017-12-26

    申请号:CN201510917567.X

    申请日:2015-12-10

    IPC分类号: G06F17/30

    摘要: 本发明涉及字符串多模式匹配领域,公开了一种敏感词过滤方法,包括中文、英文、网址敏感词及排除词的管理;字符规格化处理方法;一组针对不同存在形式敏感词的过滤策略及实现方法,至少包括对中文、英文、网址、全拼、拼音编写、变形词的过滤;一组敏感词的判定规则;中文敏感词的近似匹配方法,本发明还公开了一种敏感词过滤装置。本发明满足了内容的管理者和搜集者对发布或搜集的文本过滤敏感词的需要,能够快速准确地完成大量敏感词的过滤,向调用者返回敏感词及其敏感级别和在文本中出现的位置。

    一种云机器人系统
    32.
    发明公开

    公开(公告)号:CN106393114A

    公开(公告)日:2017-02-15

    申请号:CN201611011081.0

    申请日:2016-11-17

    IPC分类号: B25J9/16

    CPC分类号: B25J9/1669 B25J9/1661

    摘要: 本发明公开了一种云机器人系统,包括云服务器平台和实体机器人,所述云服务器平台包括云机器人引擎模块和云编程引擎模块,所述云编程引擎模块在云服务器平台与所述云机器人引擎模块进行信号传输,所述实体机器人以云服务方式与所述云机器人引擎模块进行信号传输,所述实体机器人包括多个硬件功能模组,所述硬件功能模组遵循硬件功能模组标准,所述硬件功能模组标准使硬件功能模组在云服务方式下能够注册和添加。本发明云机器人系统降低了机器人的硬件成本,提高了系统的复用性和可维护性,利于机器人在熟悉场景下快速的调用和处理命令做出执行动作,保证了机器人智能化服务的丰富性。

    基于大数据分析技术的微博转发可视化分析方法及系统

    公开(公告)号:CN105447144A

    公开(公告)日:2016-03-30

    申请号:CN201510825096.X

    申请日:2015-11-24

    发明人: 游世学 刘俊康

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30651 G06F17/30705

    摘要: 本发明公开了一种基于大数据分析技术的微博转发可视化分析方法,包括:S1、获取源微博和所有转发微博,所述转发微博直接或间接转发所述源微博;S2、提取所述源微博和转发微博中的文本信息;S3、根据提取的文本信息得到所述源微博和所有转发微博的转发关系,所述转发关系包括所述转发微博之间的转发关系;S4、根据所述转发关系绘制可视化图形。本发明还公开了一种基于大数据分析技术的微博转发可视化分析系统。采用本发明的方案,将一个个单独存在的微博关联起来,使转发微博文本间的拓扑关系更加清晰,从而有效地提高微博转发关系的可视化,便于分析转发微博的内在关系。

    一种选择参数高效微调模块的方法

    公开(公告)号:CN117094361A

    公开(公告)日:2023-11-21

    申请号:CN202311352064.3

    申请日:2023-10-19

    IPC分类号: G06N3/0455 G06N3/08

    摘要: 本发明提供了一种选择参数高效微调模块的方法,包括:获取待选择参数高效微调模块和输入样本的最终隐状态;构建参数高效微调超网络并根据所述输入样本的最终隐状态,得到输入样本的最后表征;所述输入样本的最后表征为学习系数与输入样本的最终隐状态相乘;判断所述学习系数是否大于阈值,若是,则所述待选择参数高效微调模块为选中,若否,则所述待选择参数高效微调模块为舍弃。本发明解决了现有技术中大规模语言模型微调方法选择性少并且训练过程消耗大的问题。

    一种远程办公质量评估系统及方法

    公开(公告)号:CN112053064B

    公开(公告)日:2023-09-26

    申请号:CN202010938234.6

    申请日:2020-09-09

    摘要: 本发明公开了一种远程办公质量评估系统和方法,包括终端监测系统和云端服务引擎,所述终端监测系统,对员工的键盘操作进行宏观统计,得到键盘开关量统计数据,用于对员工的鼠标操作进行宏观统计,得到鼠标开关量统计数据,建立统计时间序列中人脸身份一致性和人脸表情特征值的分布特征,生成对应的工作人员面部特征开关统计数据,将这些数据发送到云端服务引擎存储,基于统计预测模型以待处理的工作统计数据为输入,输出参考工作状态评估数据。既不侵犯员工隐私,也能达到有效地评估员工工作效率、工作质量的目的。

    一种混合神经网络和字符信息的文本编码方法及系统

    公开(公告)号:CN115392192B

    公开(公告)日:2023-01-17

    申请号:CN202211322130.8

    申请日:2022-10-27

    摘要: 本发明提供了一种混合神经网络和字符信息的文本编码方法及系统,方法包括:获取待编码文本,使用预训练神经网络根据细粒度分词对待编码文本编码,得到第一词序列编码和第一文本编码;使用SimHash根据粗粒度分词对待编码文本进行编码,得到第二词序列编码和第二文本编码;使用SimHash根据词和文本的标签对待编码文本编码,得到第三词序列编码和第三文本编码;混合第一词序列编码、第一文本编码、第二词序列编码、第二文本编码、第三词序列编码和第三文本编码,得到最终词序列编码和最终文本编码。本发明消除了单纯使用神经网络预训练模型带来的数据偏见和信息丢失问题,提高了下游模型的训练收敛速度和推理泛化能力,加快了应用落地的工程迭代速度。

    一种基于深度学习的从非结构化文本中获取问答对的方法

    公开(公告)号:CN110110054B

    公开(公告)日:2021-06-08

    申请号:CN201910220102.7

    申请日:2019-03-22

    摘要: 本发明涉及一种基于深度学习的从非结构化文本中获取问答对的方法,包括如下步骤:文本规格化处理;基于深度神经网络模型进行句子分类和配对及关键短语提取;文本内部的问答对获取;文本外部的问答对爬取;问答对汇总去重。本发明,针对问答对获取困难的问题,通过有效利用容易获取的非结构化文档资源,结合使用深度神经网络模型,自动高效地获取成规模的问答对,供人工校对、补充使用,降低了构建知识库的成本,加快了构建知识库的构建速度。

    一种融合FAQ和任务及主动引导的对话系统

    公开(公告)号:CN109977208B

    公开(公告)日:2021-04-09

    申请号:CN201910220079.1

    申请日:2019-03-22

    发明人: 王丙栋 游世学

    IPC分类号: G06F16/332

    摘要: 本发明涉及一种融合FAQ和任务及主动引导的对话系统,包括:对话管理模块101,对话管理模块是对FAQ对话引擎、任务型对话引擎和主动引导型对话引擎上层的封装,FAQ对话引擎102,包括FAQ问答库105和问答处理模块,主动引导型对话引擎103,包括主动引导对话库106和对话引导模块,任务型对话引擎104,包括任务技能库107和语义理解模块。本发明,能够按需灵活选择配置FAQ问答库、任务技能库和主动引导对话库,对外提供统一的对话和控制接口,对内封装各类型的对话引擎的差异性,实现多对话引擎的对话状态管理和应答策略选择,在多轮对话中,可有效处理话题场景的切换,结合对话状态,选择合适的对话引擎得到基于上下文的回复。

    一种基于语义的行为生成方法

    公开(公告)号:CN112052688A

    公开(公告)日:2020-12-08

    申请号:CN202010938244.X

    申请日:2020-09-09

    摘要: 本发明公开了一种基于语义的行为生成方法,首先工作人员穿戴可穿戴设备,做出与文本对应的行为动作,采集动作数据;然后对动作数据进行数据分帧,生成全帧序列数据;再将行为动作对应文本内容进行向量化处理,基于有监督神经网络训练,建立文本向量和全序列之间的映射关系;服务机器人获取语音音频,并输出与行为动作文本对应的的全帧序列;对全帧序列进行动作约束与优化;将行为数据序列与文本产生的音频数据进行对齐和插补,优化对齐后的全帧序列驱动输出,并由电机驱动机器人对应部位运动,同步播放对应地语音音频。其提高智能机器人的行为表达能力,与语音回复同步增加了趣味性。