一种面向中文小说领域的文本内容审核方法

    公开(公告)号:CN114139533B

    公开(公告)日:2024-07-09

    申请号:CN202111480639.0

    申请日:2021-12-06

    Abstract: 一种面向中文小说领域的文本内容审核方法,包括:获取敏感词及所属类别,构建敏感词库;通过字符串匹配算法,检测待审核文本是否包含敏感词,如果是,则待审核文本是违规文本,且分类是敏感词所属类别,如果否,则继续下一步;设置多个违规分类标签,构建并训练小说文本内容审核模型,然后将待审核文本输入模型中,其工作流程如下:计算输入文本的语义特征向量和每个违规分类标签的信息特征向量,再计算输入文本和每个违规分类标签的相关语义特征向量,最后采用胶囊网络对相关语义特征向量聚类,根据顶层胶囊的每个违规分类标签的类别概率确定输入文本的分类。本发明属于信息技术领域,能实现中文小说文本内容自动审核,并提高审核准确率及效率。

    一种中文歧义非标准词的识别与转化系统和方法

    公开(公告)号:CN115438660A

    公开(公告)日:2022-12-06

    申请号:CN202211117850.0

    申请日:2022-09-14

    Abstract: 一种中文歧义非标准词的识别与转化系统,包括如下模块:非标准词检测模块、歧义非标准词分类模块和非标准词规则转化模块;一种中文歧义非标准词的识别与转化方法,包括下列操作步骤:(1)将待检测文本输入到非标准词检测模块,输出所有的非标准词成分;(2)把没有歧义的非标准词输入到非标准词规则转化模块,转化为标准中文;(3)把有歧义的非标准词输入到歧义非标准词分类模块进行歧义类型的分类;(4)将该歧义非标准词及其歧义类型输入到非标准词规则转化模块,转化为标准中文。

    一种广告点击率预估系统和方法
    4.
    发明公开

    公开(公告)号:CN114677173A

    公开(公告)日:2022-06-28

    申请号:CN202210293313.5

    申请日:2022-03-23

    Abstract: 一种广告点击率预估系统,包括如下模块:特征嵌入模块、权重分配模块和网络集成模块;一种广告点击率预估方法,所述方法包括下列操作步骤:(1)将输入特征ID号输入到特征嵌入模块,得到嵌入特征;(2)将得到的嵌入特征输入到权重分配模块,得到每个嵌入特征对应的权重值;(3)把加权后的嵌入特征输入到网络集成模块,得到广告点击概率值;本发明的系统和方法解决了广告点击率预估结果不稳定的问题,同时在评价结果上也优于目前的方法,有利于离线评估和线上部署。

    一种基于深度学习技术的楼宇指示标识的文字识别方法

    公开(公告)号:CN111626292A

    公开(公告)日:2020-09-04

    申请号:CN202010388458.4

    申请日:2020-05-09

    Abstract: 一种基于深度学习技术的楼宇指示标识的文字识别方法,包括:采用检测网络对场景图片进行检测,获得楼宇指示标识文本的4个角点坐标,截取出字符图片;将字符图片分别输入MORN网络和进行霍夫直线处理,并将MORN网络矫正后的图片和霍夫直线变换后的图片进行图像融合,获得融合图片;构建楼宇指示标识文本识别模型,输入融合图片,处理流程如下:先将融合图片使用经典卷积神经网络CNN提取特征图,然后将特征图的每列作为一个时间片输入到长短期记忆网络LSTM中,并输出得到每个时间片对应的文本字符类别,采用损失函数Loss去除空白字符后,获得楼宇指示标识文本。本发明属于信息技术领域,能实现对楼宇指示标识文本的准确识别。

    一种基于深度学习技术的楼宇指示标识的文字识别方法

    公开(公告)号:CN111626292B

    公开(公告)日:2023-06-30

    申请号:CN202010388458.4

    申请日:2020-05-09

    Abstract: 一种基于深度学习技术的楼宇指示标识的文字识别方法,包括:采用检测网络对场景图片进行检测,获得楼宇指示标识文本的4个角点坐标,截取出字符图片;将字符图片分别输入MORN网络和进行霍夫直线处理,并将MORN网络矫正后的图片和霍夫直线变换后的图片进行图像融合,获得融合图片;构建楼宇指示标识文本识别模型,输入融合图片,处理流程如下:先将融合图片使用经典卷积神经网络CNN提取特征图,然后将特征图的每列作为一个时间片输入到长短期记忆网络LSTM中,并输出得到每个时间片对应的文本字符类别,采用损失函数Loss去除空白字符后,获得楼宇指示标识文本。本发明属于信息技术领域,能实现对楼宇指示标识文本的准确识别。

    一种融合多属性和局部特征的车辆重识别系统和方法

    公开(公告)号:CN114677557A

    公开(公告)日:2022-06-28

    申请号:CN202210233646.9

    申请日:2022-03-10

    Abstract: 一种融合多属性和局部特征的车辆重识别系统,包括通用特征提取模块、全局特征模块、属性识别模块和面向方向的DropBlock模块;一种融合多属性和局部特征的车辆重识别方法,包括操作步骤:(1)将图像库中的车辆图像输入到车辆重识别系统,得到图像库中的车辆图像的重识别特征;(2)将待查询车辆图像输入到车辆重识别系统,得到待查询车辆图像的重识别特征;(3)根据所得到的重识别特征,从图像库中找出与待查询车辆图像相似度最大的车辆图像;本发明方法能够获取更多细节特征,有效的提升了车辆重识别的效果。

    一种基于深度学习的音乐分类方法

    公开(公告)号:CN111611431B

    公开(公告)日:2023-07-28

    申请号:CN202010301644.X

    申请日:2020-04-16

    Abstract: 一种基于深度学习的音乐分类方法,包括:将音乐的音频文件转化成梅尔声谱图,并生成音乐标签的独热向量;将音乐的梅尔声谱图和音乐标签的独热向量分别传入卷积神经网络和循环神经网络,通过卷积神经网络获得音乐的频域和时域特征向量,通过循环神经网络获得音乐‑标签关系向量,然后将卷积神经网络和循环神经网络各自的输出向量映射到相同维度后,连接合并构成一个音乐‑标签嵌入向量;将音乐‑标签嵌入向量传入标签预测层,其输出是音乐对应每个类别标签的概率值,最后根据概率值,从所有类别标签中挑选多个类别标签作为音乐的分类。本发明属于信息技术领域,能基于音乐类别的繁多和交错关系,实现音乐类别标签的准确预测。

Patent Agency Ranking