一种基于大语言模型和主题模型的网民观点分析方法

    公开(公告)号:CN117688182A

    公开(公告)日:2024-03-12

    申请号:CN202311719713.9

    申请日:2023-12-14

    发明人: 陈学言 王波 林泳

    摘要: 本发明涉及一种基于大语言模型和主题模型的网民观点分析方法。本发明通过综合考虑不同维度的信息,如TF‑IDF、关键词、主题模型和命名实体识别等,能够准确地分析和总结网民观点,并生成准确的观点情感结果。它能够从多个角度分析观点,发现不同维度的共性和差异,为决策提供更全面的参考。利用大语言模型处理和分析大量的文本数据,减少了人工干预的需求,提高了效率和可扩展性。该方法能够节省时间和人力成本,并能够处理大规模的数据,从而更全面地了解和总结观点。另外,可以根据具体需求进行定制和调整,包括设置TF‑IDF阈值、预定义关键词码表、调整主题模型参数、更替大语言模型prompt等,这使得技术能够适应不同领域和应用场景的需求。

    一种海外社交媒体语言与地域预测方法

    公开(公告)号:CN116720082A

    公开(公告)日:2023-09-08

    申请号:CN202310703455.9

    申请日:2023-06-14

    摘要: 本发明涉及一种海外社交媒体语言与地域预测方法。本发明通过分析博主发布的推文中使用的语言种类,对博主所在地域进行初步推测;分析博主关注的用户和互动最频繁的用户的地域信息,通过对这些关联人员地域数据的统计和分析,为博主地域预测提供进一步的依据;本方法结合了博主发文的语言种类和关联人员地域信息,从而提高预测的精度。此外,该技术可以动态调整预测模型,利用机器学习算法随着数据的更新不断进行调优,进一步提高预测性能,保持模型的时效性和可靠性。这种技术具有广泛适用性,可以应用于社交媒体平台的博主地域预测,并为广告投放、市场调查、舆情分析等相关业务提供有力支持。

    一种营商政策系统的构建方案及系统

    公开(公告)号:CN115953041A

    公开(公告)日:2023-04-11

    申请号:CN202211724821.0

    申请日:2022-12-30

    发明人: 陈学言 田平 刘源

    摘要: 本发明涉及一种营商政策系统的构建方案及系统。本发明基于大数据平台能力,获取国内政府网站全部公开政策资讯,多重组合算法区分政策和资讯信息,包括站点算法、板块算法、链接算法、索引算法,融合线下汇编政策,保障数据广度,同时,构建营商环境知识图谱,扩展营商环境政策库识别范围;另一方面,基于营商环境文本分析模型及知识图谱,识别分类实体隐性关系及关系的动态变化,精准识别、分类、分析政策,建立特有的政策影响力分析模型,从影响广度和影响深度2个方向进行深度分析。

    一种搜索引擎的千人千面程度测评方法

    公开(公告)号:CN114201412B

    公开(公告)日:2022-05-06

    申请号:CN202210140563.5

    申请日:2022-02-16

    IPC分类号: G06F11/36 G06F17/18

    摘要: 本发明公开了一种搜索引擎的千人千面程度测评方法、系统及计算机可读存储介质,方法包括以下步骤:S1:定义品牌的用户群体;S2:根据已定义的用户群体设置虚拟用户,根据虚拟用户设计养成计划;S3:定义虚拟用户养成的成功指标及搜索引擎千人千面的程度指标;S4:利用所述养成计划进行虚拟用户养成,根据虚拟用户养成的成功指标选择已养成的虚拟用户;S5:利用已养成的虚拟用户搜索待测评的关键词,根据搜索结果得到搜索引擎的千人千面程度。本发明通过设置虚拟用户及养成计划,并定义虚拟用户养成的指标及千人千面的程度指标同时结合线性回归分析的散点图能够高效且直观的对搜索引擎进行千人千面程度测试。

    一种基于图片信息聚类的信息批量提取方法

    公开(公告)号:CN114202761A

    公开(公告)日:2022-03-18

    申请号:CN202210140562.0

    申请日:2022-02-16

    IPC分类号: G06V30/148 G06V30/18 G06K9/62

    摘要: 本发明公开了一种基于图片信息聚类的信息批量提取方法、系统及计算机可读存储介质,方法包括:从待识别的图像中提取出商品对象和文字对象并分类编号,确定每个对象的坐标系;对得到的不同对象边缘打点并确定所打点的坐标;将相邻的不同类对象利用边缘点进行碰撞计算,若相邻两个不同类对象的边缘点之间的距离小于预设值则将当前两个对象作为组合对象;将组合的对象继续与其他对象进行碰撞计算,若边缘点之间的距离大于当前已组合对象边缘点之间距离的预设倍数,则判定该对象不属于同一组合内对象,继续与其他不同类对象碰撞计算,直到所有对象均组合,输出组合对象。本发明能够实现复杂背景中关联对象的组合识别并进行信息提取。

    一种搜索引擎的千人千面程度测评方法

    公开(公告)号:CN114201412A

    公开(公告)日:2022-03-18

    申请号:CN202210140563.5

    申请日:2022-02-16

    IPC分类号: G06F11/36 G06F17/18

    摘要: 本发明公开了一种搜索引擎的千人千面程度测评方法、系统及计算机可读存储介质,方法包括以下步骤:S1:定义品牌的用户群体;S2:根据已定义的用户群体设置虚拟用户,根据虚拟用户设计养成计划;S3:定义虚拟用户养成的成功指标及搜索引擎千人千面的程度指标;S4:利用所述养成计划进行虚拟用户养成,根据虚拟用户养成的成功指标选择已养成的虚拟用户;S5:利用已养成的虚拟用户搜索待测评的关键词,根据搜索结果得到搜索引擎的千人千面程度。本发明通过设置虚拟用户及养成计划,并定义虚拟用户养成的指标及千人千面的程度指标同时结合线性回归分析的散点图能够高效且直观的对搜索引擎进行千人千面程度测试。

    一种面向电商数据的商标侵权分析方法及系统

    公开(公告)号:CN114529784B

    公开(公告)日:2022-11-18

    申请号:CN202210153495.6

    申请日:2022-02-18

    摘要: 本发明提出了一种面向电商数据的商标侵权分析方法,通过构建商标检测模型和商品检测模型;利用商品检测模型提取品牌商的标准商品特征信息,并确定应用商标检测模型中哪几种商标分类进行检测;获取待侵权判断的商品特征信息并设置侵权阈值,计算每种商品的标准商品特征信息与待侵权判断的商品特征信息的相似度,若存在相似度大于侵权阈值的商品,则使用商标检测模型对待侵权判断的商品信息进行识别,若存在对应的商标分类,则判断此商品的商标为不当使用。本发明还提供一种商标侵权分析系统,通过训练商标检测模型和商品检测模型,综合电商平台相关的商品信息数据对商标侵权进行分析,有效提高针对电商平台的商标侵权判断方法的可行性和准确性。

    一种境外互联网社交阵地多模态数据识别方法

    公开(公告)号:CN117851871A

    公开(公告)日:2024-04-09

    申请号:CN202410198313.6

    申请日:2024-02-22

    发明人: 陈学言 王波 王垒

    摘要: 本发明涉及一种境外互联网社交阵地多模态数据识别方法。本发明针对跨语言和文化理解的提升、图像与文本之间深层关联的分析、情感分析的准确性和多样性提升,以及多模态数据融合和上下文分析的优化,有助于更准确地处理和理解多语言互联网社交平台上的复杂和异质数据,从而提供更深入、全面的内容分析和用户行为洞察。通过这些技术创新,可以显著提高数据处理的准确度和效率,特别是在多语言和多元文化的互联网社交环境中,更好地满足多元化和国际化的社交媒体环境需求。

    一种基于多模态融合算法的舆情风险发现方法

    公开(公告)号:CN116756688A

    公开(公告)日:2023-09-15

    申请号:CN202310733944.9

    申请日:2023-06-20

    摘要: 本发明涉及一种基于多模态融合算法的舆情风险发现方法。本发明可以综合分析多种类型的数据,提高数据挖掘的深度和全面性;可以发掘文本与图片、文本与视频等之间的关联信息,有助于更全面地揭示舆情风险的真实情况;能够整合来自不同模态的信息,其对舆情风险的识别更为准确和可靠,降低了误判和漏判的风险;灵活应用多种舆情风险发现模型,能够根据实际需求进行模型选择和调整;可以开发更精确的风险评估模型,实现对风险等级的判断和预警,提高应对风险的能力;可以应对大量的网络数据和多模态数据处理需求,保证了舆情风险发现的实时性和系统的可扩展性,适应不断变化的网络环境。