-
公开(公告)号:CN116108175A
公开(公告)日:2023-05-12
申请号:CN202211704106.0
申请日:2022-12-29
Applicant: 国网浙江省电力有限公司营销服务中心 , 浙江大学
IPC: G06F16/35 , G06F40/205 , G06F40/35 , G06F16/332 , G06F16/242
Abstract: 本发明公开了一种基于语义解析和数据构造的语言转化方法及系统。本发明采用的技术方案包括:选表任务:将选表任务转化为一个文本分类模型,预测文本对应数据库中的表;选列任务:将选列任务转化为一个序列标注模型,预测文本对应数据库中的列;SQL生成任务:将SQL生成任务转化为一个文本生成任务,并保存最优的文本生成模型,生成SQL查询语句;预测:利用上述训练好的三个模型,构建pipeline结构;接收用户输入的文本数据,依次经过上述训练好的三个模型,生成对应标准的SQL查询语句。本发明采用Pipeline形式的text2sql技术,在每个模型训练前都会加入额外的相关信息提高模型的准确率,通过优化各个模型来实现优化,更加地方便有效。