-
公开(公告)号:CN117539656A
公开(公告)日:2024-02-09
申请号:CN202311368593.2
申请日:2023-10-20
申请人: 苏州亿铸智能科技有限公司
IPC分类号: G06F9/54 , G06F16/958
摘要: 本申请公开一种网页应用开发系统及方法,包括:网页浏览器,用于发送Http请求;网页应用服务器,用于接收Http请求,以及当Http请求为服务请求时对Http请求进行解析并构建相应的GRPC请求;业务服务器,用于接收GRPC请求,并根据GRPC请求执行相应的业务服务以产生GRPC响应;网页应用服务器还用于接收GRPC响应,并对GRPC响应进行解析并构建相应的Http响应,并发送至网页浏览器;其中,网页应用服务器同时集成有前端页面、后端服务和GRPC服务以实现将http请求与GRPC请求的转换以及GRPC响应与http响应的转换。本申请可以实现后端直接调用GRPC服务,简化系统架构。
-
公开(公告)号:CN118034642B
公开(公告)日:2024-11-01
申请号:CN202410268795.8
申请日:2024-03-08
申请人: 苏州亿铸智能科技有限公司
IPC分类号: G06F7/52
摘要: 本申请公开一种浮点运算方法、装置、电子设备及存储介质,浮点运算方法包括:根据模型运算指令,获取第一向量和第二向量,第一向量包括多个第一元素,第二向量包括多个第二元素,第一元素和第二元素为浮点型数据,第一元素和第二元素一一对应;对第一向量中的所有元素和第二向量中的所有元素进行指数运算得到指数计算结果;根据指数计算结果对第一向量中的所有元素和第二向量中的所有元素进行尾数预对齐得到第一尾数向量和第二尾数向量;将第一尾数向量和第二尾数向量进行乘加运算得到尾数乘加结果;根据指数计算结果和尾数乘加结果进行规格化处理得到模型运算结果。本申请无需在乘加运算过程中进行对阶移位操作,提高计算效率。
-
公开(公告)号:CN115719086B
公开(公告)日:2023-07-14
申请号:CN202211469658.8
申请日:2022-11-22
申请人: 苏州亿铸智能科技有限公司
IPC分类号: G06N3/0495
摘要: 本发明公开了一种自动获得混合精度量化全局最优化策略的方法,包括以下步骤:准备将要进行量化的深度神经网络数据集;从深度神经网络的所有混合量化组合中顺序选取一个组合进行推理,并记录实际的推理精度和实际的推理时间,重复直至遍历所有混合量化组合;排除掉实际推理精度或实际推理时间不符合要求的混合量化组合,对剩余符合推理精度和推理时间要求的计算得分并按得分进行排序;选择最高得分的混合量化组合作为混合精度量化全局最优化策略。本发明遍历所有混合量化组合,能自动找到全局最优化的混合量化组合;用户还可以通过修改推理精度权重和推理时间权重来调整混合量化组合得分标准,更好地在不同场景或不同模型找到全局最优化的组合。
-
公开(公告)号:CN118034642A
公开(公告)日:2024-05-14
申请号:CN202410268795.8
申请日:2024-03-08
申请人: 苏州亿铸智能科技有限公司
IPC分类号: G06F7/52
摘要: 本申请公开一种浮点运算方法、装置、电子设备及存储介质,浮点运算方法包括:根据模型运算指令,获取第一向量和第二向量,第一向量包括多个第一元素,第二向量包括多个第二元素,第一元素和第二元素为浮点型数据,第一元素和第二元素一一对应;对第一向量中的所有元素和第二向量中的所有元素进行指数运算得到指数计算结果;根据指数计算结果对第一向量中的所有元素和第二向量中的所有元素进行尾数预对齐得到第一尾数向量和第二尾数向量;将第一尾数向量和第二尾数向量进行乘加运算得到尾数乘加结果;根据指数计算结果和尾数乘加结果进行规格化处理得到模型运算结果。本申请无需在乘加运算过程中进行对阶移位操作,提高计算效率。
-
-
-