-
公开(公告)号:CN105144195A
公开(公告)日:2015-12-09
申请号:CN201480009496.7
申请日:2014-02-14
Applicant: 微软技术许可有限责任公司
IPC: G06K9/00
CPC classification number: G06F17/30247 , G06K9/00449
Abstract: 此处描述了用于生成结构化数据文件元组的系统和方法。在一个示例中,方法包括检测使用构造函数来描述结构化图像的结构的表达式。方法还可包括使用基于推断规则的搜索策略来标识所述结构化图像中与所述表达式相匹配的边界框分层布置。此外,方法可包括基于所标识的结构化图像中的边界框分层布置来生成第一结构化数据文件元组。
-
公开(公告)号:CN105051721A
公开(公告)日:2015-11-11
申请号:CN201480006645.4
申请日:2014-01-22
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/28 , G06F8/10 , G06F17/246
Abstract: 用于电子表格的将自然语言描述转换为因域而异的语言的程序的系统和方法。方法包括生成电子表格的模型。模型包括对每一列的列描述,以及与每一列相关联的一个或多个类型。该方法还包括通过删除禁用词以及将匹配列名称或数据值的部分替换为参数化的占位符来对描述进行标准化。该方法涉及以交错的、自下而上方式以及动态编程样式来应用基于规则的转换以及关键字或基于类型的程序合成,其中短语被按它们长度的递增顺序映射到子程序。规则描述了如何将特定部分自然语言短语映射到部分子程序。此外,该方法还包括生成若干个潜在的程序,并根据它们的预期的可能性来对这些程序进行排序。
-
公开(公告)号:CN105051721B
公开(公告)日:2018-03-30
申请号:CN201480006645.4
申请日:2014-01-22
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F17/28 , G06F8/10 , G06F17/246
Abstract: 用于电子表格的将自然语言描述转换为因域而异的语言的程序的系统和方法。方法包括生成电子表格的模型。模型包括对每一列的列描述,以及与每一列相关联的一个或多个类型。该方法还包括通过删除禁用词以及将匹配列名称或数据值的部分替换为参数化的占位符来对描述进行标准化。该方法涉及以交错的、自下而上方式以及动态编程样式来应用基于规则的转换以及关键字或基于类型的程序合成,其中短语被按它们长度的递增顺序映射到子程序。规则描述了如何将特定部分自然语言短语映射到部分子程序。此外,该方法还包括生成若干个潜在的程序,并根据它们的预期的可能性来对这些程序进行排序。
-
-