您当前位置:首页 > 热头条

据研究人员介绍它在训练模型前能几秒内帮助你静态分析潜在的张量形状错误

来源:IT之家   阅读量:15460   
时间: 2022-02-10 22:43

模型吭哧吭哧训练了半天,结果发现张量形状定义错了,这一定没少让你抓狂吧那么针对这种情况,是否存在较好的解决方法呢

据研究人员介绍它在训练模型前能几秒内帮助你静态分析潜在的张量形状错误

这不最近,韩国首尔大学的研究者就开发出了一款利器—— PyTea。

据研究人员介绍,它在训练模型前,能几秒内帮助你静态分析潜在的张量形状错误。

那么 PyTea 是如何做到的,到底靠不靠谱,让我们一探究竟吧。

PyTea 的出场方式

为什么张量形状错误这么重要。

神经网络涉及到一系列的矩阵计算,前面矩阵的列数必需匹配后面矩阵的行数,如果维度不匹配,那后面的运算就都无法运行了。

上图代码就是一个典型的张量形状错误, * 无法进行矩阵运算。

无论是 PyTorch,TensorFlow 还是 Keras 在进行神经网络的训练时,大多都遵循图上的流程。

首先定义一系列神经网络层,然后合成神经网络模块。

那么为什么需要 PyTea 呢。

以往我们都是在模型读取大量数据,开始训练,代码运行到错误张量处,才可以发现张量形状定义错误。

由于模型可能十分复杂,训练数据非常庞大,所以发现错误的时间成本会很高,有时候代码放在后台训练,出了问题都不知道。

PyTea 就可以有效帮我们避免这个问题,因为它能在运行模型代码之前,就帮我们分析出形状错误。

网友们已经在热烈讨论了。

PyTea 是如何运作的,它能否有效地检查出错误呢。

受各种约束条件的影响,代码可能的运行路径有很多,不同的数据会走向不同的路径。

所以 PyTea 需要静态扫描所有可能的运行路径,跟踪张量变化,推断出每个张量形状精确而保守的范围。

上图就是 PyTea 的整体架构,一共分为翻译语言,收集约束条件,求解器判断和给出反馈四步。

首先 PyTea 将原始的 Python 代码翻译成一种内核语言PyTea 内部表示法

接着 PyTea 追踪 PyTea IR 每个可能的执行路径,并收集有关张量形状的约束条件。

判断约束条件是否被满足,分为线上分析和离线分析两步:

  • 线上分析 node.js:查找张量形状数值上的不匹配和误用 API 函数的情况如果 PyTea 发现问题,就会停止在当前位置,然后给用户报错

  • 离线分析 Z3 / Python:如果线上分析没有问题,PyTea 将收集到的约束条件传给 SMT求解器 Z3,求解器负责查看每条路径的约束条件是否都能被满足,如果不能,返回给用户第一条出错路径的约束条件。

如果求解器过久没有反应,PyTea 会返回不知道是否存在问题。

可是追踪所有可能的路径是指数级别的任务,对于复杂的神经网络来说,一定会发生路径爆炸这个问题。

比如说在这个例子中,网络的最终结构是由 24 个相同模块块构成的,那么可能的路径就有 16M 之多。

所以路径爆炸是一定要处理的,PyTea 是怎么做的。

PyTea 选择保守的地对路径剪枝和超时判断来处理这种路径爆炸。

什么样的路径可以被剪枝。

PyTea 给出的答案是,如果该前馈函数不改变全局值,并且它的输出值不受分支条件影响,对于每条路径都是相等的,我们就可以忽略许多完全一致的路径,来节约计算资源。

如果路径剪枝还是不行,那么就只能按超时处理了。

原理就介绍这么多了,感觉还是值得一试的,现在代码已经在 GitHub 上面开源了,快去看看吧!

使用方法

依赖库:

安装方法:

运行命令:

参考链接:

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

金融聚焦

 当ToC行业受到相关政策以及环境的影响,开始逐渐降温时,资本将目标更多得投放到了ToB潜力公司成立不到一年时间,便已经获得两轮融资,创新型数据库基础软件提供商S

2022-02-10 22:43

 2月9日晚消息,佳明发布本能Instinct2系列智能户外运动手表,主打时尚高颜值,超长续航和专业健康数据监测其还有浪潮版,战术版等定制版本供运动爱好者选择,起

2022-02-10 22:43

 ,日前,科大讯飞董事长刘庆峰透露讯飞医疗预计2022年收入翻番根据消息显示,科大讯飞2021年全科医生助理在全国280区县部署并常态化应用,日均提供诊断建议77

2022-02-10 22:43

 老八股之一的飞乐音响证券虚假陈述纠纷案件一直引发部分投资者关注日前,飞乐音响发布《累计涉及诉讼的公告》,其中再度对公司所涉的证券虚假陈述责任纠纷相关进展作出披露

2022-02-10 22:43

 《上海证券报》10日刊发文章《系列先行指标释放暖意一季度经济走势有望超预期》文章称,制造业PMI继续扩张,物流业相关指数保持景气,春节期间多地用电量攀升虎年刚开

2022-02-10 22:43

 日前,花样年控股发布澄清公告,此前公告中买方佛山市弘辉房地产开发有限公司为一间于中国成立的有限公司,主要从事投资控股其由广州国资产业发展股权投资基金合伙企业实益

2022-02-10 22:43

 日前,百胜中国发布2021年第四季度及全年业绩报告。 2021年全年,百胜中国实现总收入98.5亿美元,同比增长19%其中,肯德基品牌年收入约70亿美元,

2022-02-10 22:43

 题:债市或站在新的十字路口 近期,债市多空分歧加大我们认为,债市或站在新的十字路口,利率债风险收益比下降,伴随三大利空逻辑渐现,纯债配置建议从久期策略转向

2022-02-10 22:43

 今日,山东三元生物科技股份有限公司在深交所创业板上市,截至收盘,每股报128.01元,涨幅17.12%,成交额28.23亿元,振幅25.62%,换手率68.44

2022-02-10 22:43

 北交所成立后,所选层新增线上订阅数量瞬间翻倍,创历史新高。 最近几天,北交所成立后,首批5家精选级公募公司披露了发行结果五家企业的中签率虽然与7,8月相比没有

2022-02-10 22:43

 北交所成立后,选定级别的新在线订阅数量迅速翻了一番,创下历史新高。 最近几天,北交所成立后,首批5家企业已完成精选层公开发行虽然胜率与7,8月相比没有明显

2022-02-10 22:43

 伴随着年底的临近,接下来各大手机厂商之间关于旗下新一代旗舰的竞争变得愈发激烈,接下来的一个月还将有一大波国产顶级旗舰将陆续搭载全新的骁龙8芯片,这其中除了常规的

2022-02-10 22:43

 饱受疫情冲击的全球半导体行业,或将雪上加霜,因为全球最大的半导体企业面临员工罢工压力。 由于拒绝工会提出的加薪等请求,三星集团旗下最大子公司,韩国股市第一大市

2022-02-10 22:43

 奥密克戎影响太大,美国被迫将隔离期缩短至5天 再不缩短隔离期,航空公司就没有人手可用了。 由于酒店和航空业受到奥密克戎冲击人手严重不足,美国不得不缩减隔

2022-02-10 22:43

 基于供需——库存框架对2021年债市进行复盘 首先重申我们分析框架中的相关概念:央行提供货币,对应资金的供给端,实体经济的信用扩张与收缩代表信用,对应资金

2022-02-10 22:43

 当地时间周二,格芯首席执行官TomCaulfield在一份声明中表示,公司签署了更多长期合作协议,有30家客户承诺出资合计32亿美元以帮助公司扩产,以支持强劲的

2022-02-10 22:43

 寒冬依旧,但位于北京西北部的塞上小城张家口依然活力满满。 日前,中国滑雪运动员谷爱凌夺得北京冬奥会自由式滑雪女子大跳台冠军,全网沸腾!谷爱凌36天获6枚金

2022-02-10 22:43

 根据消息显示,入选企业全部是经过福州市人社局审核通过的诚信用工承诺企业,涵盖了节后企业亟须招收的数十个工种,尽最大可能让外来务工者便捷地从图上寻找到适合自身的企

2022-02-10 22:43

 日前,中国最大的餐厅企业,肯德基和必胜客等品牌的母公司百胜中国发布《2021年第四季度及全年财务业绩公告》,2021年全年实现总收入98.5亿美元,同比增加19

2022-02-10 22:43

 ,据国外媒体报道,在VR,AR大火的背景下,也传出了苹果涉足这一领域的消息,多年前就已传出苹果在研发相关的设备,今年1月份,更有苹果产品方面的资深记者透露,苹果

2022-02-10 22:43

市场金融网
关注我们
foota footb footc footd foote footf