很有意思的工作，和我们的一个 idea 有点像 #1

nbcc · 2020-07-27T11:59:58Z

请教一个实验细节

新增参数在 Finetuning 训练中是完全随机初始化的吗？

lsvih · 2020-07-28T02:28:29Z

@nbcc 用 pytorch 的 nn.Linear 定义的参数，看源码使用 kaiming_uniform_ 做的参数初始化

另外感谢您的认可，期待你们的工作。。现在这个工作缺陷有点多，尤其是速度方面太慢了，整理代码后的实验现在都没跑完

nbcc · 2020-08-07T05:08:46Z

@nbcc 用 pytorch 的 nn.Linear 定义的参数，看源码使用 kaiming_uniform_ 做的参数初始化

另外感谢您的认可，期待你们的工作。。现在这个工作缺陷有点多，尤其是速度方面太慢了，整理代码后的实验现在都没跑完

用 paddle 复现了一下 MWA 策略（基于开源的 ERNIE，在 lcqmc 数据集验证）。和 ERNIE 1.0 论文评估方式一致，采用 max(dev acc) 选取 checkpoint，得到 test acc；多次取平均后，test acc 指标 0.874，结果和 ERNIE 1.0 论文基线接近。。。

renmada · 2021-01-05T06:02:33Z

@nbcc 用 pytorch 的 nn.Linear 定义的参数，看源码使用 kaiming_uniform_ 做的参数初始化

另外感谢您的认可，期待你们的工作。。现在这个工作缺陷有点多，尤其是速度方面太慢了，整理代码后的实验现在都没跑完

请问速度有多慢，对比bert base

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

很有意思的工作，和我们的一个 idea 有点像 #1

很有意思的工作，和我们的一个 idea 有点像 #1

nbcc commented Jul 27, 2020 •

edited

Loading

lsvih commented Jul 28, 2020

nbcc commented Aug 7, 2020 •

edited

Loading

renmada commented Jan 5, 2021

很有意思的工作，和我们的一个 idea 有点像 #1

很有意思的工作，和我们的一个 idea 有点像 #1

Comments

nbcc commented Jul 27, 2020 • edited Loading

lsvih commented Jul 28, 2020

nbcc commented Aug 7, 2020 • edited Loading

renmada commented Jan 5, 2021

nbcc commented Jul 27, 2020 •

edited

Loading

nbcc commented Aug 7, 2020 •

edited

Loading